Cassandra Tutorial for begyndere: Lær på 3 dage
Hvad er Apache Cassandra?
Cassandra er et distribueret databasestyringssystem designet til at håndtere en stor mængde strukturerede data på tværs af råvareservere.
Cassandra håndterer den enorme mængde data med sin distribuerede arkitektur. Data placeres på forskellige maskiner med mere end én replikeringsfaktor, der giver høj tilgængelighed og intet enkelt fejlpunkt.
På billedet nedenfor er cirkler Cassandra noder og linjer mellem cirklerne viser distribueret arkitektur, mens klienten sender data til noden.
Cassandra pensum
Introduktion
👍 Lesspå 1 | Installer Cassandra - Sådan downloades og installeres Cassandra on Windows |
👍 Lesspå 2 | Cassandra Architecture & replikeringsfaktorstrategi — En omfattende Vejledning |
👍 Lesspå 3 | Cassandra Datamodel — Lær med simple eksempel |
Avancerede ting
👍 Lesspå 1 | Cassandra Tasterum — Opret, skift og slip nøglerum ind Cassandra med Eksempel |
👍 Lesspå 2 | Cassandra Bordlampe - Opret, rediger, slip og afkort (med eksempel) |
👍 Lesspå 3 | Cassandra Forespørgselssprog (CQL) - Indsæt i, opdater, slet (eksempel) |
👍 Lesspå 4 | Opret og slip INDEX ind Cassandra — Lær med eksempel |
👍 Lesspå 5 | Cassandra CQL-datatyper og dataudløb ved hjælp af TTL — Lær med eksempel |
👍 Lesspå 6 | Cassandra Kollektion — Sæt, Liste, Kort med Eksempel |
👍 Lesspå 7 | Cassandra Cluster Opsætning — Cluster Opsætning på flere noder |
👍 Lesspå 8 | DataStax DevCenter & OpsCenter Installation — En trin-for-trin guide |
👍 Lesspå 9 | Cassandra Sikkerhed — Opret bruger og godkendelse med JMX |
Skal vide!
👍 Lesspå 1 | Cassandra Spørgsmål til interview - Top 23 Cassandra Interview Q & A |
👍 Lesspå 2 | Cassandra Tutorial pdf - Hent Cassandra Tutorial pdf for begyndere |
Cassandra Historie
- Cassandra blev først udviklet på Facebook til indbakkesøgning.
- Facebook åbnede det i juli 2008.
- Apache inkubator accepteret Cassandra i marts 2009.
- Cassandra er et projekt på topniveau Apache siden februar 2010.
- Den seneste version af Apache Cassandra er 3.2.1.
Lad os først forstå, hvad NoSQL-database er.
Nosql Cassandra Database
NoSQL-databaser kaldes "Ikke kun SQL" eller "Ikke-relationelle" databaser. NoSQL-databaser gemmer og henter andre data end tabelrelationer, såsom relationsdatabaser.
NoSQL-databaser inkluderer MongoDB, HBase og Cassandra.
Der er følgende egenskaber for NoSQL-databaser.
- Design enkelhed
- Vandret skalering
- High Availability
Datastrukturer brugt i Cassandra er mere specificerede end datastrukturer, der bruges i relationelle databaser. Cassandra datastrukturer er hurtigere end relationelle databasestrukturer.
NoSQL-databaser bruges i stigende grad i Big Data og real-time webapplikationer. NoSQL-databaser kaldes nogle gange ikke kun SQL dvs. de kan understøtte SQL-lignende forespørgselssprog.
Nosql Cassandra Database vs relationelle databaser
Her er forskellene mellem relationsdatabaser og NoSQL-databaser i et tabelformat.
Relationsdatabase | NoSQL-database |
---|---|
Håndterer data, der kommer med lav hastighed | Håndterer data, der kommer med høj hastighed |
Data kommer fra et eller få steder | Data kommer fra mange steder |
Håndterer strukturerede data | Håndterer strukturerede ustrukturerede og semistrukturerede data. |
Understøtter komplekse transaktioner (med joinforbindelser) | Understøtter enkle transaktioner |
enkelt fejlpunkt med failover | Intet enkelt punkt på fiasko |
Håndterer data i moderat volumen. | Håndterer data i meget høj volumen |
Centraliserede udrulninger | Decentrale udrulninger |
Transaktioner skrevet på ét sted | Transaktion skrevet mange steder |
Giver læseskalerbarhed | Giver både læse- og skriveskalerbarhed |
Indsat lodret | Indsat på vandret måde |
Apache Cassandra Funktionalitet
Der er følgende funktioner, der Cassandra giver.
- Massivt skalerbar Archilære: Cassandra har et mesterløst design, hvor alle noder er på samme niveau, hvilket giver enkel betjening og let skalering.
- Masterless Archilære: Data kan skrives og læses på enhver node.
- Lineær skala ydeevne: Efterhånden som flere noder tilføjes, vil ydeevnen af Cassandra stiger.
- Intet enkelt fejlpunkt: Cassandra replikerer data på forskellige noder, der sikrer, at der ikke er et enkelt fejlpunkt.
- Fejlsøgning og retablering: Mislykkede noder kan nemt gendannes og gendannes.
- Fleksibel og dynamisk datamodel: Understøtter datatyper med hurtig skrivning og læsning.
- Data beskyttelse: Data er beskyttet med commit log design og indbygget sikkerhed som backup og gendannelsesmekanismer.
- Justerbar datakonsistens: Understøttelse af stærk datakonsistens på tværs af distribueret arkitektur.
- Multi Data Center Replikering: Cassandra giver funktion til at replikere data på tværs af flere datacentre.
- Datakomprimering: Cassandra kan komprimere op til 80 % data uden overhead.
- Cassandra Forespørgselssprog: Cassandra leverer forespørgselssprog, der ligner SQL-sprog. Det gør det meget nemt for udviklere af relationsdatabaser at flytte fra relationsdatabase til Cassandra.
Cassandra Use Cases/Ansøgning
Cassandra er en ikke-relationel database, der kan bruges til forskellige typer applikationer. Her er nogle use cases hvor Cassandra bør foretrækkes.
- BeskederCassandra er en fantastisk database for de virksomheder, der leverer Mobil telefoner og beskedtjenester. Disse virksomheder har en enorm mængde data, så Cassandra er bedst for dem.
- Internet of things-applikationCassandra er en fantastisk database til applikationer, hvor data kommer med meget høj hastighed fra forskellige enheder eller sensorer.
- Produktkataloger og detailappsCassandra bruges af mange forhandlere til holdbar indkøbskurvbeskyttelse og hurtig input og output af produktkataloger.
- Social Media Analytics og anbefalingsmotorCassandra er en fantastisk database for mange online virksomheder og udbydere af sociale medier til analyse og anbefaling til deres kunder.