Cassandra Tutorial for begyndere: Lær på 3 dage

Hvad er Apache Cassandra?

Cassandra er et distribueret databasestyringssystem designet til at håndtere en stor mængde strukturerede data på tværs af råvareservere.

Cassandra håndterer den enorme mængde data med dens distribuerede architecture. Data placeres på forskellige maskiner med mere end én replikeringsfaktor, der giver høj tilgængelighed og intet enkelt fejlpunkt.

På billedet nedenfor er cirkler Cassandra noder og linjer mellem cirklerne viser fordelt architecture, mens klienten sender data til noden.

Cassandra Databasevejledning for begyndere: Lær på 3 dage

Cassandra pensum

Introduktion

👍 Lektion 1 Installer Cassandra - Sådan downloades og installeres Cassandra on Windows
👍 Lektion 2 Cassandra Architecture & replikeringsfaktorstrategi — En omfattende Vejledning
👍 Lektion 3 Cassandra Datamodel — Lær med simple eksempel

Avancerede ting

👍 Lektion 1 Cassandra Tasterum — Opret, skift og slip nøglerum ind Cassandra med Eksempel
👍 Lektion 2 Cassandra Bordlampe - Opret, rediger, slip og afkort (med eksempel)
👍 Lektion 3 Cassandra Forespørgselssprog (CQL) - Indsæt i, opdater, slet (eksempel)
👍 Lektion 4 Opret og slip INDEX ind Cassandra — Lær med eksempel
👍 Lektion 5 Cassandra CQL-datatyper og dataudløb ved hjælp af TTL — Lær med eksempel
👍 Lektion 6 Cassandra Samling — Sæt, Liste, Kort med Eksempel
👍 Lektion 7 Cassandra Cluster Opsætning — Cluster Opsætning på flere noder
👍 Lektion 8 DataStax DevCenter & OpsCenter Installation — En trin-for-trin guide
👍 Lektion 9 Cassandra Sikkerhed — Opret bruger og godkendelse med JMX

Skal vide!

👍 Lektion 1 Cassandra Interview Spørgsmål - Top 23 Cassandra Interview Q & A
👍 Lektion 2 Cassandra Tutorial pdf - Hent Cassandra Tutorial pdf for begyndere

Cassandra Historie

  • Cassandra blev først udviklet på Facebook for ibox søge.
  • Facebook åbnede det i juli 2008.
  • Apache incubator accepteret Cassandra i marts 2009.
  • Cassandra er et projekt på topniveau Apache siden februar 2010.
  • Den seneste version af Apache Cassandra er 3.2.1.

Lad os først forstå, hvad NoSQL-database er.

Nosql Cassandra Database

NoSQL-databaser kaldes "Ikke kun SQL" eller "Ikke-relationelle" databaser. NoSQL-databaser gemmer og henter andre data end tabelrelationer, såsom relationsdatabaser.

NoSQL-databaser inkluderer MongoDB, HBase og Cassandra.

Der er following egenskaber for NoSQL-databaser.

  • Design enkelhed
  • Vandret skalering
  • High Availability

Datastrukturer brugt i Cassandra er mere specificerede end datastrukturer, der bruges i relationelle databaser. Cassandra datastrukturer er hurtigere end relationelle databasestrukturer.

NoSQL-databaser bruges i stigende grad i Big Data og real-time webapplikationer. NoSQL-databaser kaldes nogle gange ikke kun SQL dvs. de kan understøtte SQL-lignende forespørgselssprog.

Nosql Cassandra Database vs relationelle databaser

Her er forskellene mellem relationsdatabaser og NoSQL-databaser i et tabelformat.

Relationsdatabase NoSQL-database
Håndterer data, der kommer med lav hastighed Håndterer data, der kommer med høj hastighed
Data kommer fra et eller få steder Data kommer fra mange steder
Håndterer strukturerede data Håndterer strukturerede ustrukturerede og semistrukturerede data.
Understøtter complex transaktioner (med joinforbindelser) Understøtter enkle transaktioner
enkelt fejlpunkt med failover Intet enkelt punkt på fiasko
Håndterer data i moderat volumen. Håndterer data i meget høj volumen
Centraliserede udrulninger Decentrale udrulninger
Transaktioner skrevet på ét sted Transaktion skrevet mange steder
Giver læseskalerbarhed Giver både læse- og skriveskalerbarhed
Deployed på lodret måde Deployed på vandret vis

Apache Cassandra Funktionalitet

Der er following funktioner der Cassandra giver.

  • Massivt skalerbar Archilære: Cassandra har et mesterløst design, hvor alle noder er på samme niveau, hvilket giver operational enkelhed og let udskalering.
  • Masterless Archilære: Data kan skrives og læses på enhver node.
  • Lineær skala ydeevne: Efterhånden som flere noder tilføjes, vil ydeevnen af Cassandra stiger.
  • Intet enkelt fejlpunkt: Cassandra replikerer data på forskellige noder, der sikrer, at der ikke er et enkelt fejlpunkt.
  • Fejlsøgning og retablering: Mislykkede noder kan nemt gendannes og gendannes.
  • Fleksibel og dynamisk datamodel: Understøtter datatyper med hurtig skrivning og læsning.
  • Data beskyttelse: Data er beskyttet med commit log design og indbygget sikkerhed som backup og gendannelsesmekanismer.
  • Justerbar datakonsistens: Support til strong datakonsistens på tværs af distribueret architecture.
  • Multi Data Center Replikering: Cassandra giver funktion til at replikere data på tværs af flere datacentre.
  • Datakomprimering: Cassandra kan komprimere op til 80 % data uden overhead.
  • Cassandra Forespørgselssprog: Cassandra leverer forespørgselssprog, der ligner SQL-sprog. Det gør det meget nemt for udviklere af relationsdatabaser at flytte fra relationsdatabase til Cassandra.

Cassandra Use Cases/Ansøgning

Cassandra er en ikke-relationel database, der kan bruges til forskellige typer applikationer. Her er nogle use cases hvor Cassandra bør foretrækkes.

  • BeskederCassandra er en fantastisk database for de virksomheder, der leverer Mobil telefoner og beskedtjenester. Disse virksomheder har en enorm mængde data, så Cassandra er bedst for dem.
  • Internet of things-applikationCassandra er en fantastisk database til applikationer, hvor data kommer med meget høj hastighed fra forskellige enheder eller sensorer.
  • Produktkataloger og detailappsCassandra bruges af mange forhandlere til holdbar indkøbskurvbeskyttelse og hurtig input og output af produktkataloger.
  • Social Media Analytics og anbefalingsmotorCassandra er en fantastisk database for mange online virksomheder og udbydere af sociale medier til analyse og anbefaling til deres kunder.