Cassandra บทช่วยสอนสำหรับผู้เริ่มต้น: เรียนรู้ใน 3 วัน

ความหมายของ Apache Cassandra?

Cassandra เป็นระบบจัดการฐานข้อมูลแบบกระจายที่ออกแบบมาเพื่อจัดการข้อมูลที่มีโครงสร้างปริมาณมากทั่วทั้งเซิร์ฟเวอร์สินค้าโภคภัณฑ์

Cassandra จัดการข้อมูลจำนวนมหาศาลด้วยสถาปัตยกรรมแบบกระจาย ข้อมูลจะถูกวางไว้บนเครื่องต่างๆ ด้วยปัจจัยการจำลองมากกว่าหนึ่งปัจจัย ซึ่งทำให้มีความพร้อมใช้งานสูงและไม่มีจุดล้มเหลวเพียงจุดเดียว

ในภาพด้านล่างเป็นวงกลม Cassandra โหนดและเส้นระหว่างวงกลมแสดงสถาปัตยกรรมแบบกระจายในขณะที่ไคลเอนต์กำลังส่งข้อมูลไปยังโหนด

Cassandra บทช่วยสอนฐานข้อมูลสำหรับผู้เริ่มต้น: เรียนรู้ใน 3 วัน

Cassandra หลักสูตร

บริษัท

👍 Lessเมื่อ 1 การติดตั้ง Cassandra — วิธีดาวน์โหลดและติดตั้ง Cassandra on Windows
👍 Lessเมื่อ 2 Cassandra Archiกลยุทธ์เทคเจอร์และปัจจัยการจำลองแบบ - คู่มือฉบับสมบูรณ์
👍 Lessเมื่อ 3 Cassandra ตัวแบบข้อมูล — เรียนรู้ด้วยตัวอย่างง่ายๆ

สิ่งขั้นสูง

👍 Lessเมื่อ 1 Cassandra คีย์สเปซ — สร้าง แก้ไข และวางคีย์สเปซใน Cassandra พร้อมตัวอย่าง
👍 Lessเมื่อ 2 Cassandra ตาราง — สร้าง แก้ไข วาง และตัดทอน (พร้อมตัวอย่าง)
👍 Lessเมื่อ 3 Cassandra ภาษาคิวรี (CQL) — แทรก อัปเดต ลบ (ตัวอย่าง)
👍 Lessเมื่อ 4 สร้างและวาง INDEX ใน Cassandra — เรียนรู้ด้วยตัวอย่าง
👍 Lessเมื่อ 5 Cassandra ประเภทข้อมูล CQL และการหมดอายุของข้อมูลโดยใช้ TTL — เรียนรู้ด้วยตัวอย่าง
👍 Lessเมื่อ 6 Cassandra ชุด — ตั้งค่า รายการ แผนที่พร้อมตัวอย่าง
👍 Lessเมื่อ 7 Cassandra Cluster การติดตั้ง - Cluster ตั้งค่าบนหลายโหนด
👍 Lessเมื่อ 8 การติดตั้ง DataStax DevCenter และ OpsCenter — คำแนะนำทีละขั้นตอน
👍 Lessเมื่อ 9 Cassandra ความปลอดภัย — สร้างผู้ใช้และการรับรองความถูกต้องด้วย JMX

ต้องรู้!

👍 Lessเมื่อ 1 Cassandra คำถามสัมภาษณ์ — 23 อันดับแรก Cassandra สัมภาษณ์ถาม & ตอบ
👍 Lessเมื่อ 2 Cassandra บทช่วยสอน PDF — ดาวน์โหลด Cassandra บทช่วยสอน PDF สำหรับผู้เริ่มต้น

Cassandra ประวัติขององค์กร

  • Cassandra ได้รับการพัฒนาครั้งแรกที่ Facebook สำหรับการค้นหาในกล่องจดหมาย
  • Facebook เปิดแหล่งที่มาในเดือนกรกฎาคม พ.ศ. 2008
  • ยอมรับตู้ฟักไข่ Apache แล้ว Cassandra ในเดือนมีนาคม 2009
  • Cassandra เป็นโครงการระดับบนสุดของ อาปาเช่ ตั้งแต่เดือนกุมภาพันธ์ 2010
  • รุ่นล่าสุดของ Apache Cassandra คือ 3.2.1

ก่อนอื่นมาทำความเข้าใจก่อนว่าฐานข้อมูล NoSQL คืออะไร

โนสเคิ้ล Cassandra ฐานข้อมูล

ฐานข้อมูล NoSQL เรียกว่าฐานข้อมูล “Not Only SQL” หรือ “Non-relational” ฐานข้อมูล NoSQL จัดเก็บและดึงข้อมูลอื่นนอกเหนือจากความสัมพันธ์แบบตาราง เช่น ฐานข้อมูลเชิงสัมพันธ์

ฐานข้อมูล NoSQL ประกอบด้วย MongoDB, HBase และ Cassandra.

คุณสมบัติของฐานข้อมูล NoSQL มีดังต่อไปนี้

  • การออกแบบที่เรียบง่าย
  • มาตราส่วนแนวนอน
  • ความพร้อมใช้งานสูง

โครงสร้างข้อมูลที่ใช้ใน Cassandra มีการระบุมากกว่าโครงสร้างข้อมูลที่ใช้ในฐานข้อมูลเชิงสัมพันธ์ Cassandra โครงสร้างข้อมูลเร็วกว่าโครงสร้างฐานข้อมูลเชิงสัมพันธ์

ฐานข้อมูล NoSQL ถูกนำมาใช้มากขึ้นใน Big Data และเว็บแอปพลิเคชันแบบเรียลไทม์ ฐานข้อมูล NoSQL บางครั้งเรียกว่า Not Only SQL กล่าวคืออาจรองรับภาษาคิวรีที่คล้ายกับ SQL

โนสเคิ้ล Cassandra ฐานข้อมูลเทียบกับฐานข้อมูลเชิงสัมพันธ์

ต่อไปนี้เป็นข้อแตกต่างระหว่างฐานข้อมูลเชิงสัมพันธ์และฐานข้อมูล NoSQL ในรูปแบบตาราง

ฐานข้อมูลเชิงสัมพันธ์ ฐานข้อมูล NoSQL
จัดการข้อมูลที่มาด้วยความเร็วต่ำ จัดการข้อมูลที่มาด้วยความเร็วสูง
ข้อมูลมาจากสถานที่หนึ่งหรือไม่กี่แห่ง ข้อมูลมาจากหลายสถานที่
จัดการข้อมูลที่มีโครงสร้าง จัดการข้อมูลที่ไม่มีโครงสร้างและกึ่งโครงสร้างที่มีโครงสร้าง
รองรับธุรกรรมที่ซับซ้อน (ด้วยการเชื่อมโยง) รองรับการทำธุรกรรมง่ายๆ
จุดล้มเหลวเพียงจุดเดียวพร้อมการเฟลโอเวอร์ ไม่มีจุดล้มเหลวเดียว
จัดการข้อมูลในปริมาณปานกลาง จัดการข้อมูลในปริมาณที่สูงมาก
การใช้งานแบบรวมศูนย์ การปรับใช้แบบกระจายอำนาจ
ธุรกรรมที่เขียนไว้ในที่เดียว ธุรกรรมที่เขียนขึ้นในหลายสถานที่
ให้ความสามารถในการปรับขนาดการอ่าน ให้ความสามารถในการปรับขนาดทั้งการอ่านและการเขียน
การใช้งานแบบแนวตั้ง วางในแนวนอน

Apache Cassandra คุณสมบัติ

มีคุณสมบัติดังต่อไปนี้ Cassandra ให้

  • ปรับขนาดได้มาก Archiเทคเจอร์: Cassandra มีการออกแบบแบบไม่มีมาสเตอร์ โดยที่โหนดทั้งหมดอยู่ที่ระดับเดียวกัน ซึ่งทำให้ใช้งานได้ง่าย และปรับขนาดออกได้ง่าย
  • ไม่มีเจ้านาย Archiเทคเจอร์: ข้อมูลสามารถเขียนและอ่านบนโหนดใดก็ได้
  • ประสิทธิภาพสเกลเชิงเส้น: เมื่อมีการเพิ่มโหนดมากขึ้น ประสิทธิภาพของ Cassandra เพิ่มขึ้น
  • ไม่มีจุดล้มเหลวจุดเดียว: Cassandra จำลองข้อมูลบนโหนดต่างๆ เพื่อให้แน่ใจว่าไม่มีจุดล้มเหลวแม้แต่จุดเดียว
  • การตรวจจับข้อผิดพลาดและการกู้คืน: โหนดที่ล้มเหลวสามารถกู้คืนและกู้คืนได้อย่างง่ายดาย
  • โมเดลข้อมูลที่ยืดหยุ่นและไดนามิก: รองรับประเภทข้อมูลด้วยการเขียนและอ่านอย่างรวดเร็ว
  • การป้องกันข้อมูล: ข้อมูลได้รับการปกป้องด้วยการออกแบบบันทึกคอมมิตและสร้างความปลอดภัย เช่น กลไกการสำรองและกู้คืน
  • ความสอดคล้องของข้อมูลที่ปรับแต่งได้: รองรับความสอดคล้องของข้อมูลที่แข็งแกร่งทั่วทั้งสถาปัตยกรรมแบบกระจาย
  • การจำลองแบบหลายศูนย์ข้อมูล: Cassandra มีคุณสมบัติในการจำลองข้อมูลข้ามศูนย์ข้อมูลหลายแห่ง
  • การบีบอัดข้อมูล: Cassandra สามารถบีบอัดข้อมูลได้มากถึง 80% โดยไม่มีค่าใช้จ่ายใดๆ
  • Cassandra ภาษาของแบบสอบถาม: Cassandra ให้ภาษาคิวรีที่คล้ายกับภาษา SQL มันทำให้ง่ายมากสำหรับนักพัฒนาฐานข้อมูลเชิงสัมพันธ์ที่ย้ายจากฐานข้อมูลเชิงสัมพันธ์ไปยัง Cassandra.

Cassandra กรณีการใช้งาน/แอปพลิเคชัน

Cassandra เป็นฐานข้อมูลที่ไม่สัมพันธ์กันซึ่งสามารถนำไปใช้กับแอปพลิเคชันประเภทต่างๆ นี่คือกรณีการใช้งานบางส่วนที่ Cassandra ควรเป็นที่ต้องการ

  • ส่งข้อความCassandra เป็นฐานข้อมูลที่ดีเยี่ยมสำหรับบริษัทที่ให้บริการ โทรศัพท์มือถือ โทรศัพท์และบริการส่งข้อความ บริษัทเหล่านี้มีข้อมูลจำนวนมหาศาล ดังนั้น Cassandra ดีที่สุดสำหรับพวกเขา
  • แอปพลิเคชั่นอินเทอร์เน็ตของสิ่งต่าง ๆCassandra เป็นฐานข้อมูลที่ยอดเยี่ยมสำหรับแอปพลิเคชันที่ข้อมูลมาด้วยความเร็วสูงมากจากอุปกรณ์หรือเซ็นเซอร์ต่างๆ
  • แคตตาล็อกผลิตภัณฑ์และแอปค้าปลีกCassandra ผู้ค้าปลีกจำนวนมากใช้เพื่อป้องกันตะกร้าสินค้าที่ทนทานและการป้อนข้อมูลและส่งออกแคตตาล็อกผลิตภัณฑ์ที่รวดเร็ว
  • การวิเคราะห์โซเชียลมีเดียและเครื่องมือแนะนำCassandra เป็นฐานข้อมูลที่ยอดเยี่ยมสำหรับบริษัทออนไลน์และผู้ให้บริการโซเชียลมีเดียจำนวนมากสำหรับการวิเคราะห์และแนะนำลูกค้า