ข้อมูลขนาดใหญ่คืออะไร? บทนำ ประเภท ลักษณะ ตัวอย่าง

ก่อนที่เราจะเข้าสู่การแนะนำ Big Data คุณต้องรู้ก่อน

ข้อมูลคืออะไร?

ปริมาณ อักขระ หรือสัญลักษณ์ที่ใช้ในการดำเนินการโดยคอมพิวเตอร์ ซึ่งอาจจัดเก็บและส่งในรูปแบบสัญญาณไฟฟ้าและบันทึกลงในสื่อบันทึกข้อมูลแม่เหล็ก แสง หรือเชิงกล

ตอนนี้เรามาเรียนรู้คำจำกัดความของ Big Data กันดีกว่า

Big Data คืออะไร

ข้อมูลขนาดใหญ่ คือชุดข้อมูลที่มีปริมาณมหาศาล แต่เติบโตแบบทวีคูณตามเวลา เป็นข้อมูลที่มีขนาดใหญ่และซับซ้อนมากจนเครื่องมือจัดการข้อมูลแบบเดิมไม่สามารถจัดเก็บหรือประมวลผลได้อย่างมีประสิทธิภาพ บิ๊กดาต้าก็เป็นข้อมูลเช่นกันแต่มีขนาดใหญ่มาก

ข้อมูลขนาดใหญ่
Big Data คืออะไร

ตัวอย่างของข้อมูลขนาดใหญ่คืออะไร?

ต่อไปนี้เป็นตัวอย่าง Big Data บางส่วน

เทศกาล ตลาดหลักทรัพย์นิวยอร์ก เป็นตัวอย่างของ Big Data ที่สร้างเกี่ยวกับ หนึ่งเทราไบต์ ของข้อมูลการค้าใหม่ต่อวัน

ตัวอย่างข้อมูลขนาดใหญ่

สื่อสังคม

สถิติแสดงให้เห็นว่า 500+เทราไบต์ ของข้อมูลใหม่เข้าสู่ฐานข้อมูลของไซต์โซเชียลมีเดีย Facebook, ทุกวัน. ข้อมูลนี้ส่วนใหญ่สร้างขึ้นในแง่ของการอัพโหลดรูปภาพและวิดีโอ การแลกเปลี่ยนข้อความ การแสดงความคิดเห็น ฯลฯ

ตัวอย่างข้อมูลขนาดใหญ่

โสด เครื่องยนต์เจ็ท สามารถสร้างได้ 10+เทราไบต์ ของข้อมูลใน 30 นาที ของเวลาบิน ด้วยเที่ยวบินหลายพันเที่ยวบินต่อวัน การสร้างข้อมูลจึงเข้าถึงได้มากมาย เพตะไบต์

ตัวอย่างข้อมูลขนาดใหญ่

ประเภทของข้อมูลขนาดใหญ่

ต่อไปนี้คือประเภทของ Big Data:

  1. โครงสร้าง
  2. ไม่มีโครง
  3. กึ่งโครงสร้าง

โครงสร้าง

ข้อมูลใดๆ ที่สามารถจัดเก็บ เข้าถึง และประมวลผลในรูปแบบคงที่จะเรียกว่าข้อมูล 'ที่มีโครงสร้าง' เมื่อเวลาผ่านไป ผู้มีความสามารถด้านวิทยาการคอมพิวเตอร์ประสบความสำเร็จมากขึ้นในการพัฒนาเทคนิคสำหรับการทำงานกับข้อมูลประเภทนี้ (ซึ่งรูปแบบดังกล่าวเป็นที่รู้จักล่วงหน้า) และยังได้รับคุณค่าจากข้อมูลดังกล่าวด้วย อย่างไรก็ตาม ในปัจจุบันนี้ เรากำลังมองเห็นปัญหาเมื่อขนาดของข้อมูลดังกล่าวเติบโตขึ้นอย่างมาก โดยขนาดโดยทั่วไปจะพุ่งสูงถึงหลายเซตตาไบต์

คุณรู้หรือไม่? 1021 ไบต์ เท่ากับ 1 เซตตะไบต์ or หนึ่งพันล้านเทราไบต์ รูปแบบ เซตตะไบต์.

เมื่อดูตัวเลขเหล่านี้ เราจะเข้าใจได้ง่ายว่าทำไมจึงตั้งชื่อ Big Data และจินตนาการถึงความท้าทายที่เกี่ยวข้องกับการจัดเก็บและการประมวลผล

คุณรู้หรือไม่? ข้อมูลที่จัดเก็บไว้ในระบบการจัดการฐานข้อมูลเชิงสัมพันธ์เป็นตัวอย่างหนึ่งของก 'มีโครงสร้าง' ข้อมูล

ตัวอย่างของข้อมูลที่มีโครงสร้าง

ตาราง 'พนักงาน' ในฐานข้อมูลเป็นตัวอย่างหนึ่งของข้อมูลที่มีโครงสร้าง

รหัสพนักงาน ชื่อพนักงาน เพศ แผนก เงินเดือน_In_lacs
2365 ราเจช กุลการ์นี ชาย การเงิน 650000
3398 ประติภา โจชิ หญิง ผู้ดูแลระบบ 650000
7465 ชูชิล รอย ชาย ผู้ดูแลระบบ 500000
7500 ชูโภจิตดาส ชาย การเงิน 500000
7699 ปรียา เสน หญิง การเงิน 550000

ไม่มีโครง

ข้อมูลใดๆ ก็ตามที่มีรูปแบบหรือโครงสร้างที่ไม่ทราบแน่ชัดจะถูกจัดประเภทเป็นข้อมูลที่ไม่มีโครงสร้าง นอกจากจะมีขนาดใหญ่แล้ว ข้อมูลที่ไม่มีโครงสร้างยังมีความท้าทายหลายประการในแง่ของการประมวลผลเพื่อให้ได้คุณค่าจากข้อมูล ตัวอย่างทั่วไปของข้อมูลที่ไม่มีโครงสร้างคือแหล่งข้อมูลที่หลากหลายซึ่งประกอบด้วยไฟล์ข้อความธรรมดา รูปภาพ วิดีโอ เป็นต้น ปัจจุบัน องค์กรต่างๆ มีข้อมูลจำนวนมากที่พร้อมใช้งาน แต่โชคไม่ดีที่พวกเขาไม่รู้ว่าจะหาคุณค่าจากข้อมูลเหล่านี้ได้อย่างไร เนื่องจากข้อมูลเหล่านี้อยู่ในรูปแบบดิบหรือรูปแบบที่ไม่มีโครงสร้าง

ตัวอย่างของข้อมูลที่ไม่มีโครงสร้าง

ผลลัพธ์ที่ส่งคืนโดย 'Google Search'

ตัวอย่างข้อมูลที่ไม่มีโครงสร้าง
ตัวอย่างข้อมูลที่ไม่มีโครงสร้าง

กึ่งโครงสร้าง

ข้อมูลกึ่งโครงสร้างสามารถมีข้อมูลได้ทั้งสองรูปแบบ เราสามารถเห็นข้อมูลกึ่งโครงสร้างเป็นโครงสร้างในรูปแบบ แต่จริงๆ แล้วไม่ได้ถูกกำหนดไว้ด้วย เช่น คำจำกัดความของตารางเชิงสัมพันธ์ DBMS- ตัวอย่างของข้อมูลกึ่งโครงสร้างคือข้อมูลที่แสดงในไฟล์ XML

ตัวอย่างของข้อมูลกึ่งโครงสร้าง

ข้อมูลส่วนบุคคลที่จัดเก็บไว้ในไฟล์ XML-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

การเติบโตของข้อมูลในช่วงหลายปีที่ผ่านมา

การเติบโตของข้อมูลในช่วงหลายปีที่ผ่านมา
การเติบโตของข้อมูลในช่วงหลายปีที่ผ่านมา

โปรดทราบว่า โปรแกรมประยุกต์บนเว็บ ข้อมูลที่ไม่มีโครงสร้างประกอบด้วยไฟล์บันทึก ไฟล์ประวัติการทำธุรกรรม ฯลฯ ระบบ OLTP ถูกสร้างขึ้นเพื่อทำงานกับข้อมูลที่มีโครงสร้างซึ่งข้อมูลถูกเก็บไว้ในความสัมพันธ์ (ตาราง)

ลักษณะของข้อมูลขนาดใหญ่

ข้อมูลขนาดใหญ่สามารถอธิบายได้ด้วยลักษณะดังต่อไปนี้:

  • ปริมาณ
  • ความหลากหลาย
  • ความเร็ว
  • ความแปรปรวน

(i) ปริมาณ – ชื่อ Big Data นั้นเกี่ยวข้องกับขนาดที่ใหญ่โตมาก ขนาดของข้อมูลมีบทบาทสำคัญในการกำหนดมูลค่าของข้อมูล นอกจากนี้ ไม่ว่าข้อมูลใดจะถือเป็น Big Data ได้จริงหรือไม่นั้น ขึ้นอยู่กับปริมาณข้อมูล เพราะฉะนั้น, 'ปริมาณ' เป็นคุณลักษณะหนึ่งที่ต้องพิจารณาในขณะที่จัดการกับโซลูชัน Big Data

(ii) ความหลากหลาย – แง่มุมต่อไปของ Big Data ก็คือ ความหลากหลาย.

ความหลากหลายหมายถึงแหล่งที่มาที่แตกต่างกันและลักษณะของข้อมูลทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง ในยุคก่อน สเปรดชีตและฐานข้อมูลเป็นแหล่งข้อมูลเพียงแหล่งเดียวที่แอปพลิเคชันส่วนใหญ่พิจารณา ปัจจุบัน ข้อมูลในรูปแบบอีเมล ภาพถ่าย วิดีโอ อุปกรณ์ตรวจสอบ PDF เสียง ฯลฯ ก็ได้รับการพิจารณาในแอปพลิเคชันการวิเคราะห์เช่นกัน ข้อมูลที่ไม่มีโครงสร้างที่หลากหลายนี้ก่อให้เกิดปัญหาบางประการในการจัดเก็บ การขุด และการวิเคราะห์ข้อมูล

(iii) ความเร็ว – ระยะ 'ความเร็ว' หมายถึงความเร็วของการสร้างข้อมูล ความรวดเร็วในการสร้างและประมวลผลข้อมูลเพื่อตอบสนองความต้องการ เป็นตัวกำหนดศักยภาพที่แท้จริงของข้อมูล

Big Data Velocity เกี่ยวข้องกับความเร็วที่ข้อมูลไหลเข้ามาจากแหล่งที่มาต่างๆ เช่น กระบวนการทางธุรกิจ บันทึกแอปพลิเคชัน เครือข่าย และไซต์โซเชียลมีเดีย เซ็นเซอร์ โทรศัพท์มือถือ อุปกรณ์ต่างๆ ฯลฯ การไหลของข้อมูลมีขนาดใหญ่และต่อเนื่อง

(iv) ความแปรปรวน – นี่หมายถึงความไม่สอดคล้องกันซึ่งสามารถแสดงได้ด้วยข้อมูลในบางครั้ง ซึ่งเป็นอุปสรรคต่อกระบวนการในการจัดการและจัดการข้อมูลอย่างมีประสิทธิภาพ

ข้อดีของการประมวลผลข้อมูลขนาดใหญ่

ความสามารถในการประมวลผล Big Data ใน DBMS นำมาซึ่งประโยชน์หลายประการ เช่น-

  • ธุรกิจสามารถใช้ข้อมูลภายนอกในการตัดสินใจได้

เข้าถึงข้อมูลโซเชียลได้จาก เครื่องมือค้นหา และไซต์ต่างๆ เช่น Facebook, Twitter ช่วยให้องค์กรต่างๆ ปรับแต่งกลยุทธ์ทางธุรกิจของตนได้

  • ปรับปรุงการบริการลูกค้า

ระบบคำติชมของลูกค้าแบบเดิมกำลังถูกแทนที่ด้วยระบบใหม่ที่ออกแบบด้วยเทคโนโลยี Big Data ในระบบใหม่เหล่านี้ มีการใช้บิ๊กดาต้าและเทคโนโลยีการประมวลผลภาษาธรรมชาติเพื่ออ่านและประเมินการตอบสนองของผู้บริโภค

  • การระบุความเสี่ยงต่อผลิตภัณฑ์/บริการตั้งแต่เนิ่นๆ ถ้ามี
  • ประสิทธิภาพการทำงานที่ดีขึ้น

เทคโนโลยี Big Data สามารถใช้สร้างพื้นที่จัดเตรียมหรือแลนดิ้งโซนสำหรับข้อมูลใหม่ ก่อนที่จะระบุได้ว่าข้อมูลใดควรย้ายไปยัง คลังข้อมูล- นอกจากนี้ การบูรณาการเทคโนโลยี Big Data และคลังข้อมูลดังกล่าวยังช่วยให้องค์กรสามารถถ่ายโอนข้อมูลที่เข้าถึงไม่บ่อยได้

สรุป

  • คำจำกัดความของ Big Data: Big Data หมายถึงข้อมูลที่มีขนาดใหญ่มาก Bigdata เป็นคำที่ใช้เรียกชุดข้อมูลที่มีขนาดใหญ่มากแต่กลับเติบโตแบบทวีคูณตามเวลา
  • ตัวอย่างการวิเคราะห์ Big Data ได้แก่ ตลาดหลักทรัพย์ เว็บไซต์โซเชียลมีเดีย เครื่องยนต์ไอพ่น ฯลฯ
  • Big Data อาจเป็น 1) มีโครงสร้าง 2) ไม่มีโครงสร้าง 3) มีโครงสร้างกึ่ง
  • ปริมาณ ความหลากหลาย ความเร็ว และความแปรปรวนเป็นเพียงคุณลักษณะบางประการของ Big Data
  • การบริการลูกค้าที่ดีขึ้น ประสิทธิภาพการทำงานที่ดีขึ้น การตัดสินใจที่ดีขึ้น เป็นข้อดีบางประการของ Bigdata