ข้อมูลขนาดใหญ่คืออะไร? บทนำ ประเภท ลักษณะ ตัวอย่าง
ข้อมูลคืออะไร?
ปริมาณ อักขระ หรือสัญลักษณ์ที่ใช้ในการดำเนินการโดยคอมพิวเตอร์ ซึ่งอาจจัดเก็บและส่งในรูปแบบสัญญาณไฟฟ้าและบันทึกลงในสื่อบันทึกข้อมูลแม่เหล็ก แสง หรือเชิงกล
ตอนนี้เรามาเรียนรู้คำจำกัดความของ Big Data กันดีกว่า
Big Data คืออะไร
ข้อมูลขนาดใหญ่ คือชุดข้อมูลที่มีปริมาณมหาศาล แต่เติบโตแบบทวีคูณตามเวลา เป็นข้อมูลที่มีขนาดใหญ่และซับซ้อนมากจนเครื่องมือจัดการข้อมูลแบบเดิมไม่สามารถจัดเก็บหรือประมวลผลได้อย่างมีประสิทธิภาพ บิ๊กดาต้าก็เป็นข้อมูลเช่นกันแต่มีขนาดใหญ่มาก

ตัวอย่างของข้อมูลขนาดใหญ่คืออะไร?
ต่อไปนี้เป็นตัวอย่าง Big Data บางส่วน
เทศกาล ตลาดหลักทรัพย์นิวยอร์ก เป็นตัวอย่างของ Big Data ที่สร้างเกี่ยวกับ หนึ่งเทราไบต์ ของข้อมูลการค้าใหม่ต่อวัน
สื่อสังคม
สถิติแสดงให้เห็นว่า 500+เทราไบต์ ของข้อมูลใหม่เข้าสู่ฐานข้อมูลของไซต์โซเชียลมีเดีย Facebook, ทุกวัน. ข้อมูลนี้ส่วนใหญ่สร้างขึ้นในแง่ของการอัพโหลดรูปภาพและวิดีโอ การแลกเปลี่ยนข้อความ การแสดงความคิดเห็น ฯลฯ
โสด เครื่องยนต์เจ็ท สามารถสร้างได้ 10+เทราไบต์ ของข้อมูลใน 30 นาที ของเวลาบิน ด้วยเที่ยวบินหลายพันเที่ยวบินต่อวัน การสร้างข้อมูลจึงเข้าถึงได้มากมาย เพตะไบต์
ประเภทของข้อมูลขนาดใหญ่
ต่อไปนี้คือประเภทของ Big Data:
- โครงสร้าง
- ไม่มีโครง
- กึ่งโครงสร้าง
โครงสร้าง
ข้อมูลใดๆ ที่สามารถจัดเก็บ เข้าถึง และประมวลผลในรูปแบบคงที่จะเรียกว่าข้อมูล 'ที่มีโครงสร้าง' เมื่อเวลาผ่านไป ผู้มีความสามารถด้านวิทยาการคอมพิวเตอร์ประสบความสำเร็จมากขึ้นในการพัฒนาเทคนิคสำหรับการทำงานกับข้อมูลประเภทนี้ (ซึ่งรูปแบบดังกล่าวเป็นที่รู้จักล่วงหน้า) และยังได้รับคุณค่าจากข้อมูลดังกล่าวด้วย อย่างไรก็ตาม ในปัจจุบันนี้ เรากำลังมองเห็นปัญหาเมื่อขนาดของข้อมูลดังกล่าวเติบโตขึ้นอย่างมาก โดยขนาดโดยทั่วไปจะพุ่งสูงถึงหลายเซตตาไบต์
คุณรู้หรือไม่? 1021 ไบต์ เท่ากับ 1 เซตตะไบต์ or หนึ่งพันล้านเทราไบต์ รูปแบบ เซตตะไบต์.
เมื่อดูตัวเลขเหล่านี้ เราจะเข้าใจได้ง่ายว่าทำไมจึงตั้งชื่อ Big Data และจินตนาการถึงความท้าทายที่เกี่ยวข้องกับการจัดเก็บและการประมวลผล
คุณรู้หรือไม่? ข้อมูลที่จัดเก็บไว้ในระบบการจัดการฐานข้อมูลเชิงสัมพันธ์เป็นตัวอย่างหนึ่งของก 'มีโครงสร้าง' ข้อมูล
ตัวอย่างของข้อมูลที่มีโครงสร้าง
ตาราง 'พนักงาน' ในฐานข้อมูลเป็นตัวอย่างหนึ่งของข้อมูลที่มีโครงสร้าง
รหัสพนักงาน | ชื่อพนักงาน | เพศ | แผนก | เงินเดือน_In_lacs |
---|---|---|---|---|
2365 | ราเจช กุลการ์นี | ชาย | การเงิน | 650000 |
3398 | ประติภา โจชิ | หญิง | ผู้ดูแลระบบ | 650000 |
7465 | ชูชิล รอย | ชาย | ผู้ดูแลระบบ | 500000 |
7500 | ชูโภจิตดาส | ชาย | การเงิน | 500000 |
7699 | ปรียา เสน | หญิง | การเงิน | 550000 |
ไม่มีโครง
ข้อมูลใดๆ ก็ตามที่มีรูปแบบหรือโครงสร้างที่ไม่ทราบแน่ชัดจะถูกจัดประเภทเป็นข้อมูลที่ไม่มีโครงสร้าง นอกจากจะมีขนาดใหญ่แล้ว ข้อมูลที่ไม่มีโครงสร้างยังมีความท้าทายหลายประการในแง่ของการประมวลผลเพื่อให้ได้คุณค่าจากข้อมูล ตัวอย่างทั่วไปของข้อมูลที่ไม่มีโครงสร้างคือแหล่งข้อมูลที่หลากหลายซึ่งประกอบด้วยไฟล์ข้อความธรรมดา รูปภาพ วิดีโอ เป็นต้น ปัจจุบัน องค์กรต่างๆ มีข้อมูลจำนวนมากที่พร้อมใช้งาน แต่โชคไม่ดีที่พวกเขาไม่รู้ว่าจะหาคุณค่าจากข้อมูลเหล่านี้ได้อย่างไร เนื่องจากข้อมูลเหล่านี้อยู่ในรูปแบบดิบหรือรูปแบบที่ไม่มีโครงสร้าง
ตัวอย่างของข้อมูลที่ไม่มีโครงสร้าง
ผลลัพธ์ที่ส่งคืนโดย 'Google Search'
กึ่งโครงสร้าง
ข้อมูลกึ่งโครงสร้างสามารถมีข้อมูลได้ทั้งสองรูปแบบ เราสามารถเห็นข้อมูลกึ่งโครงสร้างเป็นโครงสร้างในรูปแบบ แต่จริงๆ แล้วไม่ได้ถูกกำหนดไว้ด้วย เช่น คำจำกัดความของตารางเชิงสัมพันธ์ DBMS- ตัวอย่างของข้อมูลกึ่งโครงสร้างคือข้อมูลที่แสดงในไฟล์ XML
ตัวอย่างของข้อมูลกึ่งโครงสร้าง
ข้อมูลส่วนบุคคลที่จัดเก็บไว้ในไฟล์ XML-
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
การเติบโตของข้อมูลในช่วงหลายปีที่ผ่านมา
โปรดทราบว่า โปรแกรมประยุกต์บนเว็บ ข้อมูลที่ไม่มีโครงสร้างประกอบด้วยไฟล์บันทึก ไฟล์ประวัติการทำธุรกรรม ฯลฯ ระบบ OLTP ถูกสร้างขึ้นเพื่อทำงานกับข้อมูลที่มีโครงสร้างซึ่งข้อมูลถูกเก็บไว้ในความสัมพันธ์ (ตาราง)
ลักษณะของข้อมูลขนาดใหญ่
ข้อมูลขนาดใหญ่สามารถอธิบายได้ด้วยลักษณะดังต่อไปนี้:
- ปริมาณ
- ความหลากหลาย
- ความเร็ว
- ความแปรปรวน
(i) ปริมาณ – ชื่อ Big Data นั้นเกี่ยวข้องกับขนาดที่ใหญ่โตมาก ขนาดของข้อมูลมีบทบาทสำคัญในการกำหนดมูลค่าของข้อมูล นอกจากนี้ ไม่ว่าข้อมูลใดจะถือเป็น Big Data ได้จริงหรือไม่นั้น ขึ้นอยู่กับปริมาณข้อมูล เพราะฉะนั้น, 'ปริมาณ' เป็นคุณลักษณะหนึ่งที่ต้องพิจารณาในขณะที่จัดการกับโซลูชัน Big Data
(ii) ความหลากหลาย – แง่มุมต่อไปของ Big Data ก็คือ ความหลากหลาย.
ความหลากหลายหมายถึงแหล่งที่มาที่แตกต่างกันและลักษณะของข้อมูลทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง ในยุคก่อน สเปรดชีตและฐานข้อมูลเป็นแหล่งข้อมูลเพียงแหล่งเดียวที่แอปพลิเคชันส่วนใหญ่พิจารณา ปัจจุบัน ข้อมูลในรูปแบบอีเมล ภาพถ่าย วิดีโอ อุปกรณ์ตรวจสอบ PDF เสียง ฯลฯ ก็ได้รับการพิจารณาในแอปพลิเคชันการวิเคราะห์เช่นกัน ข้อมูลที่ไม่มีโครงสร้างที่หลากหลายนี้ก่อให้เกิดปัญหาบางประการในการจัดเก็บ การขุด และการวิเคราะห์ข้อมูล
(iii) ความเร็ว – ระยะ 'ความเร็ว' หมายถึงความเร็วของการสร้างข้อมูล ความรวดเร็วในการสร้างและประมวลผลข้อมูลเพื่อตอบสนองความต้องการ เป็นตัวกำหนดศักยภาพที่แท้จริงของข้อมูล
Big Data Velocity เกี่ยวข้องกับความเร็วที่ข้อมูลไหลเข้ามาจากแหล่งที่มาต่างๆ เช่น กระบวนการทางธุรกิจ บันทึกแอปพลิเคชัน เครือข่าย และไซต์โซเชียลมีเดีย เซ็นเซอร์ โทรศัพท์มือถือ อุปกรณ์ต่างๆ ฯลฯ การไหลของข้อมูลมีขนาดใหญ่และต่อเนื่อง
(iv) ความแปรปรวน – นี่หมายถึงความไม่สอดคล้องกันซึ่งสามารถแสดงได้ด้วยข้อมูลในบางครั้ง ซึ่งเป็นอุปสรรคต่อกระบวนการในการจัดการและจัดการข้อมูลอย่างมีประสิทธิภาพ
ข้อดีของการประมวลผลข้อมูลขนาดใหญ่
ความสามารถในการประมวลผล Big Data ใน DBMS นำมาซึ่งประโยชน์หลายประการ เช่น-
- ธุรกิจสามารถใช้ข้อมูลภายนอกในการตัดสินใจได้
เข้าถึงข้อมูลโซเชียลได้จาก เครื่องมือค้นหา และไซต์ต่างๆ เช่น Facebook, Twitter ช่วยให้องค์กรต่างๆ ปรับแต่งกลยุทธ์ทางธุรกิจของตนได้
- ปรับปรุงการบริการลูกค้า
ระบบคำติชมของลูกค้าแบบเดิมกำลังถูกแทนที่ด้วยระบบใหม่ที่ออกแบบด้วยเทคโนโลยี Big Data ในระบบใหม่เหล่านี้ มีการใช้บิ๊กดาต้าและเทคโนโลยีการประมวลผลภาษาธรรมชาติเพื่ออ่านและประเมินการตอบสนองของผู้บริโภค
- การระบุความเสี่ยงต่อผลิตภัณฑ์/บริการตั้งแต่เนิ่นๆ ถ้ามี
- ประสิทธิภาพการทำงานที่ดีขึ้น
เทคโนโลยี Big Data สามารถใช้สร้างพื้นที่จัดเตรียมหรือแลนดิ้งโซนสำหรับข้อมูลใหม่ ก่อนที่จะระบุได้ว่าข้อมูลใดควรย้ายไปยัง คลังข้อมูล- นอกจากนี้ การบูรณาการเทคโนโลยี Big Data และคลังข้อมูลดังกล่าวยังช่วยให้องค์กรสามารถถ่ายโอนข้อมูลที่เข้าถึงไม่บ่อยได้
สรุป
- คำจำกัดความของ Big Data: Big Data หมายถึงข้อมูลที่มีขนาดใหญ่มาก Bigdata เป็นคำที่ใช้เรียกชุดข้อมูลที่มีขนาดใหญ่มากแต่กลับเติบโตแบบทวีคูณตามเวลา
- ตัวอย่างการวิเคราะห์ Big Data ได้แก่ ตลาดหลักทรัพย์ เว็บไซต์โซเชียลมีเดีย เครื่องยนต์ไอพ่น ฯลฯ
- Big Data อาจเป็น 1) มีโครงสร้าง 2) ไม่มีโครงสร้าง 3) มีโครงสร้างกึ่ง
- ปริมาณ ความหลากหลาย ความเร็ว และความแปรปรวนเป็นเพียงคุณลักษณะบางประการของ Big Data
- การบริการลูกค้าที่ดีขึ้น ประสิทธิภาพการทำงานที่ดีขึ้น การตัดสินใจที่ดีขึ้น เป็นข้อดีบางประการของ Bigdata