Apa itu Data Besar? Pendahuluan, Jenis, Ciri-ciri, Contoh
Apa itu Data?
Kuantitas, karakter, atau simbol di mana operasi dilakukan oleh komputer, yang dapat disimpan dan ditransmisikan dalam bentuk sinyal listrik dan direkam pada media perekam magnetik, optik, atau mekanis.
Sekarang, mari pelajari definisi Big Data
Apa itu Big Data?
Big data adalah kumpulan data yang volumenya sangat besar, namun tumbuh secara eksponensial seiring waktu. Ini adalah data dengan ukuran dan kompleksitas yang sangat besar sehingga tidak ada alat manajemen data tradisional yang dapat menyimpan atau memprosesnya secara efisien. Big data juga merupakan data tetapi dengan ukuran yang sangat besar.

Apa Contoh Big Data?
Berikut ini adalah beberapa contoh Big Data-
New York Stock Exchange adalah contoh Big Data yang menghasilkan tentang satu terabyte data perdagangan baru per hari.
Media sosial
Statistik menunjukkan hal itu 500+terabyte data baru dimasukkan ke dalam database situs media sosial Facebook, setiap hari. Data ini terutama dihasilkan dalam hal unggahan foto dan video, pertukaran pesan, pemberian komentar, dll.
Tunggal Mesin jet dapat menghasilkan 10+terabyte data di 30 menit waktu penerbangan. Dengan ribuan penerbangan per hari, pembangkitan data menjangkau hingga banyak orang Petabyte.
Jenis Data Besar
Berikut ini adalah jenis-jenis Big Data:
- Tersusun
- Tidak terstruktur
- Semi-terstruktur
Tersusun
Setiap data yang dapat disimpan, diakses dan diproses dalam bentuk format tetap disebut sebagai data 'terstruktur'. Selama periode waktu tertentu, talenta di bidang ilmu komputer telah mencapai kesuksesan yang lebih besar dalam mengembangkan teknik untuk bekerja dengan jenis data tersebut (yang formatnya sudah diketahui sebelumnya) dan juga memperoleh manfaat darinya. Namun, saat ini, kami memperkirakan masalah ketika ukuran data tersebut tumbuh sangat besar, ukuran umumnya berkisar beberapa zettabytes.
Apakah Anda tahu? 1021 byte sama dengan 1 zettabyte or satu miliar terabyte bentuk sebuah zettabyte.
Melihat angka-angka ini kita dapat dengan mudah memahami mengapa nama Big Data diberikan dan membayangkan tantangan yang ada dalam penyimpanan dan pemrosesannya.
Apakah Anda tahu? Data yang disimpan dalam sistem manajemen basis data relasional adalah salah satu contoh a 'tersusun' Data.
Contoh Data Terstruktur
Tabel 'Karyawan' dalam database adalah contoh Data Terstruktur
Identitas pegawai | Nama karyawan | Gender | Departemen | Gaji_In_lacs |
---|---|---|---|---|
2365 | Rajesh Kulkarni | Pria | Keuangan | 650000 |
3398 | Pratibha Joshi | Perempuan | admin | 650000 |
7465 | Shushil Roy | Pria | admin | 500000 |
7500 | Shubhojit Das | Pria | Keuangan | 500000 |
7699 | Priya Waras | Perempuan | Keuangan | 550000 |
Tidak terstruktur
Data apa pun yang bentuk atau strukturnya tidak diketahui diklasifikasikan sebagai data tidak terstruktur. Selain ukurannya yang sangat besar, data tidak terstruktur menimbulkan banyak tantangan dalam hal pemrosesannya untuk memperoleh nilai darinya. Contoh umum data tidak terstruktur adalah sumber data heterogen yang berisi kombinasi file teks sederhana, gambar, video, dll. Saat ini, organisasi memiliki banyak data yang tersedia, tetapi sayangnya, mereka tidak tahu cara memperoleh nilai darinya karena data ini dalam bentuk mentah atau format tidak terstruktur.
Contoh Data Tidak Terstruktur
Output dikembalikan oleh 'Google Penelusuran'
Semi-terstruktur
Data semi terstruktur dapat memuat kedua bentuk data tersebut. Kita dapat melihat data semi-terstruktur sebagai bentuk terstruktur tetapi sebenarnya tidak didefinisikan dengan misalnya definisi tabel dalam relasional DBMS. Contoh data semi terstruktur adalah data yang direpresentasikan dalam file XML.
Contoh Data Semi Terstruktur
Data pribadi disimpan dalam file XML-
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
Pertumbuhan Data selama bertahun-tahun
Harap dicatat bahwa aplikasi web data, yang tidak terstruktur, terdiri dari file log, file riwayat transaksi, dll. Sistem OLTP dibangun untuk bekerja dengan data terstruktur dimana data disimpan dalam relasi (tabel).
Karakteristik Data Besar
Big data dapat dijelaskan dengan karakteristik berikut:
- Volume
- Variasi
- Kecepatan
- Variabilitas
(i) Volume – Nama Big Data sendiri berkaitan dengan ukurannya yang sangat besar. Ukuran data memainkan peran yang sangat penting dalam menentukan nilai data. Selain itu, apakah suatu data benar-benar dapat dianggap sebagai Big Data atau tidak, bergantung pada volume datanya. Karena itu, 'Volume' adalah salah satu karakteristik yang perlu dipertimbangkan saat menangani solusi Big Data.
(ii) Variasi – Aspek selanjutnya dari Big Data adalah miliknya variasi.
Keragaman mengacu pada sumber heterogen dan sifat data, baik yang terstruktur maupun tidak terstruktur. Pada masa lalu, spreadsheet dan database merupakan satu-satunya sumber data yang dipertimbangkan oleh sebagian besar aplikasi. Saat ini, data dalam bentuk email, foto, video, perangkat pemantauan, PDF, audio, dll. juga dipertimbangkan dalam aplikasi analisis. Keragaman data yang tidak terstruktur ini menimbulkan masalah tertentu untuk penyimpanan, penggalian, dan analisis data.
(iii) Kecepatan – Istilah 'kecepatan' mengacu pada kecepatan pembuatan data. Seberapa cepat data dihasilkan dan diproses untuk memenuhi kebutuhan, menentukan potensi nyata dalam data.
Kecepatan Big Data berkaitan dengan kecepatan aliran data dari sumber seperti proses bisnis, log aplikasi, jaringan, dan situs media sosial, sensor, mobil perangkat, dll. Aliran data sangat besar dan berkelanjutan.
(iv) Variabilitas – Hal ini mengacu pada ketidakkonsistenan yang kadang-kadang ditunjukkan oleh data, sehingga menghambat proses penanganan dan pengelolaan data secara efektif.
Keuntungan Pemrosesan Data Besar
Kemampuan untuk memproses Big Data di DBMS membawa banyak manfaat, seperti-
- Bisnis dapat memanfaatkan intelijen luar saat mengambil keputusan
Akses ke data sosial dari mesin pencari dan situs seperti Facebook, Twitter memungkinkan organisasi untuk menyempurnakan strategi bisnis mereka.
- Peningkatan layanan pelanggan
Sistem umpan balik pelanggan tradisional digantikan oleh sistem baru yang dirancang dengan teknologi Big Data. Dalam sistem baru ini, Big Data dan teknologi pemrosesan bahasa alami digunakan untuk membaca dan mengevaluasi tanggapan konsumen.
- Identifikasi dini risiko terhadap produk/layanan, jika ada
- Efisiensi operasional yang lebih baik
Teknologi Big Data dapat digunakan untuk membuat area pementasan atau zona pendaratan untuk data baru sebelum mengidentifikasi data apa yang harus dipindahkan data warehouse. Selain itu, integrasi teknologi Big Data dan gudang data membantu organisasi untuk memindahkan data yang jarang diakses.
Kesimpulan
- Definisi Big Data: Big Data berarti data yang berukuran sangat besar. Bigdata adalah istilah yang digunakan untuk menggambarkan kumpulan data yang berukuran sangat besar namun terus bertambah secara eksponensial seiring waktu.
- Contoh analisis Big Data mencakup bursa saham, situs media sosial, mesin jet, dll.
- Big Data dapat berupa 1) Terstruktur, 2) Tidak Terstruktur, 3) Semi Terstruktur
- Volume, Variasi, Kecepatan, dan Variabilitas adalah beberapa karakteristik Big Data
- Peningkatan layanan pelanggan, efisiensi operasional yang lebih baik, Pengambilan Keputusan yang Lebih Baik adalah beberapa keunggulan Bigdata