Apa itu Data Besar? Pendahuluan, Jenis, Ciri-ciri, Contoh

Sebelum kita masuk ke pengenalan Big Data, Anda perlu mengetahuinya terlebih dahulu

Apa itu Data?

Kuantitas, karakter, atau simbol di mana operasi dilakukan oleh komputer, yang dapat disimpan dan ditransmisikan dalam bentuk sinyal listrik dan direkam pada media perekam magnetik, optik, atau mekanis.

Sekarang, mari pelajari definisi Big Data

Apa itu Big Data?

Big data adalah kumpulan data yang volumenya sangat besar, namun tumbuh secara eksponensial seiring waktu. Ini adalah data dengan ukuran dan kompleksitas yang sangat besar sehingga tidak ada alat manajemen data tradisional yang dapat menyimpan atau memprosesnya secara efisien. Big data juga merupakan data tetapi dengan ukuran yang sangat besar.

Big data
Apa itu Big Data?

Apa Contoh Big Data?

Berikut ini adalah beberapa contoh Big Data-

New York Stock Exchange adalah contoh Big Data yang menghasilkan tentang satu terabyte data perdagangan baru per hari.

Contoh Data Besar

Media sosial

Statistik menunjukkan hal itu 500+terabyte data baru dimasukkan ke dalam database situs media sosial Facebook, setiap hari. Data ini terutama dihasilkan dalam hal unggahan foto dan video, pertukaran pesan, pemberian komentar, dll.

Contoh Data Besar

Tunggal Mesin jet dapat menghasilkan 10+terabyte data di 30 menit waktu penerbangan. Dengan ribuan penerbangan per hari, pembangkitan data menjangkau hingga banyak orang Petabyte.

Contoh Data Besar

Jenis Data Besar

Berikut ini adalah jenis-jenis Big Data:

  1. Tersusun
  2. Tidak terstruktur
  3. Semi-terstruktur

Tersusun

Setiap data yang dapat disimpan, diakses dan diproses dalam bentuk format tetap disebut sebagai data 'terstruktur'. Selama periode waktu tertentu, talenta di bidang ilmu komputer telah mencapai kesuksesan yang lebih besar dalam mengembangkan teknik untuk bekerja dengan jenis data tersebut (yang formatnya sudah diketahui sebelumnya) dan juga memperoleh manfaat darinya. Namun, saat ini, kami memperkirakan masalah ketika ukuran data tersebut tumbuh sangat besar, ukuran umumnya berkisar beberapa zettabytes.

Apakah Anda tahu? 1021 byte sama dengan 1 zettabyte or satu miliar terabyte bentuk sebuah zettabyte.

Melihat angka-angka ini kita dapat dengan mudah memahami mengapa nama Big Data diberikan dan membayangkan tantangan yang ada dalam penyimpanan dan pemrosesannya.

Apakah Anda tahu? Data yang disimpan dalam sistem manajemen basis data relasional adalah salah satu contoh a 'tersusun' Data.

Contoh Data Terstruktur

Tabel 'Karyawan' dalam database adalah contoh Data Terstruktur

Identitas pegawai Nama karyawan Gender Departemen Gaji_In_lacs
2365 Rajesh Kulkarni Pria Keuangan 650000
3398 Pratibha Joshi Perempuan admin 650000
7465 Shushil Roy Pria admin 500000
7500 Shubhojit Das Pria Keuangan 500000
7699 Priya Waras Perempuan Keuangan 550000

Tidak terstruktur

Data apa pun yang bentuk atau strukturnya tidak diketahui diklasifikasikan sebagai data tidak terstruktur. Selain ukurannya yang sangat besar, data tidak terstruktur menimbulkan banyak tantangan dalam hal pemrosesannya untuk memperoleh nilai darinya. Contoh umum data tidak terstruktur adalah sumber data heterogen yang berisi kombinasi file teks sederhana, gambar, video, dll. Saat ini, organisasi memiliki banyak data yang tersedia, tetapi sayangnya, mereka tidak tahu cara memperoleh nilai darinya karena data ini dalam bentuk mentah atau format tidak terstruktur.

Contoh Data Tidak Terstruktur

Output dikembalikan oleh 'Google Penelusuran'

Contoh Data Tidak Terstruktur
Contoh Data Tidak Terstruktur

Semi-terstruktur

Data semi terstruktur dapat memuat kedua bentuk data tersebut. Kita dapat melihat data semi-terstruktur sebagai bentuk terstruktur tetapi sebenarnya tidak didefinisikan dengan misalnya definisi tabel dalam relasional DBMS. Contoh data semi terstruktur adalah data yang direpresentasikan dalam file XML.

Contoh Data Semi Terstruktur

Data pribadi disimpan dalam file XML-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Pertumbuhan Data selama bertahun-tahun

Pertumbuhan Data Selama Bertahun-tahun
Pertumbuhan Data selama bertahun-tahun

Harap dicatat bahwa aplikasi web data, yang tidak terstruktur, terdiri dari file log, file riwayat transaksi, dll. Sistem OLTP dibangun untuk bekerja dengan data terstruktur dimana data disimpan dalam relasi (tabel).

Karakteristik Data Besar

Big data dapat dijelaskan dengan karakteristik berikut:

  • Volume
  • Variasi
  • Kecepatan
  • Variabilitas

(i) Volume – Nama Big Data sendiri berkaitan dengan ukurannya yang sangat besar. Ukuran data memainkan peran yang sangat penting dalam menentukan nilai data. Selain itu, apakah suatu data benar-benar dapat dianggap sebagai Big Data atau tidak, bergantung pada volume datanya. Karena itu, 'Volume' adalah salah satu karakteristik yang perlu dipertimbangkan saat menangani solusi Big Data.

(ii) Variasi – Aspek selanjutnya dari Big Data adalah miliknya variasi.

Keragaman mengacu pada sumber heterogen dan sifat data, baik yang terstruktur maupun tidak terstruktur. Pada masa lalu, spreadsheet dan database merupakan satu-satunya sumber data yang dipertimbangkan oleh sebagian besar aplikasi. Saat ini, data dalam bentuk email, foto, video, perangkat pemantauan, PDF, audio, dll. juga dipertimbangkan dalam aplikasi analisis. Keragaman data yang tidak terstruktur ini menimbulkan masalah tertentu untuk penyimpanan, penggalian, dan analisis data.

(iii) Kecepatan – Istilah 'kecepatan' mengacu pada kecepatan pembuatan data. Seberapa cepat data dihasilkan dan diproses untuk memenuhi kebutuhan, menentukan potensi nyata dalam data.

Kecepatan Big Data berkaitan dengan kecepatan aliran data dari sumber seperti proses bisnis, log aplikasi, jaringan, dan situs media sosial, sensor, mobil perangkat, dll. Aliran data sangat besar dan berkelanjutan.

(iv) Variabilitas – Hal ini mengacu pada ketidakkonsistenan yang kadang-kadang ditunjukkan oleh data, sehingga menghambat proses penanganan dan pengelolaan data secara efektif.

Keuntungan Pemrosesan Data Besar

Kemampuan untuk memproses Big Data di DBMS membawa banyak manfaat, seperti-

  • Bisnis dapat memanfaatkan intelijen luar saat mengambil keputusan

Akses ke data sosial dari mesin pencari dan situs seperti Facebook, Twitter memungkinkan organisasi untuk menyempurnakan strategi bisnis mereka.

  • Peningkatan layanan pelanggan

Sistem umpan balik pelanggan tradisional digantikan oleh sistem baru yang dirancang dengan teknologi Big Data. Dalam sistem baru ini, Big Data dan teknologi pemrosesan bahasa alami digunakan untuk membaca dan mengevaluasi tanggapan konsumen.

  • Identifikasi dini risiko terhadap produk/layanan, jika ada
  • Efisiensi operasional yang lebih baik

Teknologi Big Data dapat digunakan untuk membuat area pementasan atau zona pendaratan untuk data baru sebelum mengidentifikasi data apa yang harus dipindahkan data warehouse. Selain itu, integrasi teknologi Big Data dan gudang data membantu organisasi untuk memindahkan data yang jarang diakses.

Kesimpulan

  • Definisi Big Data: Big Data berarti data yang berukuran sangat besar. Bigdata adalah istilah yang digunakan untuk menggambarkan kumpulan data yang berukuran sangat besar namun terus bertambah secara eksponensial seiring waktu.
  • Contoh analisis Big Data mencakup bursa saham, situs media sosial, mesin jet, dll.
  • Big Data dapat berupa 1) Terstruktur, 2) Tidak Terstruktur, 3) Semi Terstruktur
  • Volume, Variasi, Kecepatan, dan Variabilitas adalah beberapa karakteristik Big Data
  • Peningkatan layanan pelanggan, efisiensi operasional yang lebih baik, Pengambilan Keputusan yang Lebih Baik adalah beberapa keunggulan Bigdata