Büyük Veri Nedir? Giriş, Çeşitleri, Özellikleri, Örnekleri

Büyük Veriye girişe geçmeden önce bilmeniz gerekenler

Veri nedir?

Elektrik sinyalleri biçiminde saklanabilen ve iletilebilen ve manyetik, optik veya mekanik kayıt ortamlarına kaydedilebilen, bir bilgisayar tarafından üzerinde işlem yapılan miktarlar, karakterler veya semboller.

Şimdi Büyük Veri tanımını öğrenelim

Büyük Veri Nedir?

büyük Veri hacim olarak çok büyük olmasına rağmen zamanla katlanarak büyüyen bir veri koleksiyonudur. Geleneksel veri yönetim araçlarının hiçbiri onu depolayamayacak veya verimli bir şekilde işleyemeyecek kadar büyük boyutlu ve karmaşık bir veridir. Büyük veri de bir veridir ancak çok büyük boyuttadır.

büyük Veri
Büyük Veri Nedir?

Büyük Veriye Örnek Nedir?

Aşağıda Büyük Veri örneklerinden bazıları verilmiştir:

The New York Borsası yaklaşık olarak üreten Büyük Verinin bir örneğidir. bir terabayt Günlük yeni ticaret verileri.

Büyük Veri Örneği

Sosyal medya

İstatistik şunu gösteriyor 500+terabayt Sosyal medya sitelerinin veritabanlarına yeni veriler giriyor Facebook, Her gün. Bu veriler esas olarak fotoğraf ve video yüklemeleri, mesaj alışverişleri, yorum yapma vb. yollarla üretilmektedir.

Büyük Veri Örneği

Tek Jet motoru üretebilir 10+terabayt içindeki verilerin 30 dakikadır. uçuş süresi. Günde binlerce uçuşla veri üretimi çok sayıda uçuşa ulaşıyor Petabayt.

Büyük Veri Örneği

Büyük Veri Türleri

Büyük Veri’nin türleri şunlardır:

  1. Yapılandırılmış
  2. Yapılandırılmamış
  3. yarı yapılandırılmış

Yapılandırılmış

Sabit formatta saklanabilen, erişilebilen ve işlenebilen her türlü veri 'yapılandırılmış' veri olarak adlandırılır. Zaman geçtikçe, bilgisayar bilimlerindeki yetenek, bu tür verilerle (formatın önceden iyi bilindiği durumlarda) çalışmak için teknikler geliştirmede ve aynı zamanda bundan değer elde etmede daha büyük başarı elde etti. Ancak günümüzde, bu tür verilerin boyutunun çok büyük boyutlara ulaştığında, tipik boyutların birden fazla zettabayt düzeyinde olduğu sorunları öngörüyoruz.

Biliyor musun? 1021 bayt eşittir 1 zettabayt or bir milyar terabayt formlar bir zettabayt.

Bu rakamlara bakıldığında Büyük Veri isminin neden verildiğini kolaylıkla anlayabilir ve depolama ve işleme süreçlerindeki zorlukları tahmin edebiliriz.

Biliyor musun? İlişkisel veri tabanı yönetim sisteminde saklanan veriler buna bir örnektir. 'yapılandırılmış' verileri.

Yapılandırılmış Veri Örnekleri

Bir veritabanındaki 'Çalışan' tablosu, Yapılandırılmış Verilerin bir örneğidir

Çalışan kimliği Çalışan Adı Cinsiyet bölüm Maaş_In_lacs
2365 Rajesh Kulkarni Erkek Finans 650000
3398 Pratibha Joshi Kadın admin 650000
7465 Şuşil Roy Erkek admin 500000
7500 Shubhojit Das Erkek Finans 500000
7699 Priya Sane Kadın Finans 550000

Yapılandırılmamış

Bilinmeyen bir biçime veya yapıya sahip herhangi bir veri, yapılandırılmamış veri olarak sınıflandırılır. Boyutunun çok büyük olmasının yanı sıra, yapılandırılmamış veriler, değer elde etmek için işlenmesi açısından birden fazla zorluk ortaya çıkarır. Yapılandırılmamış verilerin tipik bir örneği, basit metin dosyaları, resimler, videolar vb. içeren heterojen bir veri kaynağıdır. Günümüzde kuruluşlar, yanlarında bol miktarda veri bulundurmaktadır ancak ne yazık ki, bu veriler ham formda veya yapılandırılmamış formatta olduğundan, bunlardan nasıl değer elde edeceklerini bilmiyorlar.

Yapılandırılmamış Veri Örnekleri

'Google Arama'nın döndürdüğü çıktı

Yapılandırılmamış Veri Örneği
Yapılandırılmamış Veri Örneği

yarı yapılandırılmış

Yarı yapılandırılmış veriler her iki veri biçimini de içerebilir. Yarı yapılandırılmış verileri form olarak yapılandırılmış olarak görebiliriz ancak aslında ilişkisel olarak tablo tanımıyla tanımlanmamıştır. DBMS. Yarı yapılandırılmış verilere örnek olarak XML dosyasında temsil edilen veriler verilebilir.

Yarı Yapılandırılmış Veri Örnekleri

XML dosyasında saklanan kişisel veriler-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Yıllar İçinde Veri Büyümesi

Yıllar İçinde Veri Artışı
Yıllar İçinde Veri Büyümesi

Unutmayın ki web uygulaması yapılandırılmamış veriler, günlük dosyaları, işlem geçmişi dosyaları vb.'den oluşur. OLTP sistemleri, verilerin ilişkilerde (tablolarda) saklandığı yapılandırılmış verilerle çalışacak şekilde tasarlanmıştır.

Büyük Verinin Özellikleri

Büyük veriyi şu özelliklerle tanımlayabiliriz:

  • hacim
  • çeşitlilik
  • Hız
  • değişkenlik

(i) Hacim – Büyük Veri ismi başlı başına muazzam bir boyutla ilgilidir. Verinin boyutu, verinin değerinin belirlenmesinde çok önemli bir rol oynar. Ayrıca belirli bir verinin aslında Büyük Veri olarak değerlendirilip değerlendirilemeyeceği verinin hacmine bağlıdır. Buradan, 'Ses' Büyük Veri çözümleri ile uğraşırken dikkate alınması gereken bir özelliktir.

(ii) Çeşitlilik – Büyük Verinin bir sonraki yönü, çeşitlilik.

Çeşitlilik, heterojen kaynaklara ve hem yapılandırılmış hem de yapılandırılmamış verilerin doğasına atıfta bulunur. Daha önceki günlerde, elektronik tablolar ve veritabanları çoğu uygulama tarafından dikkate alınan tek veri kaynaklarıydı. Günümüzde, e-postalar, fotoğraflar, videolar, izleme cihazları, PDF'ler, ses dosyaları vb. biçimindeki veriler de analiz uygulamalarında dikkate alınmaktadır. Bu yapılandırılmamış veri çeşitliliği, depolama, madencilik ve veri analizi için belirli sorunlar ortaya çıkarmaktadır.

(iii) Hız – Süreli 'hız' Verinin üretim hızını ifade eder. Talepleri karşılamak için verinin ne kadar hızlı üretilip işlendiği, verideki gerçek potansiyeli belirler.

Büyük Veri Hızı, iş süreçleri, uygulama günlükleri, ağlar ve sosyal medya siteleri, sensörler gibi kaynaklardan veri akışının hızıyla ilgilenir. Telefon cihazlar vb. Veri akışı çok büyük ve süreklidir.

(iv) Değişkenlik – Bu, verilerde zaman zaman gösterilebilen tutarsızlığı ifade eder ve bu nedenle verilerin etkili bir şekilde ele alınabilmesi ve yönetilebilmesi sürecini sekteye uğratır.

Büyük Veri İşlemenin Avantajları

Büyük Veriyi DBMS'de işleyebilme yeteneği, aşağıdakiler gibi birçok fayda sağlar:

  • İşletmeler karar alırken dış istihbarattan yararlanabilir

Sosyal verilere erişim arama motorları ve Facebook, Twitter gibi siteler kuruluşların iş stratejilerine ince ayar yapmalarına olanak tanıyor.

  • İyileştirilmiş müşteri hizmetleri

Geleneksel müşteri geri bildirim sistemleri yerini Büyük Veri teknolojileriyle tasarlanan yeni sistemlere bırakıyor. Bu yeni sistemlerde tüketici tepkilerinin okunması ve değerlendirilmesi amacıyla Büyük Veri ve doğal dil işleme teknolojileri kullanılıyor.

  • Varsa ürün/hizmetlere yönelik risklerin erken belirlenmesi
  • Daha iyi operasyonel verimlilik

Büyük Veri teknolojileri, hangi verilerin veri tabanına taşınması gerektiğini belirlemeden önce yeni veriler için bir hazırlık alanı veya giriş bölgesi oluşturmak için kullanılabilir. veri ambarı. Ayrıca Büyük Veri teknolojilerinin ve veri ambarının bu şekilde entegrasyonu, bir kuruluşun nadiren erişilen verileri boşaltmasına yardımcı olur.

ÖZET

  • Büyük Veri tanımı: Büyük Veri, boyut olarak çok büyük olan veriler anlamına gelir. Büyük veri, boyut olarak çok büyük olmasına rağmen zamanla katlanarak büyüyen bir veri koleksiyonunu tanımlamak için kullanılan bir terimdir.
  • Büyük Veri analitiği örnekleri borsaları, sosyal medya sitelerini, jet motorlarını vb. içerir.
  • Büyük Veri 1) Yapılandırılmış, 2) Yapılandırılmamış, 3) Yarı Yapılandırılmış olabilir
  • Hacim, Çeşitlilik, Hız ve Değişkenlik Büyük Veri özelliklerinden birkaçıdır
  • İyileştirilmiş müşteri hizmetleri, daha iyi operasyonel verimlilik, Daha İyi Karar Verme, Büyük Verinin birkaç avantajıdır