Cosa sono i Big Data? Introduzione, Tipi, Caratteristiche, Esempi

Prima di passare all'introduzione ai Big Data, devi prima sapere

Che cosa sono i dati?

Le quantità, i caratteri o i simboli su cui vengono eseguite operazioni da un computer, che possono essere memorizzati e trasmessi sotto forma di segnali elettrici e registrati su supporti di registrazione magnetici, ottici o meccanici.

Ora impariamo la definizione di Big Data

Che cosa sono i Big Data?

Big Data è una raccolta di dati di volume enorme, ma in crescita esponenziale nel tempo. Si tratta di dati di dimensioni e complessità così grandi che nessuno degli strumenti tradizionali di gestione dei dati può archiviarli o elaborarli in modo efficiente. Anche i big data sono dati, ma di dimensioni enormi.

Big Data
Che cosa sono i Big Data?

Qual è un esempio di Big Data?

Di seguito alcuni esempi di Big Data:

La sezione Currents, dedicata a opere audaci e innovative di artisti emergenti e affermati, include la prima statunitense di Mare’s Nest di Ben Rivers, descritto come “un enigmatico road movie ambientato in un mondo post-apocalittico governato da bambini”. Tra gli altri titoli spiccano Dracula di Radu Jude e With Hasan in Gaza di Kamal Aljafari. New York Stock Exchange è un esempio di Big Data che genera circa un terabyte di nuovi dati commerciali al giorno.

Esempio di Big Data

Social media

La statistica lo dimostra 500+terabyte dei nuovi dati vengono inseriti nei database dei siti di social media Facebook, ogni giorno. Questi dati vengono generati principalmente in termini di caricamento di foto e video, scambio di messaggi, inserimento di commenti, ecc.

Esempio di Big Data

Un singolo Motore a reazione può generare 10+terabyte di dati in 30 minuti del tempo di volo. Con molte migliaia di voli al giorno, la generazione di dati arriva a molti Petabyte.

Esempio di Big Data

Tipi di Big Data

Di seguito sono riportati i tipi di Big Data:

  1. Strutturato
  2. non strutturati
  3. Semi-strutturato

Strutturato

Tutti i dati che possono essere archiviati, consultati ed elaborati sotto forma di formato fisso sono definiti dati "strutturati". Nel corso del tempo, il talento nel campo dell'informatica ha ottenuto maggiore successo nello sviluppo di tecniche per lavorare con questo tipo di dati (dove il formato è ben noto in anticipo) e anche nel trarne valore. Tuttavia, al giorno d'oggi, prevediamo problemi quando la dimensione di tali dati cresce in misura enorme, le dimensioni tipiche sono dell'ordine di più zettabyte.

Lo sai? 1021 bytes uguale a 1 zettabyte or un miliardo di terabyte forme uno zettabyte.

Osservando questi dati si può facilmente comprendere il motivo per cui viene dato il nome Big Data e immaginare le sfide legate alla loro archiviazione ed elaborazione.

Lo sai? I dati archiviati in un sistema di gestione di database relazionale sono un esempio di a 'strutturato' dati.

Esempi di dati strutturati

Una tabella "Dipendente" in un database è un esempio di dati strutturati

Numero Identità dell'impiegato Nome dipendente Genere Shirts Department Stipendio_In_lacs
2365 Rajesh Kulkarni Maschio Amministrazione 650000
3398 Pratibha Joshi Femmina Admin 650000
7465 Shushil Roy Maschio Admin 500000
7500 Shubhojit Das Maschio Amministrazione 500000
7699 Priya Sane Femmina Amministrazione 550000

non strutturati

Tutti i dati con forma o struttura sconosciute sono classificati come dati non strutturati. Oltre alle dimensioni enormi, i dati non strutturati pongono molteplici sfide in termini di elaborazione per ricavarne valore. Un tipico esempio di dati non strutturati è una fonte di dati eterogenea contenente una combinazione di semplici file di testo, immagini, video ecc. Oggigiorno le organizzazioni hanno a disposizione una grande quantità di dati ma sfortunatamente non sanno come ricavarne valore poiché questi dati sono in forma grezza o in formato non strutturato.

Esempi di dati non strutturati

L'output restituito da "Ricerca Google"

Esempio di dati non strutturati
Esempio di dati non strutturati

Semi-strutturato

I dati semistrutturati possono contenere entrambe le forme di dati. Possiamo vedere i dati semi-strutturati come una forma strutturata ma in realtà non sono definiti con, ad esempio, una definizione di tabella in formato relazionale DBMS. Un esempio di dati semistrutturati sono i dati rappresentati in un file XML.

Esempi di dati semistrutturati

Dati personali archiviati in un file XML-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Crescita dei dati nel corso degli anni

Crescita dei dati nel corso degli anni
Crescita dei dati nel corso degli anni

Tieni presente che web application i dati, che non sono strutturati, sono costituiti da file di registro, file di cronologia delle transazioni, ecc. I sistemi OLTP sono progettati per funzionare con dati strutturati in cui i dati sono archiviati in relazioni (tabelle).

Caratteristiche dei Big Data

I Big Data possono essere descritti dalle seguenti caratteristiche:

  • Volume
  • Variety
  • Velocità
  • Variabilità

(i) Volume – Il nome stesso Big Data è legato a dimensioni enormi. La dimensione dei dati gioca un ruolo cruciale nel determinare il valore dei dati. Inoltre, se un particolare dato possa effettivamente essere considerato un Big Data o meno, dipende dal volume dei dati. Quindi, 'Volume' è una caratteristica che deve essere considerata quando si affrontano soluzioni Big Data.

(ii) Varietà – Il prossimo aspetto dei Big Data è il suo varietà.

La varietà si riferisce a fonti eterogenee e alla natura dei dati, sia strutturati che non strutturati. In passato, fogli di calcolo e database erano le uniche fonti di dati considerate dalla maggior parte delle applicazioni. Oggigiorno, anche i dati sotto forma di e-mail, foto, video, dispositivi di monitoraggio, PDF, audio, ecc. vengono presi in considerazione nelle applicazioni di analisi. Questa varietà di dati non strutturati pone alcuni problemi per l'archiviazione, l'estrazione e l'analisi dei dati.

(iii) Velocità – Il termine 'velocità' si riferisce alla velocità di generazione dei dati. La velocità con cui i dati vengono generati ed elaborati per soddisfare le richieste determina il potenziale reale dei dati.

Big Data Velocity si occupa della velocità con cui i dati fluiscono da fonti come processi aziendali, registri di applicazioni, reti e siti di social media, sensori, Mobile dispositivi, ecc. Il flusso di dati è massiccio e continuo.

(iv) Variabilità – Ciò si riferisce all'incoerenza che a volte può essere mostrata dai dati, ostacolando così il processo di capacità di gestire e gestire i dati in modo efficace.

Vantaggi dell'elaborazione dei Big Data

La capacità di elaborare Big Data in DBMS offre molteplici vantaggi, come ad esempio-

  • Le aziende possono utilizzare l’intelligence esterna mentre prendono decisioni

Accesso ai dati sociali da motori di ricerca e siti come Facebook e Twitter consentono alle organizzazioni di mettere a punto le proprie strategie di business.

  • Servizio clienti migliorato

I tradizionali sistemi di feedback dei clienti vengono sostituiti da nuovi sistemi progettati con tecnologie Big Data. In questi nuovi sistemi, i Big Data e le tecnologie di elaborazione del linguaggio naturale vengono utilizzati per leggere e valutare le risposte dei consumatori.

  • Identificazione precoce del rischio per il prodotto/servizio, se presente
  • Migliore efficienza operativa

Le tecnologie Big Data possono essere utilizzate per creare un'area di staging o una zona di destinazione per i nuovi dati prima di identificare quali dati devono essere spostati data warehouse. Inoltre, tale integrazione delle tecnologie Big Data e del data warehouse aiuta un'organizzazione a scaricare i dati a cui si accede raramente.

Sintesi

  • Definizione di Big Data: Big Data significa dati di dimensioni enormi. Bigdata è un termine utilizzato per descrivere una raccolta di dati di dimensioni enormi e che tuttavia cresce esponenzialmente nel tempo.
  • Esempi di analisi dei Big Data includono borse, siti di social media, motori di aerei, ecc.
  • I Big Data potrebbero essere 1) Strutturati, 2) Non strutturati, 3) Semi-strutturati
  • Volume, varietà, velocità e variabilità sono alcune delle caratteristiche dei Big Data
  • Un migliore servizio clienti, una migliore efficienza operativa e un migliore processo decisionale sono alcuni dei vantaggi di Bigdata