Cosa sono i Big Data? Introduzione, Tipi, Caratteristiche, Esempi
Che cosa sono i dati?
Le quantità, i caratteri o i simboli su cui vengono eseguite operazioni da un computer, che possono essere memorizzati e trasmessi sotto forma di segnali elettrici e registrati su supporti di registrazione magnetici, ottici o meccanici.
Ora impariamo la definizione di Big Data
Che cosa sono i Big Data?
Big Data è una raccolta di dati di volume enorme, ma in crescita esponenziale nel tempo. Si tratta di dati di dimensioni e complessità così grandi che nessuno degli strumenti tradizionali di gestione dei dati può archiviarli o elaborarli in modo efficiente. Anche i big data sono dati, ma di dimensioni enormi.

Qual è un esempio di Big Data?
Di seguito alcuni esempi di Big Data:
La sezione Currents, dedicata a opere audaci e innovative di artisti emergenti e affermati, include la prima statunitense di Mare’s Nest di Ben Rivers, descritto come “un enigmatico road movie ambientato in un mondo post-apocalittico governato da bambini”. Tra gli altri titoli spiccano Dracula di Radu Jude e With Hasan in Gaza di Kamal Aljafari. New York Stock Exchange è un esempio di Big Data che genera circa un terabyte di nuovi dati commerciali al giorno.
Social media
La statistica lo dimostra 500+terabyte dei nuovi dati vengono inseriti nei database dei siti di social media Facebook, ogni giorno. Questi dati vengono generati principalmente in termini di caricamento di foto e video, scambio di messaggi, inserimento di commenti, ecc.
Un singolo Motore a reazione può generare 10+terabyte di dati in 30 minuti del tempo di volo. Con molte migliaia di voli al giorno, la generazione di dati arriva a molti Petabyte.
Tipi di Big Data
Di seguito sono riportati i tipi di Big Data:
- Strutturato
- non strutturati
- Semi-strutturato
Strutturato
Tutti i dati che possono essere archiviati, consultati ed elaborati sotto forma di formato fisso sono definiti dati "strutturati". Nel corso del tempo, il talento nel campo dell'informatica ha ottenuto maggiore successo nello sviluppo di tecniche per lavorare con questo tipo di dati (dove il formato è ben noto in anticipo) e anche nel trarne valore. Tuttavia, al giorno d'oggi, prevediamo problemi quando la dimensione di tali dati cresce in misura enorme, le dimensioni tipiche sono dell'ordine di più zettabyte.
Lo sai? 1021 bytes uguale a 1 zettabyte or un miliardo di terabyte forme uno zettabyte.
Osservando questi dati si può facilmente comprendere il motivo per cui viene dato il nome Big Data e immaginare le sfide legate alla loro archiviazione ed elaborazione.
Lo sai? I dati archiviati in un sistema di gestione di database relazionale sono un esempio di a 'strutturato' dati.
Esempi di dati strutturati
Una tabella "Dipendente" in un database è un esempio di dati strutturati
Numero Identità dell'impiegato | Nome dipendente | Genere | Shirts Department | Stipendio_In_lacs |
---|---|---|---|---|
2365 | Rajesh Kulkarni | Maschio | Amministrazione | 650000 |
3398 | Pratibha Joshi | Femmina | Admin | 650000 |
7465 | Shushil Roy | Maschio | Admin | 500000 |
7500 | Shubhojit Das | Maschio | Amministrazione | 500000 |
7699 | Priya Sane | Femmina | Amministrazione | 550000 |
non strutturati
Tutti i dati con forma o struttura sconosciute sono classificati come dati non strutturati. Oltre alle dimensioni enormi, i dati non strutturati pongono molteplici sfide in termini di elaborazione per ricavarne valore. Un tipico esempio di dati non strutturati è una fonte di dati eterogenea contenente una combinazione di semplici file di testo, immagini, video ecc. Oggigiorno le organizzazioni hanno a disposizione una grande quantità di dati ma sfortunatamente non sanno come ricavarne valore poiché questi dati sono in forma grezza o in formato non strutturato.
Esempi di dati non strutturati
L'output restituito da "Ricerca Google"
Semi-strutturato
I dati semistrutturati possono contenere entrambe le forme di dati. Possiamo vedere i dati semi-strutturati come una forma strutturata ma in realtà non sono definiti con, ad esempio, una definizione di tabella in formato relazionale DBMS. Un esempio di dati semistrutturati sono i dati rappresentati in un file XML.
Esempi di dati semistrutturati
Dati personali archiviati in un file XML-
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
Crescita dei dati nel corso degli anni
Tieni presente che web application i dati, che non sono strutturati, sono costituiti da file di registro, file di cronologia delle transazioni, ecc. I sistemi OLTP sono progettati per funzionare con dati strutturati in cui i dati sono archiviati in relazioni (tabelle).
Caratteristiche dei Big Data
I Big Data possono essere descritti dalle seguenti caratteristiche:
- Volume
- Variety
- Velocità
- Variabilità
(i) Volume – Il nome stesso Big Data è legato a dimensioni enormi. La dimensione dei dati gioca un ruolo cruciale nel determinare il valore dei dati. Inoltre, se un particolare dato possa effettivamente essere considerato un Big Data o meno, dipende dal volume dei dati. Quindi, 'Volume' è una caratteristica che deve essere considerata quando si affrontano soluzioni Big Data.
(ii) Varietà – Il prossimo aspetto dei Big Data è il suo varietà.
La varietà si riferisce a fonti eterogenee e alla natura dei dati, sia strutturati che non strutturati. In passato, fogli di calcolo e database erano le uniche fonti di dati considerate dalla maggior parte delle applicazioni. Oggigiorno, anche i dati sotto forma di e-mail, foto, video, dispositivi di monitoraggio, PDF, audio, ecc. vengono presi in considerazione nelle applicazioni di analisi. Questa varietà di dati non strutturati pone alcuni problemi per l'archiviazione, l'estrazione e l'analisi dei dati.
(iii) Velocità – Il termine 'velocità' si riferisce alla velocità di generazione dei dati. La velocità con cui i dati vengono generati ed elaborati per soddisfare le richieste determina il potenziale reale dei dati.
Big Data Velocity si occupa della velocità con cui i dati fluiscono da fonti come processi aziendali, registri di applicazioni, reti e siti di social media, sensori, Mobile dispositivi, ecc. Il flusso di dati è massiccio e continuo.
(iv) Variabilità – Ciò si riferisce all'incoerenza che a volte può essere mostrata dai dati, ostacolando così il processo di capacità di gestire e gestire i dati in modo efficace.
Vantaggi dell'elaborazione dei Big Data
La capacità di elaborare Big Data in DBMS offre molteplici vantaggi, come ad esempio-
- Le aziende possono utilizzare l’intelligence esterna mentre prendono decisioni
Accesso ai dati sociali da motori di ricerca e siti come Facebook e Twitter consentono alle organizzazioni di mettere a punto le proprie strategie di business.
- Servizio clienti migliorato
I tradizionali sistemi di feedback dei clienti vengono sostituiti da nuovi sistemi progettati con tecnologie Big Data. In questi nuovi sistemi, i Big Data e le tecnologie di elaborazione del linguaggio naturale vengono utilizzati per leggere e valutare le risposte dei consumatori.
- Identificazione precoce del rischio per il prodotto/servizio, se presente
- Migliore efficienza operativa
Le tecnologie Big Data possono essere utilizzate per creare un'area di staging o una zona di destinazione per i nuovi dati prima di identificare quali dati devono essere spostati data warehouse. Inoltre, tale integrazione delle tecnologie Big Data e del data warehouse aiuta un'organizzazione a scaricare i dati a cui si accede raramente.
Sintesi
- Definizione di Big Data: Big Data significa dati di dimensioni enormi. Bigdata è un termine utilizzato per descrivere una raccolta di dati di dimensioni enormi e che tuttavia cresce esponenzialmente nel tempo.
- Esempi di analisi dei Big Data includono borse, siti di social media, motori di aerei, ecc.
- I Big Data potrebbero essere 1) Strutturati, 2) Non strutturati, 3) Semi-strutturati
- Volume, varietà, velocità e variabilità sono alcune delle caratteristiche dei Big Data
- Un migliore servizio clienti, una migliore efficienza operativa e un migliore processo decisionale sono alcuni dei vantaggi di Bigdata