¿Qué son los grandes datos? Introducción, Tipos, Características, Ejemplos
¿Qué son los datos?
Las cantidades, caracteres o símbolos sobre los que una computadora realiza operaciones, que pueden almacenarse y transmitirse en forma de señales eléctricas y grabarse en medios de grabación magnéticos, ópticos o mecánicos.
Ahora, aprendamos la definición de Big Data.
¿Qué es Big Data?
Big Data es una colección de datos de un volumen enorme, pero que crece exponencialmente con el tiempo. Se trata de datos de un tamaño y una complejidad tan grandes que ninguna de las herramientas de gestión de datos tradicionales puede almacenarlos o procesarlos de manera eficiente. El big data también es un conjunto de datos, pero de un tamaño enorme.

¿Qué es un ejemplo de Big Data?
A continuación se presentan algunos ejemplos de Big Data:
La Bolsa de Nueva York es un ejemplo de Big Data que genera alrededor de un terabyte de nuevos datos comerciales por día.
Redes sociales
La estadística muestra que 500+terabytes de nuevos datos se incorporan a las bases de datos del sitio de redes sociales Facebook, cada día. Estos datos se generan principalmente en términos de carga de fotos y vídeos, intercambio de mensajes, comentarios, etc.
Un único Motor a reacción puede generar 10+terabytes de datos en 30 minutos del tiempo de vuelo. Con miles de vuelos al día, la generación de datos alcanza a muchos Petabytes.
Tipos de grandes datos
Los siguientes son los tipos de Big Data:
- Estructurado
- No estructurado
- semiestructurado
Estructurado
Cualquier dato que pueda almacenarse, accederse y procesarse en un formato fijo se denomina dato "estructurado". A lo largo del tiempo, el talento en informática ha logrado un mayor éxito en el desarrollo de técnicas para trabajar con este tipo de datos (cuando el formato se conoce de antemano) y también en la obtención de valor de ellos. Sin embargo, hoy en día, prevemos problemas cuando el tamaño de dichos datos crece en gran medida, los tamaños típicos están llegando a varios zettabytes.
¿Sabes? 1021 bytes igual a 1 zettabytes or mil millones de terabytes Formularios un zettabyte.
Al observar estas cifras se puede entender fácilmente por qué se le da el nombre de Big Data e imaginar los desafíos que implica su almacenamiento y procesamiento.
¿Sabes? Los datos almacenados en un sistema de gestión de bases de datos relacionales son un ejemplo de 'estructurado' datos.
Ejemplos de datos estructurados
Una tabla de "Empleado" en una base de datos es un ejemplo de datos estructurados.
ID de empleado | Nombre de empleado | Género | Departamento | Salario_en_lacs |
---|---|---|---|---|
2365 | Rajesh Kulkarni | Hombre | Finanzas | 650000 |
3398 | pratibha joshi | Mujer | Administración | 650000 |
7465 | Shushil Roy | Hombre | Administración | 500000 |
7500 | Shubhojit Das | Hombre | Finanzas | 500000 |
7699 | Priya Sane | Mujer | Finanzas | 550000 |
No estructurado
Cualquier dato cuya forma o estructura se desconoce se clasifica como dato no estructurado. Además de su enorme tamaño, los datos no estructurados plantean múltiples desafíos en términos de su procesamiento para extraer valor de ellos. Un ejemplo típico de datos no estructurados es una fuente de datos heterogénea que contiene una combinación de archivos de texto simples, imágenes, videos, etc. Hoy en día, las organizaciones tienen una gran cantidad de datos disponibles, pero desafortunadamente no saben cómo extraer valor de ellos, ya que estos datos están en su forma original o en formato no estructurado.
Ejemplos de datos no estructurados
El resultado devuelto por la "Búsqueda de Google"
semiestructurado
Los datos semiestructurados pueden contener ambas formas de datos. Podemos ver los datos semiestructurados como una forma estructurada, pero en realidad no están definidos, por ejemplo. una definición de tabla en relacional DBMS. Un ejemplo de datos semiestructurados son los datos representados en un archivo XML.
Ejemplos de datos semiestructurados
Datos personales almacenados en un archivo XML.
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
Crecimiento de datos a lo largo de los años
Tenga en cuenta que aplicación web Los datos, que no están estructurados, constan de archivos de registro, archivos de historial de transacciones, etc. Los sistemas OLTP están diseñados para trabajar con datos estructurados en los que los datos se almacenan en relaciones (tablas).
Características de los grandes datos
El big data se puede describir mediante las siguientes características:
- Volumen
- Variedad
- Rapidez
- Variabilidad
(i) Volumen – El propio nombre Big Data está relacionado con un tamaño enorme. El tamaño de los datos juega un papel muy crucial a la hora de determinar el valor de los datos. Además, si un dato en particular puede considerarse realmente como Big Data o no, depende del volumen de datos. Por eso, 'Volumen' es una característica que debe tenerse en cuenta al tratar con soluciones de Big Data.
(ii) Variedad – El siguiente aspecto de Big Data es su variedad.
La variedad se refiere a las fuentes heterogéneas y a la naturaleza de los datos, tanto estructurados como no estructurados. En el pasado, las hojas de cálculo y las bases de datos eran las únicas fuentes de datos que se tenían en cuenta en la mayoría de las aplicaciones. Hoy en día, los datos en forma de correos electrónicos, fotos, vídeos, dispositivos de monitorización, archivos PDF, audio, etc. también se tienen en cuenta en las aplicaciones de análisis. Esta variedad de datos no estructurados plantea ciertos problemas para el almacenamiento, la extracción y el análisis de datos.
(iii) Velocidad – El término 'velocidad' Se refiere a la velocidad de generación de datos. La rapidez con la que se generan y procesan los datos para satisfacer las demandas determina el potencial real de los datos.
Big Data Velocity se ocupa de la velocidad a la que los datos fluyen desde fuentes como procesos comerciales, registros de aplicaciones, redes y sitios de redes sociales, sensores, Móvil dispositivos, etc. El flujo de datos es masivo y continuo.
(iv) Variabilidad – Esto se refiere a la inconsistencia que pueden mostrar los datos en ocasiones, dificultando así el proceso de poder manejar y gestionar los datos de manera efectiva.
Ventajas del procesamiento de Big Data
La capacidad de procesar Big Data en DBMS brinda múltiples beneficios, como:
- Las empresas pueden utilizar inteligencia externa al tomar decisiones
Acceso a datos sociales de motores de búsqueda y sitios como Facebook y Twitter están permitiendo a las organizaciones afinar sus estrategias comerciales.
- Melhoria do atendimento ao cliente
Los sistemas tradicionales de retroalimentación de los clientes están siendo reemplazados por nuevos sistemas diseñados con tecnologías Big Data. En estos nuevos sistemas se están utilizando Big Data y tecnologías de procesamiento del lenguaje natural para leer y evaluar las respuestas de los consumidores.
- Identificación temprana de riesgos para el producto/servicios, si los hubiera.
- Mejor eficiencia operativa
Las tecnologías de Big Data se pueden utilizar para crear un área de preparación o una zona de aterrizaje para nuevos datos antes de identificar qué datos deben trasladarse al almacenamiento de datos. Además, dicha integración de las tecnologías Big Data y el almacén de datos ayuda a una organización a descargar datos a los que se accede con poca frecuencia.
Resumen
- Definición de Big Data: Big Data significa datos de gran tamaño. Bigdata es un término que se utiliza para describir una colección de datos de gran tamaño que, sin embargo, crece exponencialmente con el tiempo.
- Los ejemplos de análisis de Big Data incluyen bolsas de valores, sitios de redes sociales, motores a reacción, etc.
- Big Data podría ser 1) estructurado, 2) no estructurado, 3) semiestructurado
- Volumen, variedad, velocidad y variabilidad son algunas de las características de Big Data
- Un mejor servicio al cliente, una mejor eficiencia operativa y una mejor toma de decisiones son algunas de las ventajas de Bigdata