Tutorial de ELK Stack: ¿Qué es Kibana? Logstash ¿Y búsqueda elástica?
¿Qué es la pila ELK?
La Pila de ELK es una colección de tres productos de código abierto: Elasticsearch, Logstashy Kibana. La pila ELK proporciona registro centralizado para identificar problemas con servidores o aplicaciones. Le permite buscar todos los registros en un solo lugar. También ayuda a encontrar problemas en varios servidores conectando registros durante un período de tiempo específico.
- E significa ElasticSearch: se utiliza para almacenar registros
- L Significa LogStash: se utiliza tanto para el envío como para el procesamiento y almacenamiento de registros.
- K significa Kibana: es un herramienta de visualización (una interfaz web) que está alojada a través de Nginx o Apache
ElasticSearch, LogStash y Kibana son desarrollados, administrados y mantenidos por la empresa Elastic.
ELK Stack está diseñado para permitir a los usuarios tomar datos de cualquier fuente, en cualquier formato, y buscar, analizar y visualizar esos datos en tiempo real.
Pila de ELK Architectura
Ahora, en este tutorial de la pila ELK, aprenderemos sobre la arquitectura ELK:
Aquí está la arquitectura simple de la pila ELK

- Registros: Se identifican los registros del servidor que deben analizarse
- Logstash: Recopile registros y datos de eventos. Incluso analiza y transforma datos.
- Búsqueda elástica: Los datos transformados de Logstash is Almacenar, buscar e indexar.
- Kibana: Kibana utiliza Elasticsearch DB para explorar, visualizar y compartir
Sin embargo, se necesita un componente más o recopilación de datos llamado Beats. Esto llevó a Elastic a cambiar el nombre de ELK a Elastic Stack.
Al trabajar con grandes cantidades de datos, es posible que necesite Kafka o RabbitMQ para el almacenamiento en búfer y la resiliencia. Para la seguridad, se puede utilizar nginx.
Ahora, en este tutorial de Elastic Stack, Profundicemos en todos estos productos de código abierto:
¿Qué es Elasticsearch?
Elasticsearch es un Base de datos NoSQL. Está basado en el motor de búsqueda Lucene y está construido con APIS RESTful. Ofrece una implementación simple, máxima confiabilidad y fácil administración. También ofrece consultas avanzadas para realizar análisis detallados y almacena todos los datos de forma centralizada. Es útil para ejecutar una búsqueda rápida de los documentos.
Elasticsearch también permite almacenar, buscar y analizar grandes volúmenes de datos. Se utiliza principalmente como motor subyacente para impulsar aplicaciones que cumplen con los requisitos de búsqueda. Se ha adoptado en plataformas de motores de búsqueda para aplicaciones web y móviles modernas. Además de una búsqueda rápida, la herramienta también ofrece análisis complejos y muchas funciones avanzadas.
Características de la búsqueda elástica
- El servidor de búsqueda de código abierto está escrito usando Java
- Se utiliza para indexar cualquier tipo de datos heterogéneos.
- Tiene interfaz web REST API con salida JSON
- Búsqueda de texto completo
- Búsqueda en tiempo casi real (NRT)
- Almacén de documentos JSON fragmentado, replicado y con capacidad de búsqueda
- Almacén de documentos distribuidos sin esquemas, basado en REST y JSON
- Soporte multilingüe y geolocalización
Ventajas de Elasticsearch
- Almacene datos sin esquema y también cree un esquema para sus datos
- Manipule sus datos registro por registro con la ayuda de API de múltiples documentos
- Realice filtrado y consulta de sus datos para obtener información valiosa
- Basado en Apache Lucene y proporciona API RESTful
- Proporciona escalabilidad horizontal, confiabilidad y capacidad multiinquilino para el uso de indexación en tiempo real para agilizar la búsqueda.
- Te ayuda a escalar vertical y horizontalmente.
Términos importantes utilizados en Elastic Search
Ahora, en este tutorial de ELK, aprendamos sobre los términos clave utilizados en ElasticSearch:
| Término | Uso |
|---|---|
| Cluster | Un clúster es una colección de nodos que juntos contienen datos y brindan capacidades conjuntas de indexación y búsqueda. |
| Nodo | Un nodo es una instancia de elasticsearch. Se crea cuando comienza una instancia de elasticsearch. |
| Home | Un índice es una colección de documentos que tienen características similares, por ejemplo, datos de clientes o catálogos de productos. Es muy útil para realizar operaciones de indexación, búsqueda, actualización y eliminación. Permite definir tantos índices como se desee en un único clúster. |
| Comparación de | Es la unidad básica de información que se puede indexar. Se expresa en par JSON (clave: valor). '{"usuario": "nullcon"}'. Cada documento está asociado con un tipo y una identificación única. |
| Casco | Cada índice se puede dividir en varios fragmentos para poder distribuir los datos. El fragmento es la parte atómica de un índice, que se puede distribuir por el clúster si desea agregar más nodos. |
¿Qué es Logstash?
Logstash es la herramienta de canalización de recopilación de datos. Recopila entradas de datos y las introduce en Elasticsearch. Recopila todo tipo de datos de diferentes fuentes y los pone a disposición para su uso posterior.
Logstash puede unificar datos de fuentes dispares y normalizar los datos en los destinos deseados. Le permite limpiar y democratizar todos sus datos para análisis y visualización de casos de uso.
Consta de tres componentes:
- Entrada: pasar registros para procesarlos en un formato comprensible para la máquina
- Filtros: Es un conjunto de condiciones para realizar una acción o evento particular
- Salida: Tomador de decisiones para el evento o registro procesado
Caracteristicas de Logstash
Ahora, en este tutorial de LogStash, aprendamos sobre las características de LogStash:
- Los eventos pasan a través de cada fase utilizando colas internas.
- Permite diferentes entradas para sus registros.
- Filtrado/análisis de sus registros
Ventaja de Logstash
- Ofertas centralizan el procesamiento de datos.
- Analiza una gran variedad de datos y eventos estructurados/no estructurados.
- ELK LogStash ofrece complementos para conectarse con varios tipos de fuentes de entrada y plataformas
¿Qué es Kibana?
Kibana es una herramienta de visualización de datos que completa la pila ELK. Esta herramienta se utiliza para visualizar los documentos de Elasticsearch y ayuda a los desarrolladores a obtener una visión rápida de ellos. El panel de control de Kibana ofrece varios diagramas interactivos, datos geoespaciales y gráficos para visualizar documentos complejos.
Se puede utilizar para buscar, ver e interactuar con datos almacenados en directorios de Elasticsearch. Kibana te ayuda a realizar tareas avanzadas análisis de los datos y visualice sus datos en una variedad de tablas, gráficos y mapas.
En Kibana existen diferentes métodos para realizar búsquedas sobre tus datos.
Estos son los tipos de búsqueda más comunes:
| Tipo de búsqueda | Uso |
|---|---|
| Búsquedas de texto libre | Se utiliza para buscar una cadena específica. |
| Búsquedas a nivel de campo | Se utiliza para buscar una cadena dentro de un campo específico. |
| Declaraciones lógicas | Se utiliza para combinar búsquedas en una declaración lógica. |
| Búsquedas de proximidad | Se utiliza para buscar términos dentro de la proximidad de un carácter específico. |
Ahora, en este tutorial de Kibana, aprendamos sobre las características importantes de Kibana:
Características de Kinbana:
- Potente panel frontal que es capaz de visualizar información indexada del clúster elástico
- Permite la búsqueda en tiempo real de información indexada.
- Puede buscar, ver e interactuar con datos almacenados en Elasticsearch
- Ejecute consultas sobre datos y visualice resultados en gráficos, tablas y mapas.
- Panel de control configurable para segmentar y analizar registros de Logstash en Elasticsearch
- Capaz de proporcionar datos históricos en forma de gráficos, tablas, etc.
- Paneles de control en tiempo real fácilmente configurables
- Kibana ElasticSearch permite la búsqueda en tiempo real de información indexada
Ventajas y desventajas de Kinbana
- Fácil visualización
- Totalmente integrado con Elasticsearch
- Herramienta de visualización
- Ofrece capacidades de análisis, gráficos, resúmenes y depuración en tiempo real.
- Proporciona una interfaz instintiva y fácil de usar
- Permite compartir instantáneas de los registros buscados.
- Permite guardar el panel y administrar múltiples paneles.
¿Por qué el análisis de registros?
En las infraestructuras de entornos basados en la nube, el rendimiento y el aislamiento son muy importantes. El rendimiento de las máquinas virtuales en la nube puede variar según las cargas específicas, los entornos y la cantidad de usuarios activos en el sistema. Por lo tanto, la confiabilidad y la falla del nodo pueden convertirse en un problema importante.
Plataforma de gestión de registros Puede monitorear todos los problemas mencionados anteriormente, así como procesar registros del sistema operativo, NGINX, registros del servidor IIS para análisis de tráfico web, registros de aplicaciones y registros en AWS (Amazon servicios web).
La gestión de registros ayuda a los ingenieros de DevOps y administradores de sistemas a tomar mejores decisiones comerciales. Por lo tanto, el análisis de registros mediante Elastic Stack o herramientas similares es importante.
ELK contra Splunk
| Alce | Splunk |
|---|---|
| Elk es una herramienta de código abierto | Splunk es una herramienta comercial. |
| La pila de alces no ofrece Solaris Portabilidad gracias a Kibana. | Ofertas especiales Solaris Portabilidad. |
| La velocidad de procesamiento está estrictamente limitada. | Ofrece procesos precisos y rápidos. |
| ELK es una pila de tecnología creada con la combinación Elastic Search-Logstash-Kibana. | Splunk es una herramienta propietaria. Proporciona soluciones tanto locales como en la nube. |
| En ELK, la búsqueda, el análisis y la visualización solo serán posibles después de configurar la pila ELK. | Splunk es un paquete completo de gestión de datos a tu disposición. |
| La herramienta ELK no admite la integración con otras herramientas. | Splunk es una herramienta útil para configurar integraciones con otras herramientas. |
Casos de Estudio
NetFlix
Netflix Depende en gran medida de la pila ELK. La empresa utiliza la pila ELK para monitorear y analizar el registro de seguridad de las operaciones de servicio al cliente. Les permite indexar, almacenar y buscar documentos de más de quince grupos que comprenden casi 800 nodos.
El famoso sitio de marketing en redes sociales LinkedIn utiliza la pila ELK para supervisar el rendimiento y la seguridad. El equipo de TI integró ELK con Kafka para respaldar su carga en tiempo real. Su operación ELK incluye más de 100 clústeres en seis centros de datos diferentes.
Tripwire
Tripwire es un sistema mundial de gestión de eventos de información de seguridad. La empresa utiliza ELK para respaldar el análisis de registros de paquetes de información.
Media
Medium es una famosa plataforma de publicación de blogs. Utilizan la pila ELK para depurar sus problemas de producción. La empresa también utiliza ELK para detectar DynamoDB ollas calientes. Además, al utilizar esta pila, la empresa puede admitir 25 millones de lectores únicos, así como miles de publicaciones publicadas cada semana.
Ventajas y desventajas de la pila ELK
Ventajas
- ELK funciona mejor cuando los registros de varias aplicaciones de una empresa convergen en una única instancia de ELK
- Proporciona información sorprendente para esta única instancia y también elimina la necesidad de iniciar sesión en cientos de fuentes de datos de registro diferentes.
- Instalación rápida en las instalaciones
- Fácil de implementar Escalas vertical y horizontalmente
- Elastic ofrece una gran cantidad de clientes de idiomas que incluyen Ruby. Python. PHP, Perl, .NET, Java y JavaGuión y más
- Disponibilidad de bibliotecas para diferentes lenguajes de programación y scripting.
Desventajas
- Los diferentes componentes de la pila pueden resultar difíciles de manejar cuando se pasa a una configuración compleja.
- No hay nada como prueba y error. Por lo tanto, cuanto más haces, más aprendes en el camino.
Resumen
- El registro centralizado puede resultar útil al intentar identificar problemas con servidores o aplicaciones.
- La pila de servidores ELK es útil para resolver problemas relacionados con el sistema de registro centralizado
- ELK stack es una colección de tres herramientas de código abierto Elasticsearch, Logstash Kibana
- Elasticsearch es una base de datos NoSQL
- Logstash es la herramienta de canalización de recopilación de datos
- Kibana es una visualización de datos que completa la pila ELK
- En infraestructuras de entornos basados en la nube, el rendimiento y el aislamiento son muy importantes
- En ELK la velocidad de procesamiento de la pila está estrictamente limitada mientras que Splunk ofrece procesos precisos y rápidos
- Netflix, LinkedIn, Tripware y Medium utilizan ELK stack para sus negocios
- ELK Syslog funciona mejor cuando los registros de varias aplicaciones de una empresa convergen en una única instancia de ELK
- Los diferentes componentes de la pila pueden resultar difíciles de manejar cuando se pasa a una configuración compleja.
Consulte nuestro Preguntas y respuestas de la entrevista de ElasticSearch para candidatos nuevos y experimentados.


