Топ-40 запитань і відповідей на інтерв’ю ElasticSearch (2025)
Ось питання та відповіді на співбесіді ElasticSearch для нових і досвідчених кандидатів, щоб отримати роботу своєї мрії.
Запитання та відповіді на співбесіді ElasticSearch для першокурсників
1) Що таке Elasticsearch?
Elasticsearch — це a База даних NoSQL. Він базується на пошуковій системі Lucene та створений за допомогою RESTful APIS. Він пропонує просте розгортання, максимальну надійність і просте керування. Він також надає розширені запити для виконання детального аналізу та централізовано зберігає всі дані. Допомагає здійснювати швидкий пошук документів.
2) Які важливі функції Elasticsearch?
Ось важливі функції Elasticsearch:
- Пошуковий сервер із відкритим кодом, написаний за допомогою Java.
- Використовується для індексування різнорідних даних будь-якого типу
- Має веб-інтерфейс REST API з виведенням JSON
- Повнотекстовий пошук
- Пошук майже в реальному часі (NRT).
- Сховище документів у форматі JSON із можливістю реплікації та пошуку.
- Розподілене сховище документів на основі REST і JSON без схем
- Підтримка кількох мов і геолокації
3) Що таке a Cluster?
Кластер — це набір вузлів, які разом зберігають дані та забезпечують об’єднані можливості індексування та пошуку.
4) Поясніть індекс
Вузол — це екземпляр еластичного пошуку. Він створюється, коли починається екземпляр elasticsearch.
5) Що таке документ у еластичному пошуку?
У еластичному пошуку документ є основною одиницею інформації, яку можна проіндексувати. Виражається в JSON (key: value) pair. '{"user": "nullcon"}'
. Кожен окремий документ пов’язаний із типом і унікальним ідентифікатором.
6) Дайте визначення терміну Shard
Кожен індекс можна розбити на кілька сегментів, щоб мати можливість розподіляти дані. Шард — це атомарна частина індексу, яку можна розподілити по кластеру, якщо ви хочете додати більше вузлів.
7) Які важливі переваги еластичного пошуку?
Ось важливі переваги Elasticsearch:
- Зберігайте дані без схеми, а також створюйте схему для ваших даних.
- Керуйте своїми записами даних за записами за допомогою багатодокументних API
- Виконуйте фільтрацію та надсилайте запити на дані, щоб отримати статистику
- Базується на Apache Lucene та забезпечує RESTful API
- Він забезпечує горизонтальну масштабованість, надійність і багатокористувацький потенціал для використання індексування в реальному часі.
- Допомагає масштабувати по вертикалі та горизонталі
8) Що таке стек ELK?
Команда Стек ЛОСИ це набір із трьох відкритих продуктів — Elasticsearch, Logstashі Кібана. Усі вони розроблені, керуються та обслуговуються компанією Elastic.
- E означає ElasticSearch: Використовується для зберігання журналів.
- L означає LogStash: Використовується як для транспортування, так і для обробки та зберігання колод.
- K означає Kibana: Це інструмент візуалізації (веб-інтерфейс), який розміщується через Nginx або Apache.
9) Поясніть архітектуру стеку ELK
ELK Stack розроблений, щоб дозволити користувачам отримувати дані з будь-якого джерела в будь-якому форматі, а також шукати, аналізувати та візуалізувати ці дані в режимі реального часу.
- Журнали: Визначаються серверні журнали, які потрібно проаналізувати
- Logstash: Збирайте журнали та дані про події. Він навіть аналізує та перетворює дані.
- ElasticSearch: Перетворені дані з Logstash можна зберігати, шукати та індексувати.
- Кібана: Kibana використовує Elasticsearch DB для дослідження, візуалізації та спільного використання
10) Яка причина використання стека ELK?
Ось причини використання стека ELK:
- ELK працює найкраще, коли журнали з різних додатків підприємства об’єднуються в один екземпляр ELK
- Він надає дивовижну інформацію для цього єдиного екземпляра, а також усуває необхідність входу в сотні різних джерел даних журналу.
- Швидке встановлення на місці
- Легко розгорнути ваги вертикально та горизонтально
- Elastic пропонує безліч мовних клієнтів, зокрема Ruby. Python. PHP, Perl, .NET, Java та JavaScript, і більше
- Наявність бібліотек для різних мов програмування та скриптів
11) Поясніть Tokenizer в ElasticSearch
Розбивка полів Tokenizer визначає, які значення документа в потік. Інвертовані індекси створюються та оновлюються за допомогою цих значень. Після цього цей потік значень зберігається в документі.
12) Що таке репліка в ElasticSearch?
Кожен шард в ElasticSearch має 2 копії, які називаються репліками. Вони допомагають вам досягти високої доступності та відмовостійкості.
13) Які основні Operaції, які можна виконати на документі?
Ось важливі операції, які виконуються з документами:
- Індексація документа
- Отримання документів
- Оновлення документів
- Видалення документів
14) Що таке a Cluster в Elasticsearch?
Cluster це набір з одного або кількох вузлів, який містить усі ваші дані та пропонує можливості об’єднаного індексування та пошуку на всіх вузлах.
15) Як можна видалити індекс у еластичному пошуку?
Щоб видалити індекс в Elasticsearch, вам потрібно написати команду:
DELETE /index name.
Наприклад, DELETE /website
.
16) Поясніть метод додавання відображення в індекс
Elasticsearch дозволяє створювати відображення відповідно до даних, наданих користувачем у тілі запиту. Його групову функцію можна використовувати для додавання більше одного об’єкта JSON до індексу.
Наприклад, POST website /_bulk
.
17) Які є різні способи пошуку в Elasticsearch?
Нижче наведено спосіб пошуку в Elasticsearch:
Багатоіндексний, багатотиповий пошук: Ви можете шукати API, які можна застосувати до всіх кількох індексів, використовуючи систему підтримки кількох індексів.
У еластичному пошуку ми можемо створювати певні теги для всіх індексів, для всіх індексів і всіх типів.
- Пошук URI: Запит на пошук виконується за допомогою URI шляхом надання запитуваних параметрів.
- Запит на обшук тіла: Пошуковий запит має бути виконано пошуковим DSL. Він містить запит DSL у тілі.
18) Яка остання версія Elasticsearch?
Остання версія Elastic Search від січня 2020 р., яка є останньою та стабільною версією Elasticsearch.
19) Що таке відображення?
Зіставлення — це процес, який допомагає визначити, як документ зіставляється з пошуковою системою. Його характеристики пошуку включають включені поля, які токенізовані, а також доступні для пошуку.
20) Де зберігається Elastic Search?
Ви можете зберігати Elasticsearch — це розподілений документ, який є сховищем із різними типами каталогів. Ви також можете отримати складні структури даних, які можна серіалізувати як документи JSON.
Запитання та відповіді на співбесіді ElasticSearch для досвідчених
21) Що таке Apache Lucene?
Apache Lucene — це бібліотека програмного забезпечення для пошуку інформації з відкритим кодом. Це спочатку написано в Java мова.
22) Ось важливий інструмент керування конфігурацією, який підтримує Elasticsearch:
- Маріонетка – маріонетка-еластичний пошук
- Chef – кулінарна книга-elasticsearch
- Ansible – анзибльно-еластичний пошук
23) Що таке NRT в Elasticsearch?
NRT є повною формою платформи (пошуку майже в реальному часі). Це пошукова платформа майже в реальному часі. Це означає, що є невелика затримка (здебільшого одна секунда) від моменту індексування документа до моменту, коли він стає дуже доступним для пошуку.
24) Де ви налаштовуєте параметри для X-Pack?
Ви можете налаштувати параметри для X-Pack. Він має функції у файлах конфігурації elasticsearch, logstash і kibana.yml (стек ELK).
25) Що таке cat API в Elasticsearch?
Ці команди приймають параметр рядка запиту. Це допомагає побачити всю інформацію, заголовки та інформацію, яку вони надають, а також команду /_cat, яка дозволяє вам перелічити всі доступні команди.
26) Які різні команди доступні в Elasticsearch cat API?
Команди, які використовуються з cat API:
- Псевдоніми котів, розподіл котів, кількість котів, дані поля котів
- Здоров’я котів, індекси котів, майстер котів, незавершені завдання, плагіни котів, відновлення котів
- репозиторії котів, знімки котів, шаблони котів
27) Що таке Ingest node?
Вузол прийому використовується для попередньої обробки документів перед фактичним індексуванням документа. Це допомагає вам перехоплювати масові та індексувати запити. Він також застосовує перетворення, а потім передає документи назад до групового API та індексу.
28) Які є різні способи використання команд X-Pack?
Ось команди X-Pack, які допоможуть вам налаштувати безпеку:
- Certgen
- мігрувати
- syskeygen
- Certutil
- saml-метадані
- налаштування паролів
- користувачі
29) Що таке API єдиного документа в Elasticsearch?
- Отримати API
- API індексу
- Видалити API
- Оновити API
30) Поясніть Explore API в Elasticsearch
Graph explore API дозволяє отримувати та узагальнювати інформацію щодо документів.
31) Як можна створити індекс в Elasticsearch?
Наприклад:
PUT /client?pretty
GET /_cat/indices?v
32) Що таке агрегації?
Структура агрегацій допомагає надавати зведені дані на основі пошукового запиту. Він заснований на простих будівельних блоках, відомих як агрегації. Його можна скласти для створення складних підсумків даних.
33) Чи є у Elasticsearch схему?
Зіставлення ElasticSearch, які можна використовувати для застосування схеми до документів.
34) Що таке Query DSL в Elasticsearch?
Elasticsearch пропонує повний DSL запитів (доменоспецифічна мова) на основі JSON для визначення запитів.
35) Що таке Elasticsearch Data Node?
Вузли даних містять сегменти, які обробляють індексовані документи. Вони допомагають вам виконувати пов’язані з даними CRUD та операції агрегації пошуку тощо. Однак вам потрібно встановити node.data=true, щоб зробити вузол вузлом даних.
36) Що таке документ в ElasticSearch?
Документ дуже схожий на рядок у реляційних базах даних. Кожен документ в індексі має різну структуру, але має однаковий тип даних для відповідних полів.
- MySQL => Бази даних => Таблиці => Стовпці/Рядки
- ElasticSearch => Індекси => Типи => Документи з властивостями
37) Поясніть тип у ElasticSearch
Тип — логічний розділ індексу, семантика якого залежить від користувача.
38) Що таке мова запитів Elasticsearch?
Мова запитів Apache Lucene, яка також відома як Query DSL, використовується Elasticsearch.
39) Що таке динамічне відображення в Elasticsearch?
Динамічне відображення допомагає користувачеві індексувати документи без небажаних конфігурацій для імені поля. Натомість його буде додано автоматично через Elasticsearch з деякими спеціальними правилами.
40) Що таке нечіткий пошук Elasticsearch?
Нечіткий пошук — це процес, під час якого необхідно ідентифікувати розташування документа на веб-сторінці. Це нагадує пошуковий аргумент. Це також працює, коли аргумент не має відношення до кореспондента пошуку певної інформації.
Ці запитання для співбесіди також допоможуть вам у життєдіяльності (усному)