50 questions et réponses d'entretien d'apprentissage automatique (2024)

Voici les questions et réponses d'entretien d'apprentissage automatique pour les candidats les plus récents et les plus expérimentés pour obtenir l'emploi de leurs rêves.

 

Questions et réponses sur Machine Learning Viva pour les débutants

1) Qu’est-ce que l’apprentissage automatique ?

L'apprentissage automatique est une branche de l'informatique qui traite de la programmation système afin d'apprendre automatiquement et de s'améliorer avec l'expérience. Par exemple : les robots sont programmés pour pouvoir effectuer la tâche en fonction des données qu'ils collectent à partir de capteurs. Il apprend automatiquement les programmes à partir des données.

👉 Téléchargement PDF gratuit : Questions et réponses sur l'entretien d'apprentissage automatique >>


2) Mentionner la différence entre le Data Mining et le Machine learning ?

L'apprentissage automatique concerne l'étude, la conception et le développement d'algorithmes qui donnent aux ordinateurs la capacité d'apprendre sans être explicitement programmés. Tandis que l'exploration de données peut être définie comme le processus dans lequel les données non structurées tentent d'extraire des connaissances ou des modèles intéressants inconnus. Au cours de ce processus machine, des algorithmes d'apprentissage sont utilisés.


3) Qu'est-ce que le « surapprentissage » dans l'apprentissage automatique ?

In machine learning, lorsqu'un modèle statistique décrit une erreur aléatoire ou du bruit au lieu d'une relation sous-jacente, un « surajustement » se produit. Quand un modèle est excessivement complex, un surajustement est normalement observé, en raison du trop grand nombre de paramètres par rapport au nombre de types de données d'entraînement. Le modèle présente des performances médiocres qui ont été surajustées.


4) Pourquoi le surapprentissage se produit-il ?

La possibilité de surajustement existe car les critères utilisés pour entraîner le modèle ne sont pas les mêmes que les critères utilisés pour juger de l'efficacité d'un modèle.


5) Comment éviter le surapprentissage ?

En utilisant beaucoup de données, le surajustement peut être évité, le surajustement se produit relativement lorsque vous disposez d'un petit ensemble de données et que vous essayez d'en tirer des leçons. Mais si vous avez une petite base de données et que vous êtes obligé de proposer un modèle basé sur celle-ci. Dans une telle situation, vous pouvez utiliser une technique connue sous le nom de validation croisée. Dans cette méthode, l'ensemble de données est divisé en deux sections, les ensembles de données de test et d'entraînement, l'ensemble de données de test testera uniquement le modèle tandis que, dans l'ensemble de données d'entraînement, les points de données proposeront le modèle.

Dans cette technique, un modèle reçoit généralement un ensemble de données de données connues sur lesquelles la formation (ensemble de données de formation) est exécutée et un ensemble de données de données inconnues par rapport auquel le modèle est testé. L'idée de la validation croisée est de définir un ensemble de données pour « tester » le modèle en phase de formation.


6) Qu’est-ce que l’apprentissage automatique inductif ?

L'apprentissage automatique inductif implique le processus d'apprentissage par exemples, dans lequel un système, à partir d'un ensemble d'instances observées, tente d'induire une règle générale.


7) Quels sont les cinq algorithmes populaires du Machine Learning ?

  • Arbres de décision
  • Réseaux de neurones (rétropropagation)
  • Réseaux probabilistes
  • Nearest Voisin
  • Machines à vecteurs de soutien

8) Quelles sont les différentes techniques d’algorithmes en Machine Learning ?

Les différents types de techniques de Machine Learning sont


9) Quelles sont les trois étapes pour construire les hypothèses ou le modèle en machine learning ?

  • Construction de modèles
  • Test de modèle
  • Application du modèle

10) Quelle est l’approche standard de l’apprentissage supervisé ?

L’approche standard de l’apprentissage supervisé consiste à diviser l’ensemble d’exemples en ensemble de formation et en test.


11) Qu'est-ce que « Ensemble de formation » et « Ensemble de test » ?

Dans divers domaines des sciences de l'information comme l'apprentissage automatique, un ensemble de données est utilisé pour découvrir la relation potentiellement prédictive connue sous le nom de « ensemble de formation ». L'ensemble de formation est un exemple donné à l'apprenant, tandis que l'ensemble de test est utilisé pour tester l'exactitude des hypothèses générées par l'apprenant, et il s'agit de l'ensemble d'exemples retenus par l'apprenant. L’ensemble de formation est distinct de l’ensemble de test.


12) Énumérez différentes approches d’apprentissage automatique ?

Les différentes approches du Machine Learning sont

  • Apprentissage du concept par rapport à la classification
  • Apprentissage symbolique vs statistique
  • Apprentissage inductif vs analytique

13) Qu'est-ce qui n'est pas du Machine Learning ?


14) Expliquez quelle est la fonction de « l'apprentissage non supervisé » ?

  • Rechercher des clusters de données
  • Trouver des représentations de faible dimension des données
  • Trouver des directions intéressantes dans les données
  • Coordonnées et corrélations intéressantes
  • Trouver de nouvelles observations/nettoyage de bases de données

15) Expliquez quelle est la fonction de « l'apprentissage supervisé » ?

  • Classifications
  • Reconnaissance de la parole
  • Régression
  • Prédire des séries chronologiques
  • Annoter des chaînes

16) Qu’est-ce que l’apprentissage automatique indépendant des algorithmes ?

L'apprentissage automatique dans lequel les fondements mathématiques sont indépendants de tout classificateur ou algorithme d'apprentissage particulier est appelé apprentissage automatique indépendant de l'algorithme ?


17) Quelle est la différence entre l’apprentissage artificiel et l’apprentissage automatique ?

La conception et le développement d'algorithmes en fonction de comportements basés sur des données empiriques sont connus sous le nom d'apprentissage automatique. Si l’intelligence artificielle, en plus de l’apprentissage automatique, couvre également d’autres aspects comme la représentation des connaissances, le traitement du langage naturel, la planification, la robotique, etc.


18) Qu'est-ce qu'un classificateur dans l'apprentissage automatique ?

Un classificateur dans un Machine Learning est un système qui entre un vecteur de valeurs de caractéristiques discrètes ou continues et génère une seule valeur discrète, la classe.


19) Quels sont les avantages de Naive Bayes ?

Dans Naïve Bayes, le classificateur convergera plus rapidement que les modèles discriminants comme la régression logistique, vous aurez donc besoin de moins de données de formation. Le principal avantage est qu’il ne peut pas apprendre les interactions entre les fonctionnalités.


20) Dans quels domaines la reconnaissance de formes est-elle utilisée ?

La reconnaissance de formes peut être utilisée dans

  • Vision par ordinateur
  • Reconnaissance vocale
  • Data Mining
  • Statistique
  • Récupération informelle
  • Bio-informatique

Questions d'entretien sur l'apprentissage automatique pour les expérimentés

21) Qu'est-ce que la programmation génétique ?

La programmation génétique est l'une des deux techniques utilisées en apprentissage automatique. Le modèle est basé sur les tests et la sélection du meilleur choix parmi un ensemble de résultats.


22) Qu'est-ce que la programmation logique inductive dans l'apprentissage automatique ?

La programmation logique inductive (ILP) est un sous-domaine de l'apprentissage automatique qui utilise une programmation logique représentant des connaissances de base et des exemples.


23) Qu'est-ce que la sélection de modèles dans l'apprentissage automatique ?

Le processus de sélection de modèles parmi différents modèles mathématiques, utilisés pour décrire le même ensemble de données, est appelé sélection de modèle. La sélection de modèles est appliquée aux domaines des statistiques, de l'apprentissage automatique et de l'exploration de données.


24) Quelles sont les deux méthodes utilisées pour le calibrage en apprentissage supervisé ?

Les deux méthodes utilisées pour prédire les bonnes probabilités en apprentissage supervisé sont

  • Étalonnage Platt
  • Régression isotonique

Ces méthodes sont conçues pour une classification binaire, et ce n'est pas trivial.


25) Quelle méthode est fréquemment utilisée pour éviter le surapprentissage ?

Lorsqu'il y a suffisamment de données, la « régression isotonique » est utilisée pour éviter un problème de surapprentissage.


26) Quelle est la différence entre l'heuristique pour l'apprentissage de règles et l'heuristique pour les arbres de décision ?

La différence est que les heuristiques des arbres de décision évaluent la qualité moyenne d'un certain nombre d'ensembles disjoints, tandis que les apprenants de règles évaluent uniquement la qualité de l'ensemble d'instances couvert par la règle candidate.


27) Qu'est-ce que Perceptron dans l'apprentissage automatique ?

Dans le Machine Learning, Perceptron est un algorithme d'apprentissage supervisé pour les classificateurs binaires où un classificateur binaire est une fonction déterminante pour savoir si une entrée représente un vecteur ou un nombre.


28) Expliquez les deux composantes du programme logique bayésien ?

Le programme logique bayésien se compose de deux composants. Le premier élément est logique ; il consiste en un ensemble de clauses bayésiennes, qui capturent la structure qualitative du domaine. Le deuxième composant est quantitatif, il code les informations quantitatives sur le domaine.


29) Que sont les réseaux bayésiens (BN) ?

Le réseau bayésien est utilisé pour représenter le modèle graphique de la relation de probabilité entre un ensemble de variables.


30) Pourquoi un algorithme d'apprentissage basé sur des instances est parfois appelé algorithme d'apprentissage paresseux ?

L'algorithme d'apprentissage basé sur l'instance est également appelé algorithme d'apprentissage paresseux car il retarde le processus d'induction ou de généralisation jusqu'à ce que la classification soit effectuée.


31) Quelles sont les deux méthodes de classification que SVM (Support Vector Machine) peut gérer ?

  • Combinaison de classificateurs binaires
  • Modification du binaire pour intégrer l'apprentissage multiclasse

32) Qu’est-ce que l’apprentissage d’ensemble ?

Pour résoudre un programme informatique particulier, plusieurs modèles tels que des classificateurs ou des experts sont générés et combinés de manière stratégique. Ce processus est connu sous le nom d’apprentissage d’ensemble.


33) Pourquoi l'apprentissage d'ensemble est-il utilisé ?

L'apprentissage d'ensemble est utilisé pour améliorer la classification, la prédiction, l'approximation des fonctions, etc. d'un modèle.


34) Quand utiliser l’apprentissage d’ensemble ?

L'apprentissage d'ensemble est utilisé lorsque vous créez des classificateurs de composants plus précis et indépendants les uns des autres.


35) Quels sont les deux paradigmes des méthodes d'ensemble ?

Les deux paradigmes des méthodes d'ensemble sont

  • Méthodes d'ensemble séquentielles
  • Méthodes d'ensembles parallèles

36) Quel est le principe général d'une méthode d'ensemble et qu'est-ce que le bagging et le boosting dans la méthode d'ensemble ?

Le principe général d'une méthode d'ensemble est de combiner les prédictions de plusieurs modèles construits avec un algorithme d'apprentissage donné afin d'améliorer la robustesse sur un modèle unique. L'ensachage est une méthode d'ensemble permettant d'améliorer les schémas d'estimation ou de classification instables. Tandis que la méthode de boosting est utilisée séquentiellement pour réduire le biais du modèle combiné. Le boosting et le bagging peuvent tous deux réduire les erreurs en réduisant le terme de variance.


37) Qu'est-ce que la décomposition biais-variance de l'erreur de classification dans la méthode d'ensemble ?

L'erreur attendue d'un algorithme d'apprentissage peut être décomposée en biais et en variance. Un terme de biais mesure dans quelle mesure le classificateur moyen produit par l'algorithme d'apprentissage correspond à la fonction cible. Le terme de variance mesure dans quelle mesure la prédiction de l'algorithme d'apprentissage fluctue pour différents ensembles d'apprentissage.


38) Qu'est-ce qu'un algorithme d'apprentissage incrémental en ensemble ?

La méthode d'apprentissage incrémental est la capacité d'un algorithme à apprendre à partir de nouvelles données qui peuvent être disponibles une fois que le classificateur a déjà été généré à partir d'un ensemble de données déjà disponible.


39) A quoi servent PCA, KPCA et ICA ?

PCA (Principal Components Analysis), KPCA (Kernel based Principal Component Analysis) et ICA (Independent Component Analysis) sont des techniques d'extraction de caractéristiques importantes utilisées pour la réduction de dimensionnalité.


40) Qu'est-ce que la réduction de dimension dans le Machine Learning ?

Dans l'apprentissage automatique et les statistiques, la réduction de dimension est le processus de réduction du nombre de variables aléatoires prises en compte et peut être divisée en sélection de fonctionnalités et extraction de fonctionnalités.


41) Que sont les machines à vecteurs de support ?

Les machines à vecteurs de support sont des algorithmes d'apprentissage supervisé utilisés pour l'analyse de classification et de régression.


42) Quelles sont les composantes des techniques d’évaluation relationnelle ?

Les composants importants des techniques d’évaluation relationnelle sont

  • Acquisition de données
  • Acquisition de la vérité sur le terrain
  • Technique de validation croisée
  • Type de requête
  • Métrique de notation
  • Test de signification

43) Quelles sont les différentes méthodes d’apprentissage séquentiel supervisé ?

Les différentes méthodes pour résoudre les problèmes d’apprentissage supervisé séquentiel sont

  • Méthodes de fenêtre coulissante
  • Fenêtres coulissantes récurrentes
  • Modèles Markow cachés
  • Modèles de Markow à entropie maximale
  • Champs aléatoires conditionnels
  • Réseaux de transformateurs graphiques

44) Quels sont les domaines de la robotique et du traitement de l'information où se pose un problème de prédiction séquentielle ?

Les domaines de la robotique et du traitement de l'information où se pose un problème de prédiction séquentielle sont

  • Apprentissage par imitation
  • Prédiction structurée
  • Apprentissage par renforcement basé sur un modèle

45) Qu'est-ce que l'apprentissage statistique par lots ?

Les techniques d'apprentissage statistique permettent d'apprendre une fonction ou un prédicteur à partir d'un ensemble de données observées qui peuvent faire des prédictions sur des données invisibles ou futures. Ces techniques fournissent des garanties sur les performances du prédicteur appris sur les données futures invisibles, basées sur une hypothèse statistique sur le processus de génération de données.


46) Qu’est-ce que l’apprentissage PAC ?

L'apprentissage PAC (Probablement approximativement correct) est un cadre d'apprentissage qui a été introduit pour analyser les algorithmes d'apprentissage et leur efficacité statistique.


47) Quelles sont les différentes catégories que vous pouvez catégoriser dans le processus d'apprentissage séquentiel ?

  • Prédiction de séquence
  • Génération de séquences
  • Reconnaissance de séquence
  • Décision séquentielle

48) Qu'est-ce que l'apprentissage séquentiel ?

L'apprentissage séquentiel est une méthode d'enseignement et d'apprentissage de manière logique.


49) Quelles sont les deux techniques d'apprentissage automatique ?

Les deux techniques de Machine Learning sont

  • Programmation génétique
  • Apprentissage inductif

50) Donnez une application populaire de l’apprentissage automatique que vous voyez quotidiennement ?

Le moteur de recommandation mis en place par les grands sites e-commerce utilise le Machine Learning.

Ces questions d'entretien vous aideront également dans votre soutenance