Apprentissage supervisé et non supervisé : différence entre eux

Différence clé entre l'apprentissage supervisé et non supervisé

  • En apprentissage supervisé, vous entraînez la machine à l’aide de données bien « étiquetées ».
  • L'apprentissage non supervisé est une technique d'apprentissage automatique dans laquelle vous n'avez pas besoin de superviser le modèle.
  • L'apprentissage supervisé vous permet de collecter des données ou de produire un résultat de données à partir de l'expérience précédente.
  • L'apprentissage automatique non supervisé vous aide à trouver toutes sortes de modèles inconnus dans les données.
  • La régression et la classification sont deux types de techniques d'apprentissage automatique supervisé.
  • ClusterL'apprentissage et l'association sont deux types d'apprentissage non supervisé.
  • Dans un modèle d'apprentissage supervisé, les variables d'entrée et de sortie seront fournies, tandis que dans un modèle d'apprentissage non supervisé, seules les données d'entrée seront fournies.

Qu'est-ce que l'apprentissage automatique supervisé ?

En apprentissage supervisé, vous entraînez la machine à l’aide de données bien « étiqueté.» Cela signifie que certaines données sont déjà étiquetées avec la bonne réponse. Il peut être comparé à un apprentissage qui se déroule en présence d'un encadrant ou d'un enseignant.

Un algorithme d'apprentissage supervisé apprend à partir de données d'entraînement étiquetées et vous aide à prédire les résultats des données imprévues. La création, la mise à l'échelle et le déploiement réussis d'un modèle de science des données d'apprentissage automatique supervisé précis nécessitent du temps et l'expertise technique d'une équipe de scientifiques des données hautement qualifiés. De plus, le Data scientist doit reconstruire les modèles pour s'assurer que les informations fournies restent vraies jusqu'à ce que ses données changent.

Qu'est-ce que l'apprentissage non supervisé ?

L'apprentissage non supervisé est une technique d'apprentissage automatique dans laquelle vous n'avez pas besoin de superviser le modèle. Au lieu de cela, vous devez permettre au modèle de fonctionner seul pour découvrir des informations. Il traite principalement des données non étiquetées.

Apprentissage non supervisé algorithms vous permettre d'effectuer plus de complex tâches de traitement par rapport à l’apprentissage supervisé. Cependant, l’apprentissage non supervisé peut être plus imprévisible que d’autres méthodes d’apprentissage naturel, d’apprentissage en profondeur et d’apprentissage par renforcement.

Pourquoi un apprentissage supervisé ?

  • L'apprentissage supervisé vous permet de collecter des données ou de produire un résultat de données à partir de l'expérience précédente.
  • Vous aide à optimiser les critères de performance en utilisant l’expérience
  • L'apprentissage automatique supervisé vous aide à résoudre différents types de problèmes de calcul réels.

Pourquoi un apprentissage non supervisé ?

Voici les principales raisons d’utiliser l’apprentissage non supervisé :

  • L’apprentissage automatique non supervisé détecte toutes sortes de modèles inconnus dans les données.
  • Les méthodes non supervisées vous aident à trouver des fonctionnalités qui peuvent être utiles pour la catégorisation.
  • Elle se déroule en temps réel, donc toutes les données d'entrée doivent être analysées et étiquetées en présence des apprenants.
  • Il est plus facile d'obtenir des données non étiquetées à partir d'un ordinateur que des données étiquetées, qui nécessitent une intervention manuelle.

Comment fonctionne l’apprentissage supervisé ?

Par exemple, vous souhaitez former une machine pour vous aider à prédire combien de temps il vous faudra pour rentrer chez vous depuis votre lieu de travail. Ici, vous commencez par créer un ensemble de données étiquetées. Ces données comprennent

  • Conditions météorologiques
  • Moment de la journée
  • Vacances

Tous ces details sont vos entrées. Le résultat correspond au temps qu'il a fallu pour rentrer chez soi ce jour-là.

Comment fonctionne l'apprentissage supervisé
Comment fonctionne l'apprentissage supervisé

Vous savez instinctivement que s’il pleut dehors, il vous faudra plus de temps pour rentrer chez vous. Mais la machine a besoin de données et de statistiques.

Voyons maintenant comment développer un modèle d'apprentissage supervisé de cet exemple qui aide l'utilisateur à déterminer le temps de trajet. La première chose que vous devez créer est un ensemble de données de formation. Cet ensemble de formation contiendra la durée totale du trajet et les facteurs correspondants tels que la météo, l'heure, etc. Sur la base de cet ensemble de formation, votre machine pourrait constater qu'il existe une relation directe entre la quantité de pluie et le temps qu'il vous faudra pour rentrer chez vous.

Ainsi, il constate que plus il pleut, plus vous conduirez longtemps pour rentrer chez vous. Il peut également établir un lien entre l'heure à laquelle vous quittez le travail et l'heure à laquelle vous serez sur la route.

Plus vous approchez de 6 heures, plus il vous faudra de temps pour rentrer chez vous. Votre machine peut trouver certaines relations avec vos données étiquetées.

Phase d'apprentissage
Phase d'apprentissage

C'est le début de votre modèle de données. Cela commence à avoir un impact sur l’impact de la pluie sur la façon dont les gens conduisent. On commence également à constater que davantage de personnes voyagent à un moment donné de la journée.

Comment fonctionne l’apprentissage non supervisé ?

Prenons le cas d'un bébé et de son chien de la famille.

Comment fonctionne l'apprentissage non supervisé
Comment fonctionne l'apprentissage non supervisé

Elle connaît et identifie ce chien. Quelques semaines later un ami de la famille amène un chien et essaie de jouer avec le bébé.

Comment fonctionne l'apprentissage non supervisé

Bébé n'a pas vu ce chien plus tôt. Mais il reconnaît de nombreuses caractéristiques (2 oreilles, yeux, marche sur 4 pattes) qui ressemblent à son chien de compagnie. Elle identifie un nouvel animal comme un chien. Il s'agit d'un apprentissage non supervisé, dans lequel on ne vous apprend pas mais vous apprenez à partir des données (dans ce cas, des données sur un chien.) Si cet apprentissage avait été supervisé, l'ami de la famille aurait dit au bébé que c'était un chien.

Types de techniques d’apprentissage automatique supervisé

Types de techniques d’apprentissage automatique supervisé
Types de techniques d’apprentissage automatique supervisé

Régression

La technique de régression prédit une valeur de sortie unique à l'aide des données d'entraînement.

Exemple : vous pouvez utiliser la régression pour prédire le prix de l'immobilier à partir des données de formation. Les variables d'entrée seront la localité, la taille d'une maison, etc.

Classification

La classification signifie regrouper la sortie dans une classe. Si l’algorithme tente d’étiqueter les entrées en deux classes distinctes, on parle de classification binaire. La sélection entre plus de deux classes est appelée classification multiclasse.

Exemple: Déterminer si quelqu'un sera ou non un défaillant du prêt.

Points forts: Les sorties ont toujours une interprétation probabiliste et l'algorithme peut être régularisé pour éviter le surajustement.

Points faibles : La régression logistique peut sous-performer lorsqu'il existe des limites de décision multiples ou non linéaires. Cette méthode n'est pas flexible, elle ne capture donc pas plus de complex relations.

Types de techniques d'apprentissage automatique non supervisées

Problèmes d'apprentissage non supervisé regroupés en clusterproblèmes de connexion et d’association.

Clusteringurgiter

Clusteringurgiter

ClusterL'apprentissage est un concept important lorsqu'il s'agit d'apprentissage non supervisé. Il s’agit principalement de trouver une structure ou un modèle dans une collection de données non catégorisées. Clusteringurgiter algorithms traitera vos données et trouvera naturel clusters(groupes) s’ils existent dans les données. Vous pouvez également modifier le nombre clusters votre algorithms devrait identifier. Il permet d'ajuster la granularité de ces groupes.

Association

Les règles d'association vous permettent d'établir des associations entre des objets de données au sein de grandes bases de données. Cette technique non supervisée consiste à découvrir des relations intéressantes entre les variables dans de grandes bases de données. Par exemple, les personnes qui achètent une nouvelle maison sont plus susceptibles d’acheter de nouveaux meubles.

Autres exemples:

  • Un sous-groupe de patients atteints de cancer regroupés selon leurs mesures d'expression génique
  • Groupes d'acheteurs en fonction de leurs historiques de navigation et d'achat
  • Groupe de films selon la note attribuée par les téléspectateurs

Différence entre l'apprentissage supervisé et non supervisé

Apprentissage supervisé ou non supervisé
Apprentissage supervisé ou non supervisé
Paramètres Technique d'apprentissage automatique supervisé Technique d'apprentissage automatique non supervisé
Processus Dans un modèle d'apprentissage supervisé, des variables d'entrée et de sortie seront données. Dans le modèle d'apprentissage non supervisé, seules les données d'entrée seront fournies
Des données d'entrée Algorithms sont formés à l’aide de données étiquetées. Algorithms sont utilisés contre des données qui ne sont pas étiquetées
Algorithms Occasion Machine à vecteurs de support, réseau neuronal, régression linéaire et logistique, forêt aléatoire et arbres de classification. Non supervisé algorithms peut être divisé en différentes catégories : comme Cluster algorithms, K-signifie, Hierarchical clusteretc.
Com informatiqueplexity L'apprentissage supervisé est une méthode plus simple. L'apprentissage non supervisé est informatiquement complexeplex
Utilisation des Données Le modèle d'apprentissage supervisé utilise les données de formation pour apprendre un lien entre les entrées et les sorties. L'apprentissage non supervisé n'utilise pas de données de sortie.
Exactitude des résultats Méthode très précise et fiable. Méthode moins précise et fiable.
Apprentissage en temps réel La méthode d'apprentissage se déroule hors ligne. La méthode d'apprentissage se déroule en temps réel.
Nombre de cours Le nombre de classes est connu. Le nombre de classes n'est pas connu.
Principal inconvénient La classification du Big Data peut être un véritable défi en apprentissage supervisé. Vous ne pouvez pas obtenir d'informations précises concernant le tri des données, et le résultat sous forme de données utilisées dans l'apprentissage non supervisé est étiqueté et inconnu.