Aprendizaje supervisado y no supervisado: diferencia entre ellos

Diferencia clave entre el aprendizaje supervisado y no supervisado

  • En el aprendizaje supervisado, entrenas la máquina utilizando datos que están bien "etiquetados".
  • El aprendizaje no supervisado es una técnica de aprendizaje automático en la que no es necesario supervisar el modelo.
  • El aprendizaje supervisado le permite recopilar datos o producir un resultado de datos de la experiencia anterior.
  • El aprendizaje automático no supervisado le ayuda a encontrar todo tipo de patrones desconocidos en los datos.
  • La regresión y la clasificación son dos tipos de técnicas de aprendizaje automático supervisadas.
  • La agrupación y la asociación son dos tipos de aprendizaje no supervisado.
  • En un modelo de aprendizaje supervisado, se proporcionarán variables de entrada y salida, mientras que en un modelo de aprendizaje no supervisado, solo se proporcionarán datos de entrada.

¿Qué es el aprendizaje automático supervisado?

En el aprendizaje supervisado, entrenas la máquina utilizando datos que están bien "etiquetado.” Significa que algunos datos ya están etiquetados con la respuesta correcta. Se puede comparar con el aprendizaje que tiene lugar en presencia de un supervisor o un profesor.

Un algoritmo de aprendizaje supervisado aprende de los datos de entrenamiento etiquetados y le ayuda a predecir resultados de datos imprevistos. Construir, escalar e implementar con éxito un modelo de ciencia de datos de aprendizaje automático supervisado y preciso requiere tiempo y experiencia técnica por parte de un equipo de científicos de datos altamente capacitados. Además, los científicos de datos deben reconstruir modelos para asegurarse de que los conocimientos proporcionados sigan siendo ciertos hasta que los datos cambien.

¿Qué es el aprendizaje no supervisado?

El aprendizaje no supervisado es una técnica de aprendizaje automático en la que no es necesario supervisar el modelo. En lugar de ello, es necesario permitir que el modelo funcione por sí solo para descubrir información. Se trata principalmente de datos sin etiquetar.

Los algoritmos de aprendizaje no supervisados ​​le permiten realizar más tareasplex tareas de procesamiento en comparación con el aprendizaje supervisado. Sin embargo, el aprendizaje no supervisado puede ser más impredecible en comparación con otros métodos de aprendizaje profundo y aprendizaje por refuerzo de aprendizaje natural.

¿Por qué el aprendizaje supervisado?

  • El aprendizaje supervisado le permite recopilar datos o producir un resultado de datos de la experiencia anterior.
  • Le ayuda a optimizar los criterios de rendimiento utilizando la experiencia.
  • El aprendizaje automático supervisado le ayuda a resolver varios tipos de problemas informáticos del mundo real.

¿Por qué el aprendizaje no supervisado?

Estas son las principales razones para utilizar el aprendizaje no supervisado:

  • El aprendizaje automático no supervisado encuentra todo tipo de patrones desconocidos en los datos.
  • Los métodos no supervisados ​​le ayudan a encontrar funciones que pueden resultar útiles para la categorización.
  • Se lleva a cabo en tiempo real, por lo que todos los datos de entrada se analizan y etiquetan en presencia de los alumnos.
  • Es más fácil obtener datos sin etiquetar de una computadora que datos etiquetados, lo que requiere intervención manual.

¿Cómo funciona el aprendizaje supervisado?

Por ejemplo, desea entrenar una máquina para que le ayude a predecir cuánto tiempo le llevará conducir a casa desde su lugar de trabajo. Aquí, comienza creando un conjunto de datos etiquetados. Estos datos incluyen

  • Condiciones climáticas
  • Hora del día
  • Dias Festivos

Todos estos details son sus entradas. El resultado es la cantidad de tiempo que llevó conducir de regreso a casa ese día específico.

Cómo funciona el aprendizaje supervisado
Cómo funciona el aprendizaje supervisado

Instintivamente sabes que si está lloviendo afuera, te llevará más tiempo conducir a casa. Pero la máquina necesita datos y estadísticas.

Veamos ahora cómo se puede desarrollar un modelo de aprendizaje supervisado de este ejemplo que ayude al usuario a determinar el tiempo de viaje. Lo primero que debe crear es un conjunto de datos de entrenamiento. Este conjunto de entrenamiento contendrá el tiempo total de viaje y los factores correspondientes como el clima, el tiempo, etc. Según este conjunto de entrenamiento, su máquina podría ver que existe una relación directa entre la cantidad de lluvia y el tiempo que tardará en llegar a casa.

Por lo tanto, determina que cuanto más llueva, más tiempo conducirá para regresar a casa. También podría ver la conexión entre la hora en que sales del trabajo y la hora en que estarás de viaje.

Cuanto más cerca estés de las 6 p.m. más tiempo tardarás en llegar a casa. Su máquina puede encontrar algunas de las relaciones con sus datos etiquetados.

Fase de aprendizaje
Fase de aprendizaje

Este es el comienzo de su modelo de datos. Comienza a afectar cómo la lluvia afecta la forma en que las personas conducen. También se empieza a ver que más personas viajan durante un momento concreto del día.

¿Cómo funciona el aprendizaje no supervisado?

Tomemos el caso de un bebé y el perro de su familia.

Cómo funciona el aprendizaje no supervisado
Cómo funciona el aprendizaje no supervisado

Ella conoce e identifica a este perro. Unas pocas semanas later un amigo de la familia trae un perro e intenta jugar con el bebé.

Cómo funciona el aprendizaje no supervisado

El bebé no había visto a este perro antes. Pero reconoce muchas características (2 orejas, ojos, caminar sobre 4 patas) que son como su perro mascota. Ella identifica un nuevo animal como un perro. Este es un aprendizaje no supervisado, en el que no te enseñan pero aprendes de los datos (en este caso, datos sobre un perro). Si este aprendizaje hubiera sido supervisado, el amigo de la familia le habría dicho al bebé que es un perro.

Tipos de técnicas de aprendizaje automático supervisado

Tipos de técnicas de aprendizaje automático supervisado
Tipos de técnicas de aprendizaje automático supervisado

Regresión

La técnica de regresión predice un valor de salida único utilizando datos de entrenamiento.

Ejemplo: puede utilizar la regresión para predecir el precio de la vivienda a partir de datos de entrenamiento. Las variables de entrada serán localidad, tamaño de una casa, etc.

Clasificación

Clasificación significa agrupar la salida dentro de una clase. Si el algoritmo intenta etiquetar la entrada en dos clases distintas, se denomina clasificación binaria. La selección entre más de dos clases se denomina clasificación multiclase.

Ejemplo: Determinar si alguien será moroso o no en el préstamo.

Ventajas: Las salidas siempre tienen una interpretación probabilística y el algoritmo se puede regularizar para evitar el sobreajuste.

Debilidades: La regresión logística puede tener un rendimiento inferior cuando existen límites de decisión múltiples o no lineales. Este método no es flexible, por lo que no captura más complex relaciones.

Tipos de técnicas de aprendizaje automático no supervisadas

Los problemas de aprendizaje no supervisados ​​se agruparon además en problemas de agrupamiento y asociación.

Clustering

Clustering

La agrupación es un concepto importante cuando se trata de aprendizaje no supervisado. Se trata principalmente de encontrar una estructura o patrón en una colección de datos no categorizados. Los algoritmos de agrupación procesarán sus datos y encontrarán agrupaciones (grupos) naturales si existen en los datos. También puede modificar cuántos clústeres deben identificar sus algoritmos. Le permite ajustar la granularidad de estos grupos.

Asociación

Las reglas de asociación le permiten establecer asociaciones entre objetos de datos dentro de grandes bases de datos. Esta técnica no supervisada consiste en descubrir relaciones interesantes entre variables en grandes bases de datos. Por ejemplo, las personas que compran una casa nueva tienen más probabilidades de comprar muebles nuevos.

Otros ejemplos:

  • Un subgrupo de pacientes con cáncer agrupados por sus medidas de expresión genética
  • Grupos de compradores según su historial de navegación y compras.
  • Grupo de películas según la calificación otorgada por los espectadores.

Diferencia entre aprendizaje supervisado y no supervisado

Aprendizaje supervisado versus no supervisado
Aprendizaje supervisado versus no supervisado
parámetros Técnica de aprendizaje automático supervisado. Técnica de aprendizaje automático no supervisado
Proceso En un modelo de aprendizaje supervisado se darán variables de entrada y salida. En el modelo de aprendizaje no supervisado, solo se proporcionarán datos de entrada
Los datos de entrada Los algoritmos se entrenan utilizando datos etiquetados. Los algoritmos se utilizan contra datos que no están etiquetados.
Algoritmos utilizados Máquina de vectores de soporte, red neuronal, regresión lineal y logística, bosque aleatorio y árboles de clasificación. Los algoritmos no supervisados ​​se pueden dividir en diferentes categorías: como algoritmos de clúster, K-medias, Hierarchiagrupación de calorías, etc.
Com computacionalplexdad El aprendizaje supervisado es un método más sencillo. El aprendizaje no supervisado es computacionalmenteplex
Uso de datos El modelo de aprendizaje supervisado utiliza datos de entrenamiento para aprender un vínculo entre la entrada y las salidas. El aprendizaje no supervisado no utiliza datos de salida.
Precisión de los resultados Método altamente preciso y confiable. Método menos preciso y confiable.
Aprendizaje en tiempo real El método de aprendizaje se realiza fuera de línea. El método de aprendizaje se realiza en tiempo real.
Numero de clases Se conoce el número de clases. Se desconoce el número de clases.
Principal inconveniente Clasificar big data puede ser un verdadero desafío en el aprendizaje supervisado. No se puede obtener información precisa sobre la clasificación de datos y el resultado como datos utilizados en el aprendizaje no supervisado está etiquetado y no se conoce.