Aprendizaje automático supervisado: qué es, algoritmos con ejemplos

¿Qué es el aprendizaje automático supervisado?

Aprendizaje automático supervisado es un algoritmo que aprende de datos de entrenamiento etiquetados para ayudarlo a predecir resultados de datos imprevistos. En el aprendizaje supervisado, entrenas la máquina utilizando datos que están bien "etiquetados". Significa que algunos datos ya están etiquetados con respuestas correctas. Se puede comparar con aprender en presencia de un supervisor o un maestro.

Construir, escalar e implementar con éxito preciso Los modelos supervisados ​​de aprendizaje automático requieren tiempo y experiencia técnica por parte de un equipo de científicos de datos altamente capacitados. Además, Datos el científico debe reconstruir modelos para asegurarse de que la información proporcionada siga siendo cierta hasta que cambien sus datos.

Cómo funciona el aprendizaje supervisado

El aprendizaje automático supervisado utiliza conjuntos de datos de entrenamiento para lograr los resultados deseados. Estos conjuntos de datos contienen entradas y salidas correctas que ayudan al modelo a aprender más rápido. Por ejemplo, desea entrenar una máquina para que le ayude a predecir cuánto tiempo le llevará conducir a casa desde su lugar de trabajo.

Aquí, comienza creando un conjunto de datos etiquetados. Estos datos incluyen:

  • Condiciones climáticas
  • Hora del día
  • Dias Festivos

Todos estos details son sus aportaciones en este ejemplo de aprendizaje supervisado. El resultado es la cantidad de tiempo que llevó conducir de regreso a casa ese día específico.

Cómo funciona el aprendizaje automático supervisado

Instintivamente sabes que si está lloviendo afuera, te llevará más tiempo conducir a casa. Pero la máquina necesita datos y estadísticas.

Veamos algunos ejemplos de aprendizaje supervisado sobre cómo se puede desarrollar un modelo de aprendizaje supervisado de este ejemplo que ayude al usuario a determinar el tiempo de viaje. Lo primero que debe crear es un conjunto de entrenamiento. Este conjunto de entrenamiento contendrá el tiempo total de viaje y los factores correspondientes como el clima, el tiempo, etc. Según este conjunto de entrenamiento, su máquina podría ver que existe una relación directa entre la cantidad de lluvia y el tiempo que tardará en llegar a casa.

Por lo tanto, determina que cuanto más llueva, más tiempo conducirá para regresar a casa. También podría ver la conexión entre la hora en que sales del trabajo y la hora en que estarás de viaje.

Cuanto más cerca estés de las 6 p.m. más tardarás en llegar a casa. Su máquina puede encontrar algunas de las relaciones con sus datos etiquetados.

Funcionamiento del aprendizaje automático supervisado
Funcionamiento del aprendizaje automático supervisado

Este es el comienzo de su modelo de datos. Comienza a afectar cómo la lluvia afecta la forma en que las personas conducen. También se empieza a ver que más personas viajan durante un momento concreto del día.

Tipos de algoritmos de aprendizaje automático supervisados

Following Son los tipos de algoritmos de Aprendizaje Automático Supervisado:

Regresión

La técnica de regresión predice un valor de salida único utilizando datos de entrenamiento.

Ejemplo: Puede utilizar la regresión para predecir el precio de la vivienda a partir de datos de entrenamiento. Las variables de entrada serán localidad, tamaño de una casa, etc.

Ventajas: Las salidas siempre tienen una interpretación probabilística y el algoritmo se puede regularizar para evitar el sobreajuste.

Debilidades: La regresión logística puede tener un rendimiento inferior cuando existen límites de decisión múltiples o no lineales. Este método no es flexible, por lo que no captura más complex relaciones.

Regresión logística:

Método de regresión logística utilizado para estimar valores discretos en función de un conjunto de variables independientes. Le ayuda a predecir la probabilidad de que ocurra un evento ajustando los datos a una función logit. Por eso, también se la conoce como regresión logística. Como predice la probabilidad, su valor de salida se encuentra entre 0 y 1.

Aquí hay algunos tipos de algoritmos de regresión.

Clasificación

Clasificación significa agrupar la salida dentro de una clase. Si el algoritmo intenta etiquetar la entrada en dos clases distintas, se denomina clasificación binaria. La selección entre más de dos clases se denomina clasificación multiclase.

Ejemplo: Determinar si alguien será moroso o no en el préstamo.

Ventajas: El árbol de clasificación funciona muy bien en la práctica

Debilidades: Los árboles individuales sin restricciones son propensos a sobreajustarse.

Aquí hay algunos tipos de algoritmos de clasificación.

Clasificadores ingenuos de Bayes

El modelo Naive Bayesiano (NBN) es fácil de construir y muy útil para grandes conjuntos de datos. Este método se compone de gráficos acíclicos directos con un padre y varios hijos. Asume independencia entre los nodos secundarios separados de sus padres.

Árboles de decisión

Los árboles de decisiones clasifican las instancias clasificándolas según el valor de la característica. En este método, cada modo es la característica de una instancia. Debe clasificarse y cada rama representa un valor que el nodo puede asumir. Es una técnica muy utilizada para la clasificación. En este método, la clasificación es un árbol que se conoce como árbol de decisión.

Le ayuda a estimar valores reales (coste de compra de un automóvil, número de llamadas, ventas mensuales totales, etc.).

Máquinas de vectores soporte

La máquina de vectores de soporte (SVM) es un tipo de algoritmo de aprendizaje desarrollado en 1990. Este método se basa en los resultados de la teoría del aprendizaje estadístico introducida por Vap Nik.

Las máquinas SVM también están estrechamente conectadas con las funciones del kernel, que es un concepto central para la mayoría de las tareas de aprendizaje. El marco del kernel y SVM se utilizan en una variedad de campos. Incluye recuperación de información multimedia, bioinformática y reconocimiento de patrones.

Técnicas de aprendizaje automático supervisadas y no supervisadas

Residencia en Técnica de aprendizaje automático supervisado. Técnica de aprendizaje automático no supervisado
Los datos de entrada Los algoritmos se entrenan utilizando datos etiquetados. Los algoritmos se utilizan contra datos que no están etiquetados.
Com computacionalplexdad El aprendizaje supervisado es un método más sencillo. El aprendizaje no supervisado es computacionalmenteplex
Exactitud Método altamente preciso y confiable. Método menos preciso y confiable.

Desafíos en el aprendizaje automático supervisado

A continuación, se detallan los desafíos que enfrenta el aprendizaje automático supervisado:

  • La característica de entrada irrelevante presente en los datos de entrenamiento podría dar resultados inexactos
  • La preparación y el preprocesamiento de datos siempre es un desafío.
  • La precisión se ve afectada cuando se ingresan valores imposibles, improbables e incompletos como datos de entrenamiento.
  • Si el experto en cuestión no está disponible, entonces el otro enfoque es la “fuerza bruta”. Significa que debe pensar en las características correctas (variables de entrada) para entrenar la máquina. Podría ser inexacto.

Ventajas del aprendizaje supervisado

Estas son las ventajas del aprendizaje automático supervisado:

  • Aprendizaje supervisado en Aprendizaje automático (Machine learning & LLM) le permite recopilar datos o producir una salida de datos de la experiencia anterior
  • Le ayuda a optimizar los criterios de rendimiento utilizando la experiencia.
  • El aprendizaje automático supervisado le ayuda a resolver varios tipos de problemas informáticos del mundo real.

Desventajas del aprendizaje supervisado

A continuación se detallan las desventajas del aprendizaje automático supervisado:

  • El límite de decisión podría estar sobreentrenado si su conjunto de entrenamiento no tiene ejemplos que desee tener en una clase.
  • Debe seleccionar muchos buenos ejemplos de cada clase mientras entrena al clasificador.
  • Clasificando grandes volúmenes de datos puede ser un verdadero desafío.
  • La formación para el aprendizaje supervisado necesita mucho tiempo de cálculo.

Mejores prácticas para el aprendizaje supervisado

  • Antes de hacer cualquier otra cosa, debe decidir qué tipo de datos se utilizará como conjunto de entrenamiento.
  • Debe decidir la estructura de la función aprendida y el algoritmo de aprendizaje.
  • Reúna los resultados correspondientes, ya sea de expertos humanos o de mediciones.

Resumen

  • En los algoritmos de aprendizaje supervisado, se entrena la máquina utilizando datos que están bien "etiquetados".
  • Quiere entrenar una máquina que le ayude a predecir cuánto tiempo le llevará conducir a casa desde su lugar de trabajo es un ejemplo de aprendizaje supervisado.
  • La regresión y la clasificación son dos dimensiones de un algoritmo de aprendizaje automático supervisado.
  • Aprendizaje supervisado es un método más simple, mientras que el aprendizaje no supervisado es una combinaciónplex método.
  • El mayor desafío en el aprendizaje supervisado es que las características de entrada irrelevantes presentes en los datos de entrenamiento podrían dar resultados inexactos.
  • La principal ventaja del aprendizaje supervisado es que le permite recopilar datos o producir un resultado de datos a partir de la experiencia previa.
  • El inconveniente de este modelo es que el límite de decisión puede verse sobrecargado si su conjunto de entrenamiento no tiene ejemplos que desee tener en una clase.
  • Como práctica recomendada de aprendizaje supervisado, primero debe decidir qué tipo de datos se deben utilizar como conjunto de entrenamiento.