Tutorial de aprendizado de máquina para iniciantes: o que é, noções básicas de ML

O que é a Aprendizagem de Máquinas?

Machine Learning é um sistema de computador algorithms que pode aprender com o exemplo através do autoaperfeiçoamento sem ser explicitamente codificado por um programador. O aprendizado de máquina é uma parte da inteligência artificial que combina dados com ferramentas estatísticas para prever um resultado que pode ser usado para gerar insights acionáveis.

A inovação vem com a ideia de que uma máquina pode aprender singularmente com os dados (ou seja, exemplos) para produzir resultados precisos. O aprendizado de máquina está intimamente relacionado à mineração de dados e à modelagem preditiva Bayesiana. A máquina recebe dados como entrada e usa um algoritmo para formular respostas.

Uma tarefa típica de aprendizado de máquina é fornecer uma recomendação. Para quem tem um Netflix conta, todas as recomendações de filmes ou séries são baseadas nos dados históricos do usuário. As empresas de tecnologia estão usando aprendizado não supervisionado para melhorar a experiência do usuário com recomendações personalizadas.

O aprendizado de máquina também é usado para uma variedade de tarefas, como detecção de fraudes, manutenção preditiva, otimização de portfólio, automatização de tarefas e assim por diante.

Aprendizado de máquina versus programação tradicional

A programação tradicional difere significativamente do aprendizado de máquina. Na programação tradicional, um programador codifica todas as regras em consulta com um especialista na indústria para a qual o software está sendo desenvolvido. Cada regra é baseada em uma lógica foundation; a máquina executará uma saída seguintewing a afirmação lógica. Quando o sistema cresce complex, mais regras precisam ser escritas. Sua manutenção pode rapidamente se tornar insustentável.

Programação Tradicional
Programação Tradicional

O aprendizado de máquina deve superar esse problema. A máquina aprende como os dados de entrada e saída estão correlacionados e escreve uma regra. Os programadores não precisam escrever novas regras cada vez que há novos dados. O algorithms adaptar-se em resposta a novos dados e experiências para melhorar a eficácia ao longo do tempo.

Machine Learning

Machine Learning

Como funciona o aprendizado de máquina?

Agora, neste tutorial de noções básicas de aprendizado de máquina para iniciantes, aprenderemos como funciona o aprendizado de máquina (ML):

O aprendizado de máquina é o cérebro onde ocorre todo o aprendizado. A forma como a máquina aprende é semelhante à do ser humano. Os humanos aprendem com a experiência. Quanto mais sabemos, mais facilmente podemos prever. Por analogia, quando enfrentamos uma situação desconhecida, a probabilidade de sucesso é menor do que a situação conhecida. As máquinas são treinadas da mesma forma. Para fazer uma previsão precisa, a máquina vê um exemplo. Quando damos à máquina um exemplo semelhante, ela pode descobrir o resultado. No entanto, como um ser humano, se alimentar um exemplo nunca antes visto, a máquina terá dificuldade em prever.

O objetivo central do aprendizado de máquina é aprendizagem e inferência. Em primeiro lugar, a máquina aprende através da descoberta de padrões. Esta descoberta é feita graças ao dados,. Uma parte crucial do cientista de dados é escolher cuidadosamente quais dados fornecer à máquina. A lista de atributos usados ​​para resolver um problema é chamada de vetor de recursos. Você pode pensar em um vetor de recursos como um subconjunto de dados usado para resolver um problema.

A máquina usa alguma fantasia algorithms simplificar a realidade e transformar esta descoberta num modelo. Portanto, o estágio de aprendizagem é usado para descrever os dados e somarmaritransforme-o em um modelo.

Trabalho de aprendizado de máquina

Por exemplo, a máquina está tentando compreender a relação entre o salário de um indivíduo e a probabilidade de ir a um restaurante chique. Acontece que a máquina encontra uma relação positiva entre salário e ir a um restaurante sofisticado: este é o modelo

inferir

Quando o modelo é construído, é possível testar o quão poderoso ele é em dados nunca vistos antes. Os novos dados são transformados em um vetor de características, passam pelo modelo e dão uma previsão. Essa é a parte bonita do aprendizado de máquina. Não há necessidade de atualizar as regras ou treinar novamente o modelo. Você pode usar o modelo previamente treinado para fazer inferências sobre novos dados.

Inferência do modelo

A vida dos programas de aprendizado de máquina é simples e pode ser resumidamarized na sequênciawing pontos:

  1. Definir uma pergunta
  2. Coletar dados
  3. Visualize dados
  4. Algoritmo de treinamento
  5. Teste o algoritmo
  6. Colete feedback
  7. Refinar o algoritmo
  8. Faça um loop 4-7 até que os resultados sejam satisfatórios
  9. Use o modelo para fazer uma previsão

Assim que o algoritmo ficar bom em drawing as conclusões corretas, aplica esse conhecimento a novos conjuntos de dados.

Machine Learning Algorithms e onde eles são usados?

Agora, neste tutorial de aprendizado de máquina para iniciantes, aprenderemos onde o aprendizado de máquina (ML) algorithms são usados:

Machine Learning Algorithms

Aprendizado de máquinas Algorithms

O aprendizado de máquina pode ser agrupado em duas tarefas amplas de aprendizado: Supervisionado e Não Supervisionado. Existem muitos outros algorithms

Aprendizagem supervisionada

Um algoritmo usa dados de treinamento e feedback de humanos para aprender a relação entre determinadas entradas e uma determinada saída. Por exemplo, um profissional pode usar despesas de marketing e previsão do tempo como dados de entrada para prever as vendas de latas.

Você pode usar o aprendizado supervisionado quando os dados de saída forem conhecidos. O algoritmo irá prever novos dados.

Existem duas categorias de aprendizagem supervisionada:

  • Tarefa de classificação
  • Tarefa de regressão

Classificação

Imagine que você deseja prever o sexo de um cliente para um comercial. Você começará a coletar dados sobre altura, peso, cargo, salário, cesta de compras, etc. Você conhece o gênero de cada um de seus clientes, só pode ser homem ou mulher. O objetivo do classificador será atribuir uma probabilidade de ser homem ou mulher (ou seja, o rótulo) com base nas informações (ou seja, características que você coletou). Quando o modelo aprender como reconhecer homem ou mulher, você poderá usar novos dados para fazer uma previsão. Por exemplo, você acabou de receber novas informações de um cliente desconhecido e deseja saber se é homem ou mulher. Se o classificador prevê homem = 70%, significa que o algoritmo tem 70% de certeza de que esse cliente é homem e 30% é mulher.

O rótulo pode ser de duas ou mais classes. O exemplo de aprendizado de máquina acima tem apenas duas classes, mas se um classificador precisar prever objetos, ele terá dezenas de classes (por exemplo, vidro, mesa, sapatos, etc. cada objeto representa uma classe)

Regressão

Quando a saída é um valor contínuo, a tarefa é uma regressão. Por exemplo, um analista financeiro pode precisar prever o valor de uma ação com base em uma série de características como ações, desempenhos anteriores de ações, índice macroeconômico. O sistema será treinado para estimar o preço das ações com o menor erro possível.

Algoritmo Descrição Formato
Regressão linear Encontra uma maneira de correlacionar cada recurso à saída para ajudar a prever valores futuros. Regressão
Regressão logística Extensão da regressão linear usada para tarefas de classificação. A variável de saída 3 é binária (por exemplo, apenas preto ou branco) em vez de contínua (por exemplo, uma lista infinita de cores potenciais) Classificação
Árvore de decisão Modelo de classificação ou regressão altamente interpretável que divide os valores dos recursos de dados em ramificações nos nós de decisão (por exemplo, se uma característica for uma cor, cada cor possível se torna uma nova ramificação) até que uma decisão final seja tomada Regressão
Classificação
Baías ingénuas O método bayesiano é um método de classificação que faz uso do teorema bayesiano. O teorema atualiza o conhecimento prévio de um evento com a probabilidade independente de cada característica que pode afetar o evento. Regressão
Classificação
Máquina de vetor de suporte
Support Vector Machine, ou SVM, é normalmente usado para a tarefa de classificação.
O algoritmo SVM encontra um hiperplano que divide as classes de maneira ideal. É melhor usado com um solucionador não linear.
Regressão (não muito comum)
Classificação
Floresta aleatória O algoritmo é construído sobre uma árvore de decisão para melhorar drasticamente a precisão. A floresta aleatória gera muitas vezes árvores de decisão simples e usa o método de 'votação da maioria' para decidir qual rótulo retornar. Para a tarefa de classificação, o palpite final será o mais votado; enquanto para a tarefa de regressão, a previsão média de todas as árvores é a previsão final. Regressão
Classificação
AdaBoostGenericName Técnica de classificação ou regressão que utiliza uma infinidade de modelos para chegar a uma decisão, mas os pondera com base na precisão na previsão do resultado Regressão
Classificação
Árvores que aumentam o gradiente Árvores de aumento de gradiente são uma técnica de classificação/regressão de última geração. Está focando no erro cometido pelas árvores anteriores e tenta corrigi-lo. Regressão
Classificação

Aprendizagem não supervisionada

Na aprendizagem não supervisionada, um algoritmo explora dados de entrada sem receber uma variável de saída explícita (por exemplo, explora dados demográficos do cliente para identificar padrões)

Você pode usá-lo quando não sabe como classificar os dados e deseja que o algoritmo encontre padrões e classifique os dados para você

Nome do algoritmo Descrição Formato
K-significa clustering Coloca os dados em alguns grupos (k), cada um contendo dados com características semelhantes (conforme determinado pelo modelo, não antecipadamente por humanos) Clustering
modelo de mistura gaussiana Uma generalização de k-means clusterque proporciona mais flexibilidade no tamanho e formato dos grupos (clusters) Clustering
aquiarchical clustering splits clusterestá ao longo de uma hierarchiárvore cal para formar um sistema de classificação.

Pode ser usado para Cluster cliente do cartão fidelidade

Clustering
Sistema de recomendação Ajude a definir os dados relevantes para fazer uma recomendação. Clustering
PCA/T-SNE Usado principalmente para diminuir a dimensionalidade dos dados. O algorithms reduza o número de recursos para 3 ou 4 vetores com as maiores variações. Redução de Dimensão

Como escolher o algoritmo de aprendizado de máquina

Agora, neste tutorial básico de aprendizado de máquina, aprenderemos como escolher o algoritmo de aprendizado de máquina (ML):

Há muito aprendizado de máquina algorithms. A escolha do algoritmo é baseada no objetivo.

No exemplo de aprendizado de máquina abaixo, a tarefa é prever o tipo de flor entre as três variedades. As previsões são baseadas no comprimento e na largura da pétala. A imagem mostra os resultados de dez diferentes algorithms. A imagem no canto superior esquerdo é o conjunto de dados. Os dados são classificados em três categorias: vermelho, azul claro e azul escuro. Existem alguns agrupamentos. Por exemplo, na segunda imagem, tudo no canto superior esquerdo pertence à categoria vermelha, na parte central há uma mistura de incerteza e azul claro enquanto a parte inferior corresponde à categoria escura. As outras imagens mostram diferentes algorithms e como eles tentam classificar os dados.

Como escolher o algoritmo de aprendizado de máquina

Desafios e limitações do aprendizado de máquina

Agora, neste tutorial de aprendizado de máquina, aprenderemos sobre as limitações do aprendizado de máquina:

O principal desafio do aprendizado de máquina é a falta de dados ou a diversidade no conjunto de dados. Uma máquina não pode aprender se não houver dados disponíveis. Além disso, um conjunto de dados com falta de diversidade dificulta a máquina. Uma máquina precisa ter heterogeneidade para aprender insights significativos. É raro que um algoritmo consiga extrair informações quando há poucas ou nenhuma variação. Recomenda-se ter pelo menos 20 observações por grupo para ajudar a máquina a aprender. Esta restrição leva a uma avaliação e previsão deficientes.

Aplicação de aprendizado de máquina

Agora, neste tutorial de aprendizado de máquina, vamos aprender as aplicações do aprendizado de máquina:

aumentar:

  • Aprendizado de máquina, que auxilia os humanos em suas tarefas diárias, pessoalmente ou comercialmente, sem ter controle total do resultado. Esse aprendizado de máquina é utilizado de diversas maneiras, como assistente virtual, análise de dados, soluções de software. O usuário principal é reduzir erros devido ao preconceito humano.

Automação:

  • Aprendizado de máquina, que funciona de forma totalmente autônoma em qualquer área, sem a necessidade de qualquer intervenção humana. Por exemplo, robôs que executam as etapas essenciais do processo em fábricas.

Indústria Financeira

  • O aprendizado de máquina é ótimowing em popularidade no setor financeiro. Os bancos estão usando principalmente o ML para encontrar padrões nos dados, mas também para prevenir fraudes.

Organização governamental

  • O governo utiliza o BC para gerir a segurança pública e os serviços públicos. Veja o exemplo da China com o reconhecimento facial massivo. O governo usa inteligência artificial para prevenir o jaywalker.

Setor de saúde

  • A saúde foi uma das primeiras indústrias a usar aprendizado de máquina com detecção de imagens.

Marketing

  • O amplo uso da IA ​​é feito em marketing graças ao acesso abundante aos dados. Antes da era dos dados em massa, os pesquisadores desenvolveram ferramentas matemáticas avançadas, como a análise bayesiana, para estimar o valor de um cliente. Com o boom dos dados, o departamento de marketing depende da IA ​​para otimizar o relacionamento com o cliente e a campanha de marketing.

Exemplo de aplicação de Machine Learning em Supply Chain

O aprendizado de máquina oferece resultados excelentes para reconhecimento visual de padrões, abrindo muitas aplicações potenciais em inspeção física e manutenção em toda a rede da cadeia de suprimentos.

A aprendizagem não supervisionada pode procurar rapidamente padrões comparáveis ​​em diversos conjuntos de dados. Por sua vez, a máquina pode realizar inspeção de qualidade em todo o centro logístico, envio com danos e desgastes.

Por exemplo, a IBMA plataforma Watson da empresa pode determinar danos ao contêiner de transporte. O Watson combina dados visuais e baseados em sistemas para rastrear, relatar e fazer recomendações em tempo real.

No ano passado, o gerente de estoque confiou extensivamente no método principal para avaliar e prever o estoque. Ao combinar big data e aprendizagem automática, foram implementadas melhores técnicas de previsão (uma melhoria de 20 a 30% em relação às ferramentas de previsão tradicionais). Em termos de vendas, significa um aumento de 2 a 3% devido à potencial redução dos custos de inventário.

Exemplo de aprendizado de máquina Google Car

Por exemplo, todo mundo conhece o carro do Google. O carro está cheio de lasers no teto que indicam onde ele está em relação à área ao redor. Possui radar na frente, que informa ao carro a velocidade e o movimento de todos os carros ao seu redor. Ele usa todos esses dados para descobrir não apenas como dirigir o carro, mas também para descobrir e prever o que os possíveis motoristas ao redor do carro farão. O que é impressionante é que o carro processa quase um gigabyte por segundo de dados.

Aplicação de aprendizado de máquina

Por que o aprendizado de máquina é importante?

O aprendizado de máquina é a melhor ferramenta até agora para analisar, compreender e identificar um padrão nos dados. Uma das principais ideias por trás do aprendizado de máquina é que o computador pode ser treinado para automatizar tarefas que seriam exaustivas ou impossíveis para um ser humano. A clara violação da análise tradicional é que o aprendizado de máquina pode tomar decisões com o mínimo de intervenção humana.

Siga o seguintewing exemplo para este tutorial de ML; um agente retalhista pode estimar o preço de uma casa com base na sua própria experiência e no seu conhecimento do mercado.

Uma máquina pode ser treinada para traduzir o conhecimento de um especialista em recursos. As características são todas as características de uma casa, bairro, ambiente econômico, etc. que fazem a diferença de preço. Para o especialista, provavelmente demorou alguns anos para dominar a arte de estimar o preço de uma casa. Sua experiência está cada vez melhor após cada venda.

Para a máquina, são necessários milhões de dados (ou seja, por exemplo) para dominar esta arte. Logo no início de seu aprendizado, a máquina comete um erro, de certa forma como o vendedor júnior. Depois que a máquina vê todo o exemplo, ela obtém conhecimento suficiente para fazer sua estimativa. Ao mesmo tempo, com uma precisão incrível. A máquina também é capaz de ajustar seu erro de acordo.

A maior parte das grandes empresas entendeu o valor do aprendizado de máquina e da retenção de dados. A McKinsey estimou que o valor da análise varia de $9.5 trilhões para $15.4 trilhões enquanto $5 a 7 trilhões podem ser atribuídos às técnicas de IA mais avançadas.

Leia também O que é Lógica Fuzzy? Archiestrutura, aplicação e exemplo: Clique aqui