Övervakat vs oövervakat lärande: skillnaden mellan dem
Nyckelskillnaden mellan övervakat och oövervakat lärande
- I övervakad inlärning tränar du maskinen med hjälp av data som är väl "märkt".
- Oövervakad inlärning är en maskininlärningsteknik, där du inte behöver övervaka modellen.
- Övervakad inlärning låter dig samla in data eller producera en datautgång från den tidigare erfarenheten.
- Oövervakad maskininlärning hjälper dig att hitta alla typer av okända mönster i data.
- Regression och klassificering är två typer av övervakade maskininlärningstekniker.
- Clustering och association är två typer av oövervakat lärande.
- I en övervakad inlärningsmodell kommer in- och utdatavariabler att ges medan med oövervakad inlärningsmodell kommer endast indata att ges
Vad är övervakad maskininlärning?
I Supervised learning tränar du maskinen med hjälp av data vilket är bra "märkt.” Det betyder att vissa data redan är taggade med rätt svar. Det kan jämföras med lärande som sker i närvaro av en handledare eller lärare.
En övervakad inlärningsalgoritm lär sig av märkta träningsdata, hjälper dig att förutsäga resultat för oförutsedda data. Att framgångsrikt bygga, skala och distribuera exakt övervakad maskininlärning Datavetenskapsmodell tar tid och teknisk expertis från ett team av mycket skickliga datavetare. Dessutom måste dataforskare bygga om modeller för att se till att de insikter som ges förblir sanna tills dess data ändras.
Vad är oövervakat lärande?
Oövervakad inlärning är en maskininlärningsteknik, där du inte behöver övervaka modellen. Istället måste du låta modellen arbeta på egen hand för att upptäcka information. Det handlar främst om omärkta data.
Algoritmer för oövervakad inlärning låter dig utföra mer komplexa bearbetningsuppgifter jämfört med övervakad inlärning. Även om oövervakat lärande kan vara mer oförutsägbart jämfört med andra naturliga metoder för djupinlärning och förstärkningsinlärning.
Varför övervakat lärande?
- Övervakad inlärning låter dig samla in data eller producera en datautgång från den tidigare erfarenheten.
- Hjälper dig att optimera prestandakriterier med hjälp av erfarenhet
- Övervakad maskininlärning hjälper dig att lösa olika typer av verkliga beräkningsproblem.
Varför oövervakat lärande?
Här är de främsta anledningarna till att använda oövervakad inlärning:
- Oövervakad maskininlärning hittar alla typer av okända mönster i data.
- Oövervakade metoder hjälper dig att hitta funktioner som kan vara användbara för kategorisering.
- Det sker i realtid, så all indata ska analyseras och märkas i närvaro av elever.
- Det är lättare att få omärkta data från en dator än märkta data, som kräver manuella ingrepp.
Hur fungerar övervakat lärande?
Du vill till exempel träna en maskin för att hjälpa dig att förutsäga hur lång tid det kommer att ta dig att köra hem från din arbetsplats. Här börjar du med att skapa en uppsättning märkta data. Dessa uppgifter inkluderar
- Väderförhållanden
- Tid på dagen
- Helgdagar
Alla dessa detaljer är dina input. Utdata är hur lång tid det tog att köra hem den specifika dagen.
Du vet instinktivt att om det regnar ute, så tar det längre tid att köra hem. Men maskinen behöver data och statistik.
Låt oss nu se hur du kan utveckla en övervakad inlärningsmodell av detta exempel som hjälper användaren att bestämma pendlingstiden. Det första du behöver skapa är en träningsdatauppsättning. Det här träningssetet kommer att innehålla den totala pendlingstiden och motsvarande faktorer som väder, tid, etc. Baserat på detta träningsset kan din maskin se att det finns ett direkt samband mellan mängden regn och den tid det tar att komma hem.
Så det konstaterar att ju mer det regnar, desto längre kommer du att köra för att komma tillbaka till ditt hem. Den kan också se sambandet mellan den tid du lämnar jobbet och den tid du ska vara på resande fot.
Ju närmare du är 6 desto längre tid tar det för dig att komma hem. Din maskin kan hitta några av sambanden med dina märkta data.
Detta är början på din datamodell. Det börjar påverka hur regn påverkar hur människor kör. Det börjar också se att fler människor reser under en viss tid på dygnet.
Hur fungerar oövervakat lärande?
Låt oss ta fallet med en bebis och hennes familjehund.
Hon känner och identifierar denna hund. Några veckor senare tar en familjevän med sig en hund och försöker leka med barnet.
Baby har inte sett den här hunden tidigare. Men den känner igen många funktioner (2 öron, ögon, gå på 4 ben) är som hennes husdjurshund. Hon identifierar ett nytt djur som en hund. Det här är oövervakad inlärning, där du inte lärs ut men du lär dig av data (i det här fallet data om en hund.) Hade detta varit övervakad inlärning, skulle familjevännen ha sagt till barnet att det är en hund.
Typer av övervakade maskininlärningstekniker
Regression
Regressionsteknik förutsäger ett enda utdatavärde med hjälp av träningsdata.
Exempel: Du kan använda regression för att förutsäga huspriset från träningsdata. Indatavariablerna kommer att vara lokalitet, storlek på ett hus, etc.
Klassificering
Klassificering betyder att gruppera utdata i en klass. Om algoritmen försöker märka indata i två distinkta klasser kallas det för binär klassificering. Att välja mellan fler än två klasser kallas multiklassklassificering.
Exempelvis: Att avgöra om någon kommer att vara försumlig med lånet eller inte.
Styrkor: Utgångar har alltid en probabilistisk tolkning, och algoritmen kan regleras för att undvika överanpassning.
svagheter: Logistisk regression kan underprestera när det finns flera eller icke-linjära beslutsgränser. Denna metod är inte flexibel, så den fångar inte upp mer komplexa relationer.
Typer av oövervakade maskininlärningstekniker
Oövervakade inlärningsproblem grupperades ytterligare i kluster- och associationsproblem.
Clusteranvändning
Clustering är ett viktigt begrepp när det gäller oövervakat lärande. Det handlar främst om att hitta en struktur eller ett mönster i en samling okategoriserade data. Clusteringalgoritmer kommer att bearbeta dina data och hitta naturliga kluster(grupper) om de finns i datan. Du kan också ändra hur många kluster dina algoritmer ska identifiera. Det låter dig justera granulariteten för dessa grupper.
Förening
Associationsregler tillåter dig att upprätta associationer mellan dataobjekt i stora databaser. Denna oövervakade teknik handlar om att upptäcka spännande samband mellan variabler i stora databaser. Till exempel kommer människor som köper ett nytt hem mest sannolikt att köpa nya möbler.
Andra exempel:
- En undergrupp av cancerpatienter grupperade efter deras genuttrycksmätningar
- Grupper av shoppare baserat på deras surf- och köphistorik
- Filmgrupp efter betyget som ges av filmtittare
Skillnaden mellan övervakat och oövervakat lärande
parametrar | Övervakad maskininlärningsteknik | Oövervakad maskininlärningsteknik |
---|---|---|
Behandla | I en övervakad inlärningsmodell kommer in- och utdatavariabler att ges. | I en modell för oövervakad inlärning kommer endast indata att ges |
Indata | Algorithms tränas med hjälp av märkta data. | Algorithms används mot data som inte är märkta |
Algorithms Bilar | Stöd för vektormaskin, neuralt nätverk, linjär och logistisk regression, slumpmässig skog och klassificeringsträd. | Oövervakade algoritmer kan delas in i olika kategorier: som Cluster algoritmer, K-medel, Hierarkisk klustring, etc. |
Beräkningskomplexitet | Handledd inlärning är en enklare metod. | Oövervakat lärande är beräkningsmässigt komplext |
Användning av data | Modell för övervakad inlärning använder träningsdata för att lära sig en koppling mellan input och output. | Oövervakat lärande använder inte utdata. |
Resultatens noggrannhet | Mycket exakt och pålitlig metod. | Less korrekt och pålitlig metod. |
Realtidsinlärning | Inlärningsmetod sker offline. | Inlärningsmetod sker i realtid. |
Antal klasser | Antal klasser är känt. | Antalet klasser är inte känt. |
Huvudsakliga nackdelen | Att klassificera big data kan vara en riktig utmaning i Supervised Learning. | Du kan inte få exakt information om datasortering, och utdata som används vid oövervakat lärande är märkt och okänd. |