Denetimsiz Makine Öğrenimi: Algorithms, Örnekli Türler
Denetimsiz Öğrenme Nedir?
Denetimsiz Öğrenme kullanıcıların modeli denetlemesine gerek olmayan bir makine öğrenme tekniğidir. Bunun yerine, modelin daha önce fark edilmeyen kalıpları ve bilgileri keşfetmesi için kendi başına çalışmasına olanak tanır. Esas olarak etiketlenmemiş verilerle ilgilenir.
Denetimsiz Öğrenme Algorithms
Denetimsiz Öğrenme Algorithms kullanıcıların denetlenen öğrenmeye kıyasla daha karmaşık işlem görevleri gerçekleştirmesine izin verir. Bununla birlikte, denetlenmeyen öğrenme diğer doğal öğrenme yöntemlerine kıyasla daha öngörülemez olabilir. Denetlenmeyen öğrenme algoritmaları kümeleme, anormallik tespiti, sinir ağları vb. içerir.
Denetimsiz Makine Öğrenimi Örneği
Bir bebek ve ailesinin köpeği için Denetimsiz Öğrenme örneğini ele alalım.
Bu köpeği tanıyor ve tanıyor. Birkaç hafta sonra bir aile dostu bir köpek getiriyor ve bebekle oynamaya çalışıyor.
Bebek bu köpeği daha önce görmedi. Ancak birçok özelliğinin (2 kulak, göz, 4 ayak üzerinde yürüme) evcil köpeğine benzediğinin farkındadır. Yeni hayvanı köpek olarak tanımlıyor. Bu, size öğretilmeyen ancak verilerden (bu durumda bir köpeğe ilişkin veriler) öğrendiğiniz denetimsiz öğrenmedir. denetimli öğrenmeolsaydı, aile dostu bebeğe yukarıdaki Denetimsiz Öğrenme örneğinde gösterildiği gibi onun bir köpek olduğunu söylerdi.
Neden Denetimsiz Öğrenme?
Denetimsiz Öğrenmeyi kullanmanın başlıca nedenleri şunlardır: Makine öğrenmesi:
- Denetimsiz makine öğrenimi, verilerdeki her türlü bilinmeyen modeli bulur.
- Denetimsiz yöntemler, kategorizasyon için yararlı olabilecek özellikleri bulmanıza yardımcı olur.
- Gerçek zamanlı olarak gerçekleştiğinden, tüm girdi verileri öğrencilerin huzurunda analiz edilecek ve etiketlenecektir.
- Etiketsiz verileri bilgisayardan almak, manuel müdahale gerektiren etiketli verilere göre daha kolaydır.
ClusterDenetimsiz Öğrenme Türleri Algorithms
Denetimsiz Makine Öğrenimi algoritmalarının kümeleme türleri aşağıda verilmiştir:
Denetimsiz öğrenme sorunları ayrıca kümeleme ve ilişkilendirme sorunları olarak gruplandırılır.
Clustering
ClusterDenetimsiz öğrenme söz konusu olduğunda öğrenme önemli bir kavramdır. Temel olarak kategorize edilmemiş verilerden oluşan bir koleksiyonda bir yapı veya model bulmakla ilgilenir. Denetimsiz Öğrenme ClusterAlgoritmalar verilerinizi işleyecek ve verilerde varsa doğal kümeleri (grupları) bulacaktır. Ayrıca algoritmalarınızın kaç kümeyi tanımlaması gerektiğini de değiştirebilirsiniz. Bu grupların ayrıntı düzeyini ayarlamanıza olanak tanır.
Kullanabileceğiniz farklı kümeleme türleri vardır:
Özel (bölümleme)
Bu kümeleme yönteminde veriler, bir veri yalnızca bir kümeye ait olacak şekilde gruplanır.
Örnek: K-aracı
Aglomeratif
Bu kümeleme tekniğinde, her veri bir kümedir. En yakın iki küme arasındaki yinelemeli birleşimler küme sayısını azaltır.
Örnek: Hiyerarşik kümeleme
Çakışan
Bu teknikte verileri kümelemek için bulanık kümeler kullanılır. Her nokta, farklı üyelik derecelerine sahip iki veya daha fazla kümeye ait olabilir.
Burada veriler uygun bir üyelik değeriyle ilişkilendirilecektir. Örnek: Bulanık C-Ortalamalar
Olasılık
Bu teknik, kümeleri oluşturmak için olasılık dağılımını kullanır
Örnek: Aşağıdaki anahtar kelimeler
- "Erkek ayakkabısı."
- “kadın ayakkabısı.”
- “kadın eldiveni.”
- "Erkek eldiveni."
“ayakkabı” ve “eldiven” veya “erkek” ve “kadın” olmak üzere iki kategoriye ayrılabilir.
ClusterTürler
Makine Öğrenmesinin kümeleme türleri şunlardır:
- Hiyerarşik kümeleme
- K-kümeleme anlamına gelir
- K-NN (k en yakın komşu)
- Temel bileşenler Analizi
- Tekil Değer Ayrışımı
- Bağımsız Bileşen Analizi
Hiyerarşik Clustering
Hiyerarşik kümeleme, kümelerin hiyerarşisini oluşturan bir algoritmadır. Kendi kümelerine atanan tüm verilerle başlar. Burada, iki yakın küme aynı kümede olacaktır. Bu algoritma, yalnızca bir küme kaldığında sona erer.
K-anlamı Clustering
K, her yineleme için en yüksek değeri bulmanıza yardımcı olan yinelemeli bir kümeleme algoritması olduğu anlamına gelir. Başlangıçta istenilen sayıda küme seçilir. Bu kümeleme yönteminde veri noktalarını k grup halinde kümelemeniz gerekir. Daha büyük bir k, aynı şekilde daha fazla ayrıntı düzeyine sahip daha küçük gruplar anlamına gelir. Daha düşük bir k, daha az ayrıntı düzeyine sahip daha büyük gruplar anlamına gelir.
Algoritmanın çıktısı bir grup “etiket”tir. Veri noktasını k gruplarından birine atar. K-ortalamalı kümelemede her grup, her grup için bir ağırlık merkezi oluşturularak tanımlanır. Merkezler, kendilerine en yakın noktaları yakalayan ve onları kümeye ekleyen kümenin kalbi gibidir.
K-ortalama kümeleme ayrıca iki alt grubu tanımlar:
- Aglomeratif kümeleme
- Dendrogram
Aglomeratif kümeleme
Bu tür K-ortalama kümelemesi sabit sayıda kümeyle başlar. Tüm verileri tam sayıda kümeye tahsis eder. Bu kümeleme yöntemi, girdi olarak K kümesi sayısını gerektirmez. Aglomerasyon işlemi her verinin tek bir küme halinde oluşturulmasıyla başlar.
Bu yöntem bir miktar mesafe ölçüsü kullanır, birleştirme işlemiyle küme sayısını (her yinelemede bir tane) azaltır. Son olarak tüm nesneleri içeren büyük bir kümemiz var.
Dendrogram
Dendrogram kümeleme yönteminde her düzey olası bir kümeyi temsil edecektir. Dendrogramın yüksekliği iki birleştirme kümesi arasındaki benzerlik düzeyini gösterir. Sürecin dibine yaklaştıkça daha benzer kümeler oluşur, bu da grubun dendrogramdan doğal olmayan ve çoğunlukla subjektif olarak bulunmasıdır.
K- En yakın komşular
K-en yakın komşu, tüm makine öğrenimi sınıflandırıcılarının en basit olanıdır. Diğer makine öğrenimi tekniklerinden farklıdır, çünkü bir model üretmez. Tüm mevcut durumları depolayan ve yeni örnekleri benzerlik ölçüsüne göre sınıflandıran basit bir algoritmadır.
Örnekler arasında mesafe olduğunda çok iyi çalışır. Eğitim seti büyük olduğunda ve mesafe hesaplaması önemsiz olduğunda öğrenme hızı yavaştır.
Temel bileşenler Analizi
Daha yüksek boyutlu bir uzay istiyorsanız. Bu uzay için bir temel ve bu temelin yalnızca en önemli 200 puanını seçmeniz gerekir. Bu temel, bir ana bileşen olarak bilinir. Seçtiğiniz alt küme, orijinal uzaya kıyasla küçük boyutlu yeni bir uzaydır. Mümkün olduğunca çok veri karmaşıklığını korur.
Dernek
Birliktelik kuralları, büyük veritabanlarındaki veri nesneleri arasında ilişkiler kurmanıza olanak tanır. Bu denetimsiz teknik, büyük veritabanlarındaki değişkenler arasındaki ilginç ilişkileri keşfetmeyle ilgilidir. Örneğin, yeni bir ev satın alan kişilerin büyük olasılıkla yeni mobilya satın alma olasılıkları yüksektir.
Diğer Örnekler:
- Gen ekspresyonu ölçümlerine göre gruplandırılmış bir kanser hastası alt grubu
- Göz atma ve satın alma geçmişlerine göre alışveriş yapan gruplar
- Film izleyicilerinin verdiği derecelendirmeye göre film grubu
Denetimli ve Denetimsiz Makine Öğrenimi Karşılaştırması
İşte arasındaki temel fark Denetimli ve Denetimsiz Öğrenme Karşılaştırması:
Parametreler | Denetimli makine öğrenimi tekniği | Denetimsiz makine öğrenimi tekniği |
---|---|---|
Giriş Verileri | Algorithms etiketlenmiş veriler kullanılarak eğitilir. | Algorithms etiketlenmemiş verilere karşı kullanılır |
Hesaplamalı Karmaşıklık | Denetimli öğrenme daha basit bir yöntemdir. | Gözetimsiz öğrenme hesaplama açısından karmaşıktır |
doğruluk | Son derece doğru ve güvenilir bir yöntem. | Less Doğru ve güvenilir yöntem. |
Denetimsiz Makine Öğrenimi Uygulamaları
Denetimsiz Öğrenme Tekniklerinin bazı uygulamaları şunlardır:
- Clusterveri kümesini benzerliklerine göre otomatik olarak gruplara ayırma
- Anormallik tespiti, veri kümenizdeki olağandışı veri noktalarını keşfedebilir. Hileli işlemleri bulmak için kullanışlıdır
- İlişkilendirme madenciliği, veri kümenizde sıklıkla bir arada bulunan öğe kümelerini tanımlar
- Gizli değişken modelleri, veri ön işlemede yaygın olarak kullanılmaktadır. Bir veri kümesindeki özellik sayısını azaltmak veya veri kümesini birden fazla bileşene ayırmak gibi
Denetimsiz Öğrenmenin Dezavantajları
- Denetimsiz öğrenmede kullanılan veriler etiketlendiğinden ve bilinmediğinden veri sıralama konusunda kesin bilgi elde edemezsiniz ve çıktı
- Less Sonuçların doğruluğu, girdi verilerinin önceden insanlar tarafından bilinmemesi ve etiketlenmemesinden kaynaklanmaktadır. Bu, makinenin bunu kendisinin yapması gerektiği anlamına gelir.
- Spektral sınıflar her zaman bilgi sınıflarına karşılık gelmez.
- Kullanıcının bu sınıflandırmayı takip eden sınıfları yorumlamak ve etiketlemek için zaman harcaması gerekir.
- Sınıfların spektral özellikleri de zamanla değişebildiği için bir görüntüden diğerine geçerken aynı sınıf bilgisine sahip olamazsınız.
ÖZET
- Denetimsiz öğrenme, modeli denetlemenize gerek olmayan bir makine öğrenme tekniğidir.
- Denetimsiz makine öğrenimi, verilerdeki her türlü bilinmeyen modeli bulmanıza yardımcı olur.
- ClusterÖğrenme ve İlişkilendirme, Denetimsiz öğrenmenin iki türüdür.
- Dört tür kümeleme yöntemi vardır: 1) Dışlayıcı 2) Aglomeratif 3) Örtüşen 4) Olasılığa dayalı.
- Önemli kümeleme türleri şunlardır: 1) Hiyerarşik kümeleme 2) K-ortalamalar kümeleme 3) K-NN 4) Temel Bileşen Analizi 5) Tekil Değer Ayrıştırma 6) Bağımsız Bileşen Analizi.
- Birliktelik kuralları, büyük veritabanlarındaki veri nesneleri arasında ilişkiler kurmanıza olanak tanır.
- Denetimli öğrenmede, Algorithms Denetimsiz öğrenme sırasında etiketli veriler kullanılarak eğitilir Algorithms etiketlenmemiş verilere karşı kullanılır.
- Anormallik tespiti, veri kümenizdeki sahte işlemlerin bulunmasında yararlı olan önemli veri noktalarını keşfedebilir.
- Denetimsiz öğrenmenin en büyük dezavantajı veri sıralama konusunda kesin bilgi alamamanızdır.