Denetimsiz Makine Öğrenimi: Algorithms, Örnekli Türler

Denetimsiz Öğrenme Nedir?

Denetimsiz Öğrenme kullanıcıların modeli denetlemesine gerek olmayan bir makine öğrenme tekniğidir. Bunun yerine, modelin daha önce fark edilmeyen kalıpları ve bilgileri keşfetmesi için kendi başına çalışmasına olanak tanır. Esas olarak etiketlenmemiş verilerle ilgilenir.

Denetimsiz Öğrenme Algorithms

Denetimsiz Öğrenme Algorithms kullanıcıların denetlenen öğrenmeye kıyasla daha karmaşık işlem görevleri gerçekleştirmesine izin verir. Bununla birlikte, denetlenmeyen öğrenme diğer doğal öğrenme yöntemlerine kıyasla daha öngörülemez olabilir. Denetlenmeyen öğrenme algoritmaları kümeleme, anormallik tespiti, sinir ağları vb. içerir.

Denetimsiz Makine Öğrenimi Örneği

Bir bebek ve ailesinin köpeği için Denetimsiz Öğrenme örneğini ele alalım.

Denetimsiz Makine Öğrenimi Örneği

Bu köpeği tanıyor ve tanıyor. Birkaç hafta sonra bir aile dostu bir köpek getiriyor ve bebekle oynamaya çalışıyor.

Denetimsiz Makine Öğrenimi Örneği

Bebek bu köpeği daha önce görmedi. Ancak birçok özelliğinin (2 kulak, göz, 4 ayak üzerinde yürüme) evcil köpeğine benzediğinin farkındadır. Yeni hayvanı köpek olarak tanımlıyor. Bu, size öğretilmeyen ancak verilerden (bu durumda bir köpeğe ilişkin veriler) öğrendiğiniz denetimsiz öğrenmedir. denetimli öğrenmeolsaydı, aile dostu bebeğe yukarıdaki Denetimsiz Öğrenme örneğinde gösterildiği gibi onun bir köpek olduğunu söylerdi.

Neden Denetimsiz Öğrenme?

Denetimsiz Öğrenmeyi kullanmanın başlıca nedenleri şunlardır: Makine öğrenmesi:

  • Denetimsiz makine öğrenimi, verilerdeki her türlü bilinmeyen modeli bulur.
  • Denetimsiz yöntemler, kategorizasyon için yararlı olabilecek özellikleri bulmanıza yardımcı olur.
  • Gerçek zamanlı olarak gerçekleştiğinden, tüm girdi verileri öğrencilerin huzurunda analiz edilecek ve etiketlenecektir.
  • Etiketsiz verileri bilgisayardan almak, manuel müdahale gerektiren etiketli verilere göre daha kolaydır.

ClusterDenetimsiz Öğrenme Türleri Algorithms

Denetimsiz Makine Öğrenimi algoritmalarının kümeleme türleri aşağıda verilmiştir:

Denetimsiz öğrenme sorunları ayrıca kümeleme ve ilişkilendirme sorunları olarak gruplandırılır.

Clustering

Clustering
Clustering

ClusterDenetimsiz öğrenme söz konusu olduğunda öğrenme önemli bir kavramdır. Temel olarak kategorize edilmemiş verilerden oluşan bir koleksiyonda bir yapı veya model bulmakla ilgilenir. Denetimsiz Öğrenme ClusterAlgoritmalar verilerinizi işleyecek ve verilerde varsa doğal kümeleri (grupları) bulacaktır. Ayrıca algoritmalarınızın kaç kümeyi tanımlaması gerektiğini de değiştirebilirsiniz. Bu grupların ayrıntı düzeyini ayarlamanıza olanak tanır.

Kullanabileceğiniz farklı kümeleme türleri vardır:

Özel (bölümleme)

Bu kümeleme yönteminde veriler, bir veri yalnızca bir kümeye ait olacak şekilde gruplanır.

Örnek: K-aracı

Aglomeratif

Bu kümeleme tekniğinde, her veri bir kümedir. En yakın iki küme arasındaki yinelemeli birleşimler küme sayısını azaltır.

Örnek: Hiyerarşik kümeleme

Çakışan

Bu teknikte verileri kümelemek için bulanık kümeler kullanılır. Her nokta, farklı üyelik derecelerine sahip iki veya daha fazla kümeye ait olabilir.

Burada veriler uygun bir üyelik değeriyle ilişkilendirilecektir. Örnek: Bulanık C-Ortalamalar

Olasılık

Bu teknik, kümeleri oluşturmak için olasılık dağılımını kullanır

Örnek: Aşağıdaki anahtar kelimeler

  • "Erkek ayakkabısı."
  • “kadın ayakkabısı.”
  • “kadın eldiveni.”
  • "Erkek eldiveni."

“ayakkabı” ve “eldiven” veya “erkek” ve “kadın” olmak üzere iki kategoriye ayrılabilir.

ClusterTürler

Makine Öğrenmesinin kümeleme türleri şunlardır:

  • Hiyerarşik kümeleme
  • K-kümeleme anlamına gelir
  • K-NN (k en yakın komşu)
  • Temel bileşenler Analizi
  • Tekil Değer Ayrışımı
  • Bağımsız Bileşen Analizi

Hiyerarşik Clustering

Hiyerarşik kümeleme, kümelerin hiyerarşisini oluşturan bir algoritmadır. Kendi kümelerine atanan tüm verilerle başlar. Burada, iki yakın küme aynı kümede olacaktır. Bu algoritma, yalnızca bir küme kaldığında sona erer.

K-anlamı Clustering

K, her yineleme için en yüksek değeri bulmanıza yardımcı olan yinelemeli bir kümeleme algoritması olduğu anlamına gelir. Başlangıçta istenilen sayıda küme seçilir. Bu kümeleme yönteminde veri noktalarını k grup halinde kümelemeniz gerekir. Daha büyük bir k, aynı şekilde daha fazla ayrıntı düzeyine sahip daha küçük gruplar anlamına gelir. Daha düşük bir k, daha az ayrıntı düzeyine sahip daha büyük gruplar anlamına gelir.

Algoritmanın çıktısı bir grup “etiket”tir. Veri noktasını k gruplarından birine atar. K-ortalamalı kümelemede her grup, her grup için bir ağırlık merkezi oluşturularak tanımlanır. Merkezler, kendilerine en yakın noktaları yakalayan ve onları kümeye ekleyen kümenin kalbi gibidir.

K-ortalama kümeleme ayrıca iki alt grubu tanımlar:

  • Aglomeratif kümeleme
  • Dendrogram

Aglomeratif kümeleme

Bu tür K-ortalama kümelemesi sabit sayıda kümeyle başlar. Tüm verileri tam sayıda kümeye tahsis eder. Bu kümeleme yöntemi, girdi olarak K kümesi sayısını gerektirmez. Aglomerasyon işlemi her verinin tek bir küme halinde oluşturulmasıyla başlar.

Bu yöntem bir miktar mesafe ölçüsü kullanır, birleştirme işlemiyle küme sayısını (her yinelemede bir tane) azaltır. Son olarak tüm nesneleri içeren büyük bir kümemiz var.

Dendrogram

Dendrogram kümeleme yönteminde her düzey olası bir kümeyi temsil edecektir. Dendrogramın yüksekliği iki birleştirme kümesi arasındaki benzerlik düzeyini gösterir. Sürecin dibine yaklaştıkça daha benzer kümeler oluşur, bu da grubun dendrogramdan doğal olmayan ve çoğunlukla subjektif olarak bulunmasıdır.

K- En yakın komşular

K-en yakın komşu, tüm makine öğrenimi sınıflandırıcılarının en basit olanıdır. Diğer makine öğrenimi tekniklerinden farklıdır, çünkü bir model üretmez. Tüm mevcut durumları depolayan ve yeni örnekleri benzerlik ölçüsüne göre sınıflandıran basit bir algoritmadır.

Örnekler arasında mesafe olduğunda çok iyi çalışır. Eğitim seti büyük olduğunda ve mesafe hesaplaması önemsiz olduğunda öğrenme hızı yavaştır.

Temel bileşenler Analizi

Daha yüksek boyutlu bir uzay istiyorsanız. Bu uzay için bir temel ve bu temelin yalnızca en önemli 200 puanını seçmeniz gerekir. Bu temel, bir ana bileşen olarak bilinir. Seçtiğiniz alt küme, orijinal uzaya kıyasla küçük boyutlu yeni bir uzaydır. Mümkün olduğunca çok veri karmaşıklığını korur.

Dernek

Birliktelik kuralları, büyük veritabanlarındaki veri nesneleri arasında ilişkiler kurmanıza olanak tanır. Bu denetimsiz teknik, büyük veritabanlarındaki değişkenler arasındaki ilginç ilişkileri keşfetmeyle ilgilidir. Örneğin, yeni bir ev satın alan kişilerin büyük olasılıkla yeni mobilya satın alma olasılıkları yüksektir.

Diğer Örnekler:

  • Gen ekspresyonu ölçümlerine göre gruplandırılmış bir kanser hastası alt grubu
  • Göz atma ve satın alma geçmişlerine göre alışveriş yapan gruplar
  • Film izleyicilerinin verdiği derecelendirmeye göre film grubu

Denetimli ve Denetimsiz Makine Öğrenimi Karşılaştırması

İşte arasındaki temel fark Denetimli ve Denetimsiz Öğrenme Karşılaştırması:

Parametreler Denetimli makine öğrenimi tekniği Denetimsiz makine öğrenimi tekniği
Giriş Verileri Algorithms etiketlenmiş veriler kullanılarak eğitilir. Algorithms etiketlenmemiş verilere karşı kullanılır
Hesaplamalı Karmaşıklık Denetimli öğrenme daha basit bir yöntemdir. Gözetimsiz öğrenme hesaplama açısından karmaşıktır
doğruluk Son derece doğru ve güvenilir bir yöntem. Less Doğru ve güvenilir yöntem.

Denetimsiz Makine Öğrenimi Uygulamaları

Denetimsiz Öğrenme Tekniklerinin bazı uygulamaları şunlardır:

  • Clusterveri kümesini benzerliklerine göre otomatik olarak gruplara ayırma
  • Anormallik tespiti, veri kümenizdeki olağandışı veri noktalarını keşfedebilir. Hileli işlemleri bulmak için kullanışlıdır
  • İlişkilendirme madenciliği, veri kümenizde sıklıkla bir arada bulunan öğe kümelerini tanımlar
  • Gizli değişken modelleri, veri ön işlemede yaygın olarak kullanılmaktadır. Bir veri kümesindeki özellik sayısını azaltmak veya veri kümesini birden fazla bileşene ayırmak gibi

Denetimsiz Öğrenmenin Dezavantajları

  • Denetimsiz öğrenmede kullanılan veriler etiketlendiğinden ve bilinmediğinden veri sıralama konusunda kesin bilgi elde edemezsiniz ve çıktı
  • Less Sonuçların doğruluğu, girdi verilerinin önceden insanlar tarafından bilinmemesi ve etiketlenmemesinden kaynaklanmaktadır. Bu, makinenin bunu kendisinin yapması gerektiği anlamına gelir.
  • Spektral sınıflar her zaman bilgi sınıflarına karşılık gelmez.
  • Kullanıcının bu sınıflandırmayı takip eden sınıfları yorumlamak ve etiketlemek için zaman harcaması gerekir.
  • Sınıfların spektral özellikleri de zamanla değişebildiği için bir görüntüden diğerine geçerken aynı sınıf bilgisine sahip olamazsınız.

ÖZET

  • Denetimsiz öğrenme, modeli denetlemenize gerek olmayan bir makine öğrenme tekniğidir.
  • Denetimsiz makine öğrenimi, verilerdeki her türlü bilinmeyen modeli bulmanıza yardımcı olur.
  • ClusterÖğrenme ve İlişkilendirme, Denetimsiz öğrenmenin iki türüdür.
  • Dört tür kümeleme yöntemi vardır: 1) Dışlayıcı 2) Aglomeratif 3) Örtüşen 4) Olasılığa dayalı.
  • Önemli kümeleme türleri şunlardır: 1) Hiyerarşik kümeleme 2) K-ortalamalar kümeleme 3) K-NN 4) Temel Bileşen Analizi 5) Tekil Değer Ayrıştırma 6) Bağımsız Bileşen Analizi.
  • Birliktelik kuralları, büyük veritabanlarındaki veri nesneleri arasında ilişkiler kurmanıza olanak tanır.
  • Denetimli öğrenmede, Algorithms Denetimsiz öğrenme sırasında etiketli veriler kullanılarak eğitilir Algorithms etiketlenmemiş verilere karşı kullanılır.
  • Anormallik tespiti, veri kümenizdeki sahte işlemlerin bulunmasında yararlı olan önemli veri noktalarını keşfedebilir.
  • Denetimsiz öğrenmenin en büyük dezavantajı veri sıralama konusunda kesin bilgi alamamanızdır.