Pembelajaran Mesin Tanpa Pengawasan: Algorithms, Ketik dengan Contoh

Apa itu Pembelajaran Tanpa Pengawasan?

Pembelajaran Tanpa Pengawasan adalah teknik pembelajaran mesin di mana pengguna tidak perlu mengawasi modelnya. Sebaliknya, hal ini memungkinkan model untuk bekerja sendiri untuk menemukan pola dan informasi yang sebelumnya tidak terdeteksi. Ini terutama berkaitan dengan data yang tidak berlabel.

Pembelajaran Tanpa Pengawasan Algorithms

Pembelajaran Tanpa Pengawasan Algorithms memungkinkan pengguna untuk melakukan tugas pemrosesan yang lebih kompleks dibandingkan dengan pembelajaran terbimbing. Meskipun demikian, pembelajaran tanpa pengawasan dapat lebih tidak terduga dibandingkan dengan metode pembelajaran alami lainnya. Algoritma pembelajaran tanpa pengawasan meliputi pengelompokan, deteksi anomali, jaringan saraf, dll.

Contoh Pembelajaran Mesin Tanpa Pengawasan

Mari kita ambil contoh Pembelajaran Tanpa Pengawasan untuk bayi dan anjing keluarganya.

Contoh Pembelajaran Mesin Tanpa Pengawasan

Dia mengenali dan mengenali anjing ini. Beberapa minggu kemudian seorang teman keluarga membawa serta seekor anjing dan mencoba bermain dengan bayi itu.

Contoh Pembelajaran Mesin Tanpa Pengawasan

Baby belum pernah melihat anjing ini sebelumnya. Namun ia mengenali banyak ciri (2 telinga, mata, berjalan dengan 4 kaki) seperti anjing peliharaannya. Dia mengidentifikasi hewan baru itu sebagai seekor anjing. Ini adalah pembelajaran tanpa pengawasan, di mana Anda tidak diajari tetapi Anda belajar dari data (dalam hal ini data tentang seekor anjing.) Seandainya hal ini terjadi pembelajaran yang diawasi, teman keluarga akan memberi tahu bayinya bahwa itu adalah seekor anjing seperti yang ditunjukkan dalam contoh Pembelajaran Tanpa Pengawasan di atas.

Mengapa Pembelajaran Tanpa Pengawasan?

Berikut adalah alasan utama untuk menggunakan Pembelajaran Tanpa Pengawasan Pembelajaran mesin:

  • Pembelajaran mesin tanpa pengawasan menemukan semua jenis pola yang tidak diketahui dalam data.
  • Metode tanpa pengawasan membantu Anda menemukan fitur yang berguna untuk kategorisasi.
  • Hal ini berlangsung secara real time, sehingga semua data masukan dianalisis dan diberi label di hadapan peserta didik.
  • Lebih mudah mendapatkan data tak berlabel dari komputer dibandingkan data berlabel, yang memerlukan intervensi manual.

Clustering Jenis Pembelajaran Tanpa Pengawasan Algorithms

Di bawah ini adalah jenis pengelompokan algoritma Pembelajaran Mesin Tanpa Pengawasan:

Masalah pembelajaran tanpa pengawasan dikelompokkan lagi menjadi masalah pengelompokan dan asosiasi.

Clustering

Clustering
Clustering

Clustering adalah konsep penting dalam pembelajaran tanpa pengawasan. Ini terutama berkaitan dengan menemukan struktur atau pola dalam kumpulan data yang tidak dikategorikan. Pembelajaran Tanpa Pengawasan ClusterAlgoritme pemrosesan data akan memproses data Anda dan menemukan klaster (kelompok) alami jika ada dalam data. Anda juga dapat mengubah jumlah klaster yang harus diidentifikasi oleh algoritme Anda. Ini memungkinkan Anda untuk menyesuaikan tingkat ketelitian kelompok-kelompok ini.

Ada berbagai jenis pengelompokan yang dapat Anda manfaatkan:

Eksklusif (mempartisi)

Dalam metode clustering ini, Data dikelompokkan sedemikian rupa sehingga satu data dapat dimiliki oleh satu cluster saja.

Contoh: K-means

Aglomerasi

Dalam teknik pengelompokan ini, setiap data merupakan sebuah klaster. Penyatuan berulang antara dua klaster terdekat mengurangi jumlah klaster.

Contoh: Pengelompokan hierarkis

Tumpang tindih

Dalam teknik ini, himpunan fuzzy digunakan untuk mengelompokkan data. Tiap titik dapat tergabung dalam dua atau lebih klaster dengan derajat keanggotaan yang berbeda.

Di sini, data akan dikaitkan dengan nilai keanggotaan yang sesuai. Contoh: Fuzzy C-Means

Probabilistik

Teknik ini menggunakan distribusi probabilitas untuk membuat cluster

Contoh: Mengikuti kata kunci

  • “sepatu pria.”
  • “sepatu wanita.”
  • “sarung tangan wanita.”
  • “sarung tangan pria.”

dapat dikelompokkan menjadi dua kategori “sepatu” dan “sarung tangan” atau “pria” dan “wanita”.

ClusterJenis

Berikut ini adalah jenis pengelompokan Pembelajaran Mesin:

  • Pengelompokan hierarkis
  • Pengelompokan K-means
  • K-NN (k tetangga terdekat)
  • Analisis Komponen Utama
  • Dekomposisi Nilai Singular
  • Analisis Komponen Independen

Hierarkis Clustering

Pengelompokan hierarkis adalah algoritma yang membangun hierarki klaster. Dimulai dengan semua data yang ditetapkan ke klasternya sendiri. Di sini, dua klaster yang berdekatan akan berada dalam klaster yang sama. Algoritma ini berakhir saat hanya tersisa satu klaster.

K-berarti Clustering

K artinya ini adalah algoritma pengelompokan berulang yang membantu Anda menemukan nilai tertinggi untuk setiap iterasi. Awalnya, jumlah cluster yang diinginkan dipilih. Dalam metode pengelompokan ini, Anda perlu mengelompokkan titik data ke dalam k kelompok. K yang lebih besar berarti kelompok yang lebih kecil dengan granularitas yang lebih besar dengan cara yang sama. K yang lebih rendah berarti kelompok yang lebih besar dengan granularitas yang lebih sedikit.

Output dari algoritma ini adalah sekelompok “label.” Ini menugaskan titik data ke salah satu dari k grup. Dalam pengelompokan k-means, setiap grup ditentukan dengan membuat centroid untuk setiap grup. Centroid seperti jantung cluster, yang menangkap titik-titik terdekat dan menambahkannya ke cluster.

Pengelompokan K-mean selanjutnya mendefinisikan dua subkelompok:

  • Pengelompokan aglomeratif
  • dendrogram

Pengelompokan aglomeratif

Jenis pengelompokan K-means ini dimulai dengan jumlah klaster yang tetap. Ini mengalokasikan semua data ke dalam jumlah cluster yang tepat. Metode clustering ini tidak memerlukan jumlah cluster K sebagai inputnya. Proses aglomerasi dimulai dengan membentuk setiap data menjadi satu cluster.

Metode ini menggunakan beberapa ukuran jarak, mengurangi jumlah cluster (satu dalam setiap iterasi) dengan proses penggabungan. Terakhir, kita memiliki satu cluster besar yang berisi semua objek.

dendrogram

Pada metode clustering Dendrogram, setiap level akan mewakili cluster yang mungkin ada. Ketinggian dendrogram menunjukkan tingkat kemiripan antara dua cluster yang bergabung. Semakin dekat ke bagian bawah proses maka semakin mirip cluster yang merupakan temuan kelompok dari dendrogram yang tidak natural dan sebagian besar subjektif.

K- Tetangga terdekat

K- nearest neighbor adalah pengklasifikasi machine learning yang paling sederhana. Berbeda dari teknik machine learning lainnya, K- nearest neighbor tidak menghasilkan model. K- nearest neighbor adalah algoritme sederhana yang menyimpan semua kasus yang tersedia dan mengklasifikasikan kasus baru berdasarkan ukuran kesamaan.

Ini bekerja dengan sangat baik ketika ada jarak antar contoh. Kecepatan belajarnya lambat ketika set pelatihannya besar, dan penghitungan jaraknya tidak sepele.

Analisis Komponen Utama

Jika Anda menginginkan ruang berdimensi lebih tinggi. Anda perlu memilih basis untuk ruang tersebut dan hanya 200 skor terpenting dari basis tersebut. Basis ini dikenal sebagai komponen utama. Subset yang Anda pilih merupakan ruang baru yang ukurannya lebih kecil dibandingkan dengan ruang asli. Subset ini mempertahankan kompleksitas data sebanyak mungkin.

Asosiasi

Aturan asosiasi memungkinkan Anda membuat asosiasi antar objek data di dalam database besar. Teknik tanpa pengawasan ini adalah tentang menemukan hubungan menarik antar variabel dalam database besar. Misalnya, orang yang membeli rumah baru kemungkinan besar akan membeli furnitur baru.

Contoh lain:

  • Subkelompok pasien kanker yang dikelompokkan berdasarkan pengukuran ekspresi gen mereka
  • Kelompok pembeli berdasarkan riwayat penelusuran dan pembelian mereka
  • Kelompokkan film berdasarkan rating yang diberikan oleh penonton film

Pembelajaran Mesin yang Diawasi vs. Tanpa Pengawasan

Inilah perbedaan utama antara keduanya Pembelajaran yang Diawasi vs. Tanpa Pengawasan:

Parameters Teknik pembelajaran mesin yang diawasi Teknik pembelajaran mesin tanpa pengawasan
Memasukan data Algorithms dilatih menggunakan data berlabel. Algorithms digunakan terhadap data yang tidak diberi label
Kompleksitas Komputasi Pembelajaran yang diawasi adalah metode yang lebih sederhana. Pembelajaran tanpa pengawasan memiliki kompleksitas komputasi
Ketepatan Metode yang sangat akurat dan dapat dipercaya. Less metode yang akurat dan dapat dipercaya.

Penerapan Pembelajaran Mesin Tanpa Pengawasan

Beberapa penerapan Teknik Unsupervised Learning adalah:

  • Clustering secara otomatis membagi kumpulan data menjadi beberapa kelompok berdasarkan kesamaannya
  • Deteksi anomali dapat menemukan titik data yang tidak biasa dalam kumpulan data Anda. Berguna untuk menemukan transaksi penipuan
  • Penambangan asosiasi mengidentifikasi kumpulan item yang sering muncul bersamaan dalam kumpulan data Anda
  • Model variabel laten banyak digunakan untuk prapemrosesan data. Seperti mengurangi jumlah fitur dalam suatu dataset atau menguraikan dataset menjadi beberapa komponen

Kekurangan Pembelajaran Tanpa Pengawasan

  • Anda tidak bisa mendapatkan informasi yang tepat mengenai penyortiran data, dan keluarannya karena data yang digunakan dalam pembelajaran tanpa pengawasan diberi label dan tidak diketahui
  • Less keakuratan hasil dikarenakan data masukan tidak diketahui dan tidak diberi label oleh orang terlebih dahulu. Artinya, mesin harus melakukan hal ini sendiri.
  • Kelas spektral tidak selalu sesuai dengan kelas informasional.
  • Pengguna perlu meluangkan waktu untuk menafsirkan dan memberi label pada kelas yang mengikuti klasifikasi tersebut.
  • Properti spektral kelas juga dapat berubah seiring waktu sehingga Anda tidak dapat memiliki informasi kelas yang sama saat berpindah dari satu gambar ke gambar lainnya.

Kesimpulan

  • Pembelajaran tanpa pengawasan adalah teknik pembelajaran mesin, di mana Anda tidak perlu mengawasi modelnya.
  • Pembelajaran mesin tanpa pengawasan membantu Anda menemukan semua jenis pola yang tidak diketahui dalam data.
  • Clustering dan Asosiasi adalah dua jenis pembelajaran tanpa pengawasan.
  • Empat jenis metode clustering adalah 1) Eksklusif 2) Agglomeratif 3) Tumpang tindih 4) Probabilistik.
  • Tipe pengelompokan yang penting adalah: 1) Pengelompokan hierarkis 2) Pengelompokan K-means 3) K-NN 4) Analisis Komponen Utama 5) Dekomposisi Nilai Singular 6) Analisis Komponen Independen.
  • Aturan asosiasi memungkinkan Anda membuat asosiasi antar objek data di dalam database besar.
  • Dalam pembelajaran yang diawasi, Algorithms dilatih menggunakan data berlabel saat berada dalam pembelajaran tanpa pengawasan Algorithms digunakan terhadap data yang tidak diberi label.
  • Deteksi anomali dapat menemukan titik data penting dalam dataset Anda yang berguna untuk menemukan transaksi penipuan.
  • Kelemahan terbesar dari pembelajaran tanpa pengawasan adalah Anda tidak bisa mendapatkan informasi yang tepat mengenai penyortiran data.