Tutorial Machine Learning untuk Pemula: Apa Itu Dasar-Dasar ML
Apa itu Pembelajaran Mesin?
Pembelajaran mesin adalah sistem algoritma komputer yang dapat belajar dari contoh melalui pengembangan diri tanpa dikodekan secara eksplisit oleh seorang programmer. Pembelajaran mesin adalah bagian dari Kecerdasan Buatan yang menggabungkan data dengan alat statistik untuk memprediksi keluaran yang dapat digunakan untuk menghasilkan wawasan yang dapat ditindaklanjuti.
Terobosan ini hadir dengan gagasan bahwa mesin dapat belajar dari data (misalnya contoh) untuk menghasilkan hasil yang akurat. Pembelajaran mesin berkaitan erat dengan penambangan data dan pemodelan prediktif Bayesian. Mesin menerima data sebagai masukan dan menggunakan algoritma untuk merumuskan jawaban.
Tugas pembelajaran mesin yang umum adalah memberikan rekomendasi. Bagi yang mempunyai Netflix akun, semua rekomendasi film atau serial didasarkan pada data historis pengguna. Perusahaan teknologi menggunakan belajar tanpa pengawasan untuk meningkatkan pengalaman pengguna dengan mempersonalisasi rekomendasi.
Pembelajaran mesin juga digunakan untuk berbagai tugas seperti deteksi penipuan, pemeliharaan prediktif, optimalisasi portofolio, otomatisasi tugas, dan sebagainya.
Pembelajaran Mesin vs. Pemrograman Tradisional
Pemrograman tradisional berbeda secara signifikan dari pembelajaran mesin. Dalam pemrograman tradisional, seorang programmer membuat kode semua aturan dengan berkonsultasi dengan seorang ahli dalam industri tempat perangkat lunak tersebut dikembangkan. Setiap aturan didasarkan pada landasan logis; mesin akan mengeksekusi output mengikuti pernyataan logis. Ketika sistem menjadi rumit, lebih banyak aturan perlu ditulis. Sistem dapat dengan cepat menjadi tidak berkelanjutan untuk dipertahankan.

Pembelajaran mesin seharusnya mengatasi masalah ini. Mesin mempelajari bagaimana data input dan output dikorelasikan dan menulis aturan. Pemrogram tidak perlu menulis aturan baru setiap kali ada data baru. Algoritmenya beradaptasi sebagai respons terhadap data dan pengalaman baru untuk meningkatkan kemanjuran seiring berjalannya waktu.
Bagaimana Cara Kerja Pembelajaran Mesin?
Sekarang dalam tutorial dasar-dasar Machine learning untuk pemula, kita akan mempelajari cara kerja Machine Learning (ML):
Pembelajaran mesin adalah otak tempat semua pembelajaran terjadi. Cara mesin belajar mirip dengan manusia. Manusia belajar dari pengalaman. Semakin banyak kita tahu, semakin mudah kita memprediksinya. Analoginya, ketika kita menghadapi situasi yang tidak diketahui, kemungkinan keberhasilannya lebih rendah dibandingkan situasi yang diketahui. Mesin dilatih dengan cara yang sama. Untuk membuat prediksi yang akurat, mesin melihat sebuah contoh. Saat kami memberikan contoh serupa pada mesin, ia dapat mengetahui hasilnya. Namun, seperti halnya manusia, jika makanannya merupakan contoh yang belum pernah terlihat sebelumnya, maka mesin akan kesulitan untuk memprediksinya.
Tujuan inti dari pembelajaran mesin adalah pengetahuan dan kesimpulan. Pertama-tama, mesin belajar melalui penemuan pola. Penemuan ini terjadi berkat data. Salah satu bagian penting dari data scientist adalah memilih dengan cermat data mana yang akan diberikan ke mesin. Daftar atribut yang digunakan untuk menyelesaikan suatu masalah disebut a vektor fitur. Anda dapat menganggap vektor fitur sebagai subkumpulan data yang digunakan untuk mengatasi suatu masalah.
Mesin tersebut menggunakan beberapa algoritma canggih untuk menyederhanakan kenyataan dan mengubah penemuan ini menjadi sebuah model. Oleh karena itu, tahap pembelajaran digunakan untuk mendeskripsikan data dan merangkumnya menjadi suatu model.
Misalnya, mesin tersebut mencoba memahami hubungan antara upah seseorang dan kemungkinan pergi ke restoran mewah. Ternyata mesin tersebut menemukan hubungan positif antara upah dan pergi ke restoran kelas atas: Inilah modelnya
Menyimpulkan
Saat model dibuat, dimungkinkan untuk menguji seberapa kuat model tersebut pada data yang belum pernah dilihat sebelumnya. Data baru diubah menjadi vektor fitur, melalui model dan memberikan prediksi. Ini semua adalah bagian indah dari pembelajaran mesin. Tidak perlu memperbarui aturan atau melatih model lagi. Anda dapat menggunakan model yang telah dilatih sebelumnya untuk membuat inferensi pada data baru.
Kehidupan program Pembelajaran Mesin sangatlah sederhana dan dapat diringkas dalam poin-poin berikut:
- Tentukan pertanyaan
- Mengumpulkan data
- Visualisasikan data
- Algoritma kereta
- Uji Algoritmanya
- Kumpulkan umpan balik
- Sempurnakan algoritmanya
- Ulangi 4-7 hingga hasilnya memuaskan
- Gunakan model untuk membuat prediksi
Setelah algoritma menjadi mahir dalam menarik kesimpulan yang tepat, ia menerapkan pengetahuan itu ke kumpulan data baru.
Pembelajaran mesin Algorithms dan Dimana Digunakan?
Sekarang dalam tutorial Machine learning untuk pemula ini, kita akan mempelajari di mana algoritma Machine Learning (ML) digunakan:
Pembelajaran mesin dapat dikelompokkan menjadi dua tugas pembelajaran yang luas: Diawasi dan Tanpa Pengawasan. Masih banyak algoritma lainnya
Pembelajaran terawasi
Suatu algoritma menggunakan data pelatihan dan umpan balik dari manusia untuk mempelajari hubungan masukan yang diberikan dengan keluaran tertentu. Misalnya, seorang praktisi dapat menggunakan biaya pemasaran dan ramalan cuaca sebagai data masukan untuk memprediksi penjualan kaleng.
Anda dapat menggunakan pembelajaran yang diawasi ketika data keluarannya diketahui. Algoritme akan memprediksi data baru.
Ada dua kategori dari pembelajaran yang diawasi:
- Tugas klasifikasi
- Tugas regresi
Klasifikasi
Bayangkan Anda ingin memprediksi jenis kelamin pelanggan untuk sebuah iklan. Anda akan mulai mengumpulkan data tentang tinggi badan, berat badan, pekerjaan, gaji, keranjang pembelian, dll dari database pelanggan Anda. Anda mengetahui jenis kelamin setiap pelanggan Anda, bisa saja laki-laki atau perempuan. Tujuan dari pengklasifikasian adalah untuk menetapkan kemungkinan menjadi laki-laki atau perempuan (yaitu label) berdasarkan informasi (yaitu fitur yang telah Anda kumpulkan). Saat model mempelajari cara mengenali pria atau wanita, Anda dapat menggunakan data baru untuk membuat prediksi. Misalnya, Anda baru saja mendapat informasi baru dari pelanggan yang tidak dikenal, dan Anda ingin mengetahui apakah pelanggan tersebut laki-laki atau perempuan. Jika pengklasifikasi memprediksi laki-laki = 70%, berarti algoritma yakin pada 70% bahwa pelanggan ini adalah laki-laki, dan 30% adalah perempuan.
Labelnya bisa terdiri dari dua kelas atau lebih. Contoh Machine learning di atas hanya memiliki dua kelas, tetapi jika pengklasifikasi perlu memprediksi objek, maka pengklasifikasi tersebut memiliki lusinan kelas (misalnya, kaca, meja, sepatu, dll. setiap objek mewakili sebuah kelas)
Regresi
Jika keluarannya berupa nilai kontinu, tugasnya adalah regresi. Misalnya, seorang analis keuangan mungkin perlu memperkirakan nilai suatu saham berdasarkan serangkaian fitur seperti ekuitas, kinerja saham sebelumnya, indeks makroekonomi. Sistem akan dilatih untuk memperkirakan harga saham dengan kesalahan serendah mungkin.
| Algoritma | Uraian Teknis | Tipe |
|---|---|---|
| Regresi linier | Menemukan cara untuk menghubungkan setiap fitur dengan keluaran untuk membantu memprediksi nilai masa depan. | Regresi |
| Regresi logistik | Perpanjangan regresi linier yang digunakan untuk tugas klasifikasi. Variabel keluarannya adalah biner (misalnya, hanya hitam atau putih) dan bukan kontinu (misalnya, daftar warna potensial yang tak terhingga) | Klasifikasi |
| Pohon keputusan | Model klasifikasi atau regresi yang sangat mudah diinterpretasikan yang membagi nilai fitur data menjadi cabang-cabang pada simpul keputusan (misalnya, jika fitur adalah sebuah warna, setiap warna yang mungkin menjadi cabang baru) hingga keluaran keputusan akhir dibuat | Regresi Klasifikasi |
| Bayes Naif | Metode Bayesian merupakan metode klasifikasi yang menggunakan teorema Bayesian. Teorema ini memperbarui pengetahuan sebelumnya tentang suatu peristiwa dengan probabilitas independen dari setiap fitur yang dapat mempengaruhi peristiwa tersebut. | Regresi Klasifikasi |
| Mesin dukungan vektor |
Support Vector Machine, atau SVM, biasanya digunakan untuk tugas klasifikasi. Algoritma SVM menemukan hyperplane yang membagi kelas secara optimal. Paling baik digunakan dengan pemecah non-linier. |
Regresi (tidak terlalu umum) Klasifikasi |
| Hutan acak | Algoritme ini dibangun berdasarkan pohon keputusan untuk meningkatkan akurasi secara drastis. Hutan acak menghasilkan pohon keputusan sederhana berkali-kali dan menggunakan metode 'suara mayoritas' untuk memutuskan label mana yang akan dikembalikan. Untuk tugas klasifikasi, prediksi akhir adalah yang mendapat suara terbanyak; sedangkan untuk tugas regresi, prediksi rata-rata seluruh pohon merupakan prediksi akhir. | Regresi Klasifikasi |
| AdaBoost | Teknik klasifikasi atau regresi yang menggunakan banyak model untuk menghasilkan keputusan tetapi menimbangnya berdasarkan keakuratannya dalam memprediksi hasilnya | Regresi Klasifikasi |
| Pohon yang meningkatkan gradien | Pohon penambah gradien adalah teknik klasifikasi/regresi yang canggih. Ia berfokus pada kesalahan yang dilakukan oleh pohon sebelumnya dan mencoba memperbaikinya. | Regresi Klasifikasi |
Pembelajaran tanpa pengawasan
Dalam pembelajaran tanpa pengawasan, algoritme mengeksplorasi data masukan tanpa diberi variabel keluaran yang eksplisit (misalnya, mengeksplorasi data demografi pelanggan untuk mengidentifikasi pola)
Anda dapat menggunakannya ketika Anda tidak tahu cara mengklasifikasikan data, dan Anda ingin algoritme menemukan pola dan mengklasifikasikan data untuk Anda
| Nama Algoritma | Uraian Teknis | Tipe |
|---|---|---|
| Pengelompokan K-means | Menempatkan data ke dalam beberapa kelompok (k) yang masing-masing berisi data dengan karakteristik serupa (ditentukan oleh model, bukan ditentukan terlebih dahulu oleh manusia) | Clustering |
| model campuran Gaussian | Generalisasi pengelompokan k-means yang memberikan lebih banyak fleksibilitas dalam ukuran dan bentuk kelompok (cluster) | Clustering |
| Pengelompokan hierarkis | Membagi kelompok sepanjang pohon hierarki untuk membentuk sistem klasifikasi.
Dapat digunakan untuk Cluster pelanggan kartu loyalitas |
Clustering |
| Sistem pemberi rekomendasi | Membantu menentukan data yang relevan untuk membuat rekomendasi. | Clustering |
| PCA/T-SNE | Sebagian besar digunakan untuk mengurangi dimensi data. Algoritme mengurangi jumlah fitur menjadi 3 atau 4 vektor dengan varian tertinggi. | Pengurangan Dimensi |
Cara Memilih Algoritma Pembelajaran Mesin
Sekarang dalam tutorial dasar-dasar Machine learning ini, kita akan mempelajari cara memilih algoritma Machine Learning (ML):
Ada banyak algoritma pembelajaran mesin. Pemilihan algoritma didasarkan pada tujuannya.
Pada contoh Machine learning di bawah, tugasnya adalah memprediksi jenis bunga di antara ketiga varietas tersebut. Prediksinya didasarkan pada panjang dan lebar kelopak. Gambar tersebut menggambarkan hasil dari sepuluh algoritma yang berbeda. Gambar di kiri atas adalah dataset. Data diklasifikasikan menjadi tiga kategori: merah, biru muda dan biru tua. Ada beberapa pengelompokan. Misalnya dari gambar kedua, semua yang ada di kiri atas termasuk dalam kategori merah, di bagian tengah terdapat campuran ketidakpastian dan biru muda, sedangkan di bagian bawah termasuk kategori gelap. Gambar lain menunjukkan algoritma yang berbeda dan cara mereka mencoba mengklasifikasikan data.
Tantangan dan Keterbatasan Pembelajaran Mesin
Sekarang dalam tutorial Machine learning ini, kita akan mempelajari tentang keterbatasan Machine Learning:
Tantangan utama pembelajaran mesin adalah kurangnya data atau keragaman kumpulan data. Mesin tidak dapat belajar jika tidak ada data yang tersedia. Selain itu, kumpulan data yang kurang beragam akan menyulitkan mesin. Mesin harus memiliki heterogenitas untuk mempelajari wawasan yang bermakna. Jarang sekali suatu algoritma dapat mengekstraksi informasi ketika tidak ada atau sedikit variasi. Disarankan untuk melakukan setidaknya 20 observasi per kelompok untuk membantu pembelajaran mesin. Kendala ini menyebabkan evaluasi dan prediksi yang buruk.
Penerapan Pembelajaran Mesin
Sekarang dalam tutorial Machine learning ini, mari kita pelajari penerapan Machine Learning:
Augmentasi:
- Pembelajaran mesin, yang membantu manusia melakukan tugas sehari-hari, secara pribadi atau komersial tanpa memiliki kendali penuh atas hasilnya. Pembelajaran mesin tersebut digunakan dalam berbagai cara seperti Asisten Virtual, Analisis data, solusi perangkat lunak. Pengguna utamanya adalah untuk mengurangi kesalahan karena bias manusia.
Otomatisasi:
- Pembelajaran mesin, yang bekerja sepenuhnya secara mandiri di bidang apa pun tanpa memerlukan campur tangan manusia. Misalnya, robot yang melakukan langkah-langkah proses penting di pabrik.
Industri Keuangan
- Pembelajaran mesin semakin populer di industri keuangan. Bank terutama menggunakan ML untuk menemukan pola dalam data tetapi juga untuk mencegah penipuan.
Organisasi pemerintah
- Pemerintah memanfaatkan ML untuk mengelola keselamatan dan utilitas publik. Ambil contoh Tiongkok dengan pengenalan wajah yang masif. Pemerintah menggunakan kecerdasan buatan untuk mencegah pejalan kaki.
Industri kesehatan
- Layanan kesehatan adalah salah satu industri pertama yang menggunakan pembelajaran mesin dengan deteksi gambar.
Marketing
- Penggunaan AI secara luas dilakukan dalam pemasaran berkat akses data yang melimpah. Sebelum era data massal, para peneliti mengembangkan alat matematika canggih seperti analisis Bayesian untuk memperkirakan nilai pelanggan. Dengan pesatnya data, departemen pemasaran mengandalkan AI untuk mengoptimalkan hubungan pelanggan dan kampanye pemasaran.
Contoh penerapan Machine Learning pada Supply Chain
Pembelajaran mesin memberikan hasil luar biasa untuk pengenalan pola visual, membuka banyak aplikasi potensial dalam inspeksi dan pemeliharaan fisik di seluruh jaringan rantai pasokan.
Pembelajaran tanpa pengawasan dapat dengan cepat mencari pola yang sebanding dalam kumpulan data yang beragam. Pada gilirannya, mesin dapat melakukan pemeriksaan kualitas di seluruh pusat logistik, pengiriman dengan kerusakan dan keausan.
Misalnya, IBMPlatform Watson dapat menentukan kerusakan kontainer pengiriman. Watson menggabungkan data visual dan berbasis sistem untuk melacak, melaporkan, dan membuat rekomendasi secara real-time.
Pada tahun lalu, manajer stok sangat bergantung pada metode utama untuk mengevaluasi dan memperkirakan persediaan. Saat menggabungkan data besar dan pembelajaran mesin, teknik perkiraan yang lebih baik telah diterapkan (peningkatan sebesar 20 hingga 30% dibandingkan alat perkiraan tradisional). Dalam hal penjualan, ini berarti peningkatan 2 hingga 3% karena potensi pengurangan biaya persediaan.
Contoh Pembelajaran Mesin Google Mobil
Misalnya, semua orang tahu mobil Google. Mobil itu penuh dengan laser di atapnya yang memberitahukan posisinya di area sekitarnya. Ia memiliki radar di bagian depan, yang menginformasikan mobil tentang kecepatan dan pergerakan semua mobil di sekitarnya. Ia menggunakan semua data tersebut untuk mengetahui tidak hanya cara mengemudikan mobil tetapi juga untuk mengetahui dan memprediksi apa yang akan dilakukan oleh calon pengemudi di sekitar mobil. Yang mengesankan adalah mobil ini memproses hampir satu gigabyte data per detik.
Mengapa Pembelajaran Mesin Penting?
Pembelajaran mesin adalah alat terbaik sejauh ini untuk menganalisis, memahami, dan mengidentifikasi pola dalam data. Salah satu ide utama di balik pembelajaran mesin adalah bahwa komputer dapat dilatih untuk mengotomatisasi tugas-tugas yang mungkin melelahkan atau tidak mungkin dilakukan manusia. Pelanggaran yang jelas dari analisis tradisional adalah bahwa pembelajaran mesin dapat mengambil keputusan dengan sedikit campur tangan manusia.
Ambil contoh berikut untuk tutorial ML ini; seorang agen ritel dapat memperkirakan harga rumah berdasarkan pengalamannya sendiri dan pengetahuannya tentang pasar.
Sebuah mesin dapat dilatih untuk menerjemahkan pengetahuan seorang pakar menjadi fitur-fitur. Ciri-cirinya adalah segala ciri-ciri suatu rumah, lingkungan sekitar, lingkungan ekonomi, dan lain-lain yang menjadi pembeda harga. Bagi sang ahli, mungkin diperlukan waktu beberapa tahun baginya untuk menguasai seni memperkirakan harga sebuah rumah. Keahliannya menjadi lebih baik dan lebih baik setelah setiap penjualan.
Untuk sebuah mesin, dibutuhkan jutaan data, (misalnya, misalnya) untuk menguasai seni ini. Pada awal pembelajarannya, mesin membuat kesalahan, seperti halnya salesman junior. Setelah mesin melihat semua contoh, ia mendapat pengetahuan yang cukup untuk membuat estimasi. Pada saat yang sama, dengan akurasi yang luar biasa. Mesin juga mampu menyesuaikan kesalahannya.
Sebagian besar perusahaan besar telah memahami nilai pembelajaran mesin dan penyimpanan data. McKinsey memperkirakan bahwa nilai analitik berkisar dari $9.5 triliun hingga $15.4 triliun sedangkan $5 hingga 7 triliun dapat dikaitkan dengan teknik AI tercanggih.
Baca juga Apa itu Logika Fuzzy? Architekstur, Aplikasi, dan Contoh: Klik disini




