Yeni Başlayanlar İçin Makine Öğrenimi Eğitimi: ML'nin Temelleri Nedir?
Makine Öğrenmesi Nedir?
Makine öğrenme bir programcı tarafından açıkça kodlanmadan, kişisel gelişim yoluyla örneklerden öğrenebilen bir bilgisayar algoritmaları sistemidir. Makine öğrenimi, eyleme geçirilebilir içgörüler elde etmek için kullanılabilecek bir çıktıyı tahmin etmek amacıyla verileri istatistiksel araçlarla birleştiren yapay zekanın bir parçasıdır.
Bu buluş, bir makinenin doğru sonuçlar üretmek için verilerden (örnek) tekil olarak öğrenebileceği fikriyle ortaya çıkıyor. Makine öğrenimi, veri madenciliği ve Bayesian tahmine dayalı modelleme ile yakından ilgilidir. Makine verileri girdi olarak alır ve yanıtları formüle etmek için bir algoritma kullanır.
Tipik bir makine öğrenimi görevi bir öneri sağlamaktır. Sahip olanlar için Netflix hesapta tüm film veya dizi önerileri kullanıcının geçmiş verilerine dayanmaktadır. Teknoloji şirketleri kullanıyor denetimsiz öğrenme Kişiselleştirme önerileriyle kullanıcı deneyimini geliştirmek.
Makine öğrenimi aynı zamanda dolandırıcılık tespiti, tahmine dayalı bakım, portföy optimizasyonu, görevlerin otomatikleştirilmesi vb. gibi çeşitli görevler için de kullanılır.
Makine Öğrenimi ve Geleneksel Programlama
Geleneksel programlama, makine öğreniminden önemli ölçüde farklıdır. Geleneksel programlamada, bir programcı, yazılımın geliştirildiği sektördeki bir uzmanla istişare ederek tüm kuralları kodlar. Her kural mantıksal bir temele dayanır; makine, mantıksal ifadeyi izleyen bir çıktı yürütür. Sistem karmaşıklaştığında, daha fazla kural yazılması gerekir. Bakımı hızla sürdürülemez hale gelebilir.
Makine öğreniminin bu sorunun üstesinden gelmesi bekleniyor. Makine giriş ve çıkış verilerinin nasıl ilişkilendirildiğini öğrenir ve bir kural yazar. Programcıların her yeni veri olduğunda yeni kurallar yazmalarına gerek yoktur. Algoritmalar, zaman içinde etkinliği artırmak için yeni verilere ve deneyimlere yanıt olarak uyum sağlar.
Makine Öğrenimi Nasıl Çalışır?
Şimdi yeni başlayanlar için bu Makine öğrenimi temelleri eğitiminde, Makine Öğreniminin (ML) nasıl çalıştığını öğreneceğiz:
Makine öğrenimi, tüm öğrenmenin gerçekleştiği beyindir. Makinenin öğrenme şekli insanınkine benzer. İnsan deneyimlerden öğrenir. Ne kadar çok bilirsek, o kadar kolay tahmin edebiliriz. Benzer şekilde bilinmeyen bir durumla karşılaştığımızda başarı ihtimali bilinen duruma göre daha düşüktür. Makineler aynı şekilde eğitilir. Doğru bir tahmin yapmak için makine bir örnek görür. Makineye benzer bir örnek verdiğimizde sonucu anlayabiliyor. Ancak tıpkı insan gibi, daha önce görülmemiş bir örnekle besleniyorsa makinenin tahmin etmesi zorlaşır.
Makine öğreniminin temel amacı, öğrenme ve sonuç. Her şeyden önce makine, kalıpların keşfi yoluyla öğrenir. Bu keşif sayesinde yapıldı veri. Veri bilimcinin en önemli kısımlarından biri, makineye hangi verinin sağlanacağını dikkatlice seçmektir. Bir problemi çözmek için kullanılan niteliklerin listesine denir. özellik vektörü. Özellik vektörünü, bir sorunu çözmek için kullanılan bir veri alt kümesi olarak düşünebilirsiniz.
Makine, gerçekliği basitleştirmek ve bu keşfi gerçek bir şeye dönüştürmek için bazı süslü algoritmalar kullanıyor. model. Bu nedenle öğrenme aşaması, verileri tanımlamak ve bir model halinde özetlemek için kullanılır.
Örneğin makine, bir bireyin ücreti ile lüks bir restorana gitme olasılığı arasındaki ilişkiyi anlamaya çalışıyor. Makinenin ücret ile lüks bir restorana gitmek arasında pozitif bir ilişki bulduğu ortaya çıktı: Model bu
Çıkarım yapma
Model oluşturulduğunda daha önce görülmemiş veriler üzerinde ne kadar güçlü olduğunu test etmek mümkün oluyor. Yeni veriler bir özellik vektörüne dönüştürülür, modelden geçirilir ve bir tahmin verilir. Bunların hepsi makine öğreniminin güzel kısmı. Kuralları güncellemeye veya modeli yeniden eğitmeye gerek yoktur. Yeni verilerden çıkarım yapmak için önceden eğitilmiş modeli kullanabilirsiniz.
Makine Öğrenmesi programlarının ömrü basittir ve aşağıdaki noktalarda özetlenebilir:
- Bir soru tanımlayın
- Veri topla
- Verileri görselleştirin
- Tren algoritması
- Algoritmayı Test Edin
- Geri bildirim toplayın
- Algoritmayı geliştirin
- Sonuçlar tatmin edici olana kadar 4-7 döngü yapın
- Tahmin yapmak için modeli kullanma
Algoritma doğru sonuçları çıkarmada iyi hale geldiğinde, bu bilgiyi yeni veri kümelerine uygular.
Makine öğrenme Algorithms ve Nerede Kullanılırlar?
Şimdi yeni başlayanlara yönelik bu Makine öğrenimi eğitiminde, Makine Öğrenimi (ML) algoritmalarının nerede kullanıldığını öğreneceğiz:
Makine öğrenimi iki geniş öğrenme görevine ayrılabilir: Denetimli ve Denetimsiz. Başka birçok algoritma var
Denetimli öğrenme
Bir algoritma, belirli girdilerin belirli bir çıktıyla ilişkisini öğrenmek için eğitim verilerini ve insanlardan gelen geri bildirimleri kullanır. Örneğin, bir uygulayıcı, kutu satışlarını tahmin etmek için pazarlama giderlerini ve hava durumu tahminlerini girdi verileri olarak kullanabilir.
Çıkış verileri bilindiğinde denetimli öğrenmeyi kullanabilirsiniz. Algoritma yeni verileri tahmin edecek.
iki kategori var denetimli öğrenme:
- Sınıflandırma görevi
- Regresyon görevi
Sınıflandırma
Bir reklam için müşterinin cinsiyetini tahmin etmek istediğinizi düşünün. Müşteri veritabanınızdan boy, kilo, iş, maaş, satın alma sepeti vb. verileri toplamaya başlayacaksınız. Her müşterinizin cinsiyetini biliyorsunuz, sadece erkek veya kadın olabilir. Sınıflandırıcının amacı, bilgilere (yani topladığınız özelliklere) dayanarak erkek veya kadın olma olasılığını (yani etiket) atamak olacaktır. Model, erkek veya dişiyi nasıl tanıyacağını öğrendiğinde, tahminde bulunmak için yeni verileri kullanabilirsiniz. Örneğin, tanımadığınız bir müşteriden yeni bir bilgi aldınız ve onun kadın mı erkek mi olduğunu bilmek istiyorsunuz. Sınıflandırıcı erkek = %70 tahmin ediyorsa bu, algoritmanın bu müşterinin erkek olduğundan %70, kadın olduğundan %30 emin olduğu anlamına gelir.
Etiket iki veya daha fazla sınıftan olabilir. Yukarıdaki Makine öğrenimi örneğinde yalnızca iki sınıf vardır, ancak bir sınıflandırıcının nesneyi tahmin etmesi gerekiyorsa düzinelerce sınıfı vardır (örn. cam, masa, ayakkabı vb. her nesne bir sınıfı temsil eder)
Gerileme
Çıktı sürekli bir değer olduğunda görev bir regresyondur. Örneğin, bir finansal analistin bir hisse senedinin değerini özsermaye, önceki hisse senedi performansları, makroekonomik endeks gibi bir dizi özelliğe dayanarak tahmin etmesi gerekebilir. Sistem, hisse senetlerinin fiyatını mümkün olan en düşük hatayla tahmin edecek şekilde eğitilecektir.
Algoritma | Açıklama | Tip |
---|---|---|
Doğrusal regresyon | Gelecekteki değerleri tahmin etmeye yardımcı olmak için her özelliği çıktıyla ilişkilendirmenin bir yolunu bulur. | Gerileme |
Lojistik regresyon | Sınıflandırma görevleri için kullanılan doğrusal regresyonun uzantısı. Çıkış değişkeni 3 süreklidir (örneğin, potansiyel renklerin sonsuz bir listesi) yerine ikilidir (örneğin, yalnızca siyah veya beyaz). | Sınıflandırma |
Karar ağacı | Nihai karar çıktısı alınana kadar veri-özellik değerlerini karar düğümlerinde dallara bölen (örneğin, bir özellik bir renkse, olası her renk yeni bir dal olur) yüksek derecede yorumlanabilir sınıflandırma veya regresyon modeli | Gerileme Sınıflandırma |
Naif bayanlar | Bayes yöntemi, Bayes teoremini kullanan bir sınıflandırma yöntemidir. Teorem, bir olaya ilişkin ön bilgiyi, olayı etkileyebilecek her özelliğin bağımsız olasılığıyla günceller. | Gerileme Sınıflandırma |
Destek vektör makinesi |
Destek Vektör Makinesi veya SVM genellikle sınıflandırma görevi için kullanılır. DVM algoritması sınıfları en iyi şekilde bölen bir hiperdüzlem bulur. Doğrusal olmayan bir çözücüyle kullanılması en iyisidir. |
Regresyon (çok yaygın değil) Sınıflandırma |
Rastgele orman | Algoritma, doğruluğu büyük ölçüde artırmak için bir karar ağacı üzerine kurulmuştur. Rastgele orman birçok kez basit karar ağaçları oluşturur ve hangi etiketin döndürüleceğine karar vermek için 'çoğunluk oyu' yöntemini kullanır. Sınıflandırma görevi için son tahmin, en çok oyu alan tahmin olacaktır; regresyon görevinde ise tüm ağaçların ortalama tahmini nihai tahmindir. | Gerileme Sınıflandırma |
AdaBoost | Bir karara varmak için çok sayıda model kullanan ancak sonuçları tahmin etmedeki doğruluklarına göre bunları tartan sınıflandırma veya regresyon tekniği | Gerileme Sınıflandırma |
Gradyan artırıcı ağaçlar | Gradyan artırıcı ağaçlar, son teknoloji ürünü bir sınıflandırma/regresyon tekniğidir. Önceki ağaçların yaptığı hataya odaklanır ve onu düzeltmeye çalışır. | Gerileme Sınıflandırma |
Denetimsiz öğrenme
Denetimsiz öğrenmede bir algoritma, açık bir çıktı değişkeni verilmeden girdi verilerini araştırır (örn. kalıpları belirlemek için müşteri demografik verilerini araştırır).
Verileri nasıl sınıflandıracağınızı bilmediğiniz ve algoritmanın kalıpları bulmasını ve verileri sizin için sınıflandırmasını istediğiniz durumlarda kullanabilirsiniz.
Algoritma Adı | Açıklama | Tip |
---|---|---|
K-kümeleme anlamına gelir | Verileri, her biri benzer özelliklere sahip veriler içeren (önceden insanlar tarafından değil, model tarafından belirlenen) bazı gruplara (k) koyar. | Clustering |
Gauss karışım modeli | Grupların (kümelerin) boyutu ve şekli konusunda daha fazla esneklik sağlayan k-ortalama kümelemenin genelleştirilmesi | Clustering |
Hiyerarşik kümeleme | Sınıflandırma sistemi oluşturmak için kümeleri hiyerarşik bir ağaç boyunca böler.
Için kullanılabilir Cluster sadakat kartı müşterisi |
Clustering |
Tavsiye sistemi | Öneride bulunmak için ilgili verileri tanımlamaya yardımcı olun. | Clustering |
PCA/T-SNE | Çoğunlukla verinin boyutsallığını azaltmak için kullanılır. Algoritmalar, özellik sayısını en yüksek varyansa sahip 3 veya 4 vektöre düşürür. | Boyut Azaltma |
Makine Öğrenimi Algoritması Nasıl Seçilir
Şimdi bu Makine öğrenimi temelleri eğitiminde, Makine Öğrenimi (ML) algoritmasının nasıl seçileceğini öğreneceğiz:
Çok sayıda makine öğrenimi algoritması vardır. Algoritmanın seçimi amaca bağlıdır.
Aşağıdaki Makine öğrenimi örneğinde görev, üç çeşit arasındaki çiçeğin türünü tahmin etmektir. Tahminler taç yaprağının uzunluğuna ve genişliğine dayanmaktadır. Resim on farklı algoritmanın sonuçlarını göstermektedir. Sol üstteki resim veri kümesidir. Veriler üç kategoriye ayrılmıştır: kırmızı, açık mavi ve lacivert. Bazı gruplaşmalar var. Mesela ikinci görselde sol üstteki her şey kırmızı kategoriye ait, orta kısımda belirsizlik ve açık mavi karışımı var, alt kısım ise karanlık kategoriye karşılık geliyor. Diğer resimler farklı algoritmaları ve bunların verileri nasıl sınıflandırmaya çalıştıklarını gösteriyor.
Makine Öğreniminin Zorlukları ve Sınırlamaları
Şimdi bu Makine öğrenimi eğitiminde, Makine Öğreniminin sınırlamalarını öğreneceğiz:
Makine öğreniminin temel zorluğu veri eksikliği veya veri kümesindeki çeşitliliktir. Kullanılabilir veri yoksa makine öğrenemez. Ayrıca çeşitliliğin eksik olduğu bir veri seti makineye zor anlar yaşatır. Bir makinenin anlamlı içgörüyü öğrenebilmesi için heterojenliğe sahip olması gerekir. Bir algoritmanın, hiç varyasyon olmadığında veya çok az varyasyon olduğunda bilgi çıkarması nadirdir. Makinenin öğrenmesine yardımcı olmak için grup başına en az 20 gözlem yapılması önerilir. Bu kısıtlama zayıf değerlendirme ve tahmine yol açmaktadır.
Makine Öğreniminin Uygulanması
Şimdi bu Makine öğrenimi eğitiminde, Makine Öğreniminin uygulamalarını öğrenelim:
artırma:
- Çıktı üzerinde tam kontrole sahip olmadan, kişisel veya ticari olarak insanlara günlük görevlerinde yardımcı olan makine öğrenimi. Bu tür makine öğrenmesi Sanal Asistan, Veri analizi, yazılım çözümleri gibi farklı şekillerde kullanılmaktadır. Birincil kullanıcı, insan önyargısından kaynaklanan hataları azaltmaktır.
Otomasyon:
- Makine öğrenimi, herhangi bir insan müdahalesine ihtiyaç duymadan, her alanda tamamen otonom olarak çalışır. Örneğin üretim tesislerinde temel işlem adımlarını gerçekleştiren robotlar.
Finans Sektörü
- Makine öğrenimi finans sektöründe popülerlik kazanıyor. Bankalar esas olarak verilerdeki kalıpları bulmak için ML'yi kullanıyor ancak aynı zamanda dolandırıcılığı önlemek için de kullanıyor.
Devlet teşkilatı
- Hükümet, kamu güvenliğini ve kamu hizmetlerini yönetmek için ML'den yararlanıyor. Devasa yüz tanıma özelliğine sahip Çin örneğini ele alalım. Hükümet kullanıyor Yapay zeka kırmızı ışıkta geçmeyi önlemek için.
Sağlık Endüstrisi
- Sağlık hizmetleri, makine öğrenimini görüntü algılamayla birlikte kullanan ilk sektörlerden biriydi.
Pazarlama
- Verilere bol erişim sayesinde yapay zekanın pazarlamada geniş kullanımı yapılıyor. Kitlesel veri çağından önce araştırmacılar, bir müşterinin değerini tahmin etmek için Bayesian analizi gibi gelişmiş matematiksel araçlar geliştiriyor. Veri patlamasıyla birlikte pazarlama departmanı, müşteri ilişkilerini ve pazarlama kampanyasını optimize etmek için yapay zekaya güveniyor.
Tedarik Zincirinde Makine Öğreniminin Uygulama Örneği
Makine öğrenimi, görsel örüntü tanıma konusunda harika sonuçlar vererek tüm tedarik zinciri ağı boyunca fiziksel denetim ve bakımda birçok potansiyel uygulamaya kapı açıyor.
Denetimsiz öğrenme, çeşitli veri kümelerinde karşılaştırılabilir kalıpları hızlı bir şekilde arayabilir. Buna karşılık makine, lojistik merkezinin tamamında kalite denetimi, hasarlı ve aşınmalı sevkiyat gerçekleştirebilir.
Örneğin, IBMWatson platformu nakliye konteynırının hasarını tespit edebiliyor. Watson, gerçek zamanlı olarak takip etmek, raporlamak ve önerilerde bulunmak için görsel ve sistem tabanlı verileri birleştirir.
Geçtiğimiz yılda stok yöneticisi, envanteri değerlendirmek ve tahmin etmek için birincil yönteme büyük ölçüde güveniyordu. Büyük veri ve makine öğrenimi birleştirildiğinde, daha iyi tahmin teknikleri uygulandı (geleneksel tahmin araçlarına göre %20 ila %30'luk bir gelişme). Satışlar açısından ise stok maliyetlerindeki olası düşüş nedeniyle yüzde 2 ila 3 oranında artış anlamına geliyor.
Makine Öğrenimi Google Car Örneği
Mesela Google arabasını herkes biliyor. Arabanın tavanı, çevreye göre nerede olduğunu söyleyen lazerlerle dolu. Önünde, etrafındaki tüm arabaların hızı ve hareketi hakkında arabaya bilgi veren bir radar vardır. Tüm bu verileri yalnızca arabanın nasıl sürüleceğini anlamak için değil, aynı zamanda arabanın etrafındaki potansiyel sürücülerin ne yapacağını anlamak ve tahmin etmek için de kullanıyor. Etkileyici olan şey, arabanın neredeyse saniyede bir gigabaytlık veri işlemesidir.
Makine Öğrenimi Neden Önemlidir?
Makine öğrenimi, verilerdeki bir modeli analiz etmek, anlamak ve tanımlamak için şu ana kadarki en iyi araçtır. Makine öğreniminin ardındaki ana fikirlerden biri, bilgisayarın, bir insan için çok yorucu veya imkansız olan görevleri otomatikleştirecek şekilde eğitilebilmesidir. Geleneksel analizin açık ihlali, makine öğreniminin minimum insan müdahalesiyle kararlar alabilmesidir.
Bu ML eğitimi için şu örneği ele alalım; bir perakende satış temsilcisi, kendi deneyimine ve piyasa bilgisine dayanarak bir evin fiyatını tahmin edebilir.
Bir makine, bir uzmanın bilgisini özelliklere dönüştürmek üzere eğitilebilir. Özellikler bir evin, mahallenin, ekonomik çevrenin vb. fiyat farkını yaratan özelliklerinin tamamıdır. Uzmanın bir evin fiyatını tahmin etme sanatında ustalaşması muhtemelen birkaç yılını aldı. Uzmanlığı her satıştan sonra daha da iyiye gidiyor.
Makinenin bu sanatta ustalaşması için milyonlarca veri (örnek) gerekir. Öğrenmenin en başında makine, bir şekilde kıdemsiz satıcı gibi bir hata yapar. Makine tüm örneği gördükten sonra tahminini yapmak için yeterli bilgiye sahip olur. Aynı zamanda inanılmaz bir doğrulukla. Makine de hatasını buna göre ayarlayabilmektedir.
Büyük şirketlerin çoğu, makine öğreniminin ve veri tutmanın değerini anladı. McKinsey analitiğin değerinin şu aralıkta olduğunu tahmin ediyor: $9.5 trilyon $15.4 trilyon $En gelişmiş yapay zeka tekniklerine 5 ila 7 trilyon atfedilebilir.
Ayrıca okuyun: Bulanık Mantık Nedir? ArchiYapı, Uygulama ve Örnek: Buraya Tıkla