Denetimli Makine Öğrenimi: Nedir, Algoritmalar, Örnek

İçindekiler:

Anonim

Denetimli Makine Öğrenimi nedir?

Denetimli öğrenmede, makineyi iyi "etiketlenmiş" verileri kullanarak eğitirsiniz . Bu, bazı verilerin zaten doğru yanıtla etiketlendiği anlamına gelir. Bir gözetmen veya öğretmenin varlığında gerçekleşen öğrenmeyle karşılaştırılabilir.

Denetimli bir öğrenme algoritması, etiketli eğitim verilerinden öğrenir, öngörülemeyen veriler için sonuçları tahmin etmenize yardımcı olur.

Doğru denetimli makine öğrenimi modellerini başarıyla oluşturmak, ölçeklendirmek ve dağıtmak, son derece yetenekli veri bilimcilerinden oluşan bir ekipten zaman ve teknik uzmanlık gerektirir. Dahası, Veri bilimcisi, verilen içgörülerin verileri değişene kadar doğru kalmasını sağlamak için modelleri yeniden oluşturmalıdır.

Bu eğitimde şunları öğreneceksiniz:

  • Denetimli Makine Öğrenimi nedir?
  • Denetimli Öğrenim Nasıl Çalışır?
  • Denetlenen Makine Öğrenimi Algoritma Türleri
  • Denetimli ve Denetimsiz Makine öğrenimi teknikleri
  • Denetimli makine öğrenimindeki zorluklar
  • Denetimli Öğrenmenin Avantajları:
  • Denetimli Öğrenmenin Dezavantajları
  • Denetimli Öğrenim için en iyi uygulamalar

Denetimli Öğrenim Nasıl Çalışır?

Örneğin, iş yerinizden eve gitmenizin ne kadar süreceğini tahmin etmenize yardımcı olacak bir makine eğitmek istiyorsunuz. Burada, bir dizi etiketli veri oluşturarak başlarsınız. Bu veriler şunları içerir:

  • Hava koşulları
  • Günün saati
  • Bayram

Tüm bu detaylar sizin girdilerinizdir. Çıktı, belirli bir günde eve dönmek için geçen süredir.

İçgüdüsel olarak, dışarıda yağmur yağarsa eve gitmenizin daha uzun süreceğini bilirsiniz. Ancak makinenin verilere ve istatistiklere ihtiyacı var.

Şimdi, kullanıcının işe gidip gelme zamanını belirlemesine yardımcı olan bu örneğin denetimli bir öğrenme modelini nasıl geliştirebileceğinizi görelim. Oluşturmanız gereken ilk şey bir eğitim setidir. Bu eğitim seti, toplam işe gidip gelme süresini ve hava durumu, süre vb. Gibi ilgili faktörleri içerecektir. Bu eğitim setine göre, makineniz yağmur miktarı ile eve gitmek için harcayacağınız süre arasında doğrudan bir ilişki olduğunu görebilir.

Yani, ne kadar çok yağmur yağarsa, evinize dönmek için o kadar uzun süre araba kullanacağınızı belirler. Ayrıca, işten ayrıldığınız zaman ile yolda olacağınız zaman arasındaki bağlantıyı da görebilir.

Akşam 6'ya ne kadar yakınsan eve gitmen o kadar uzun sürer. Makineniz, etiketlenmiş verilerinizle bazı ilişkileri bulabilir.

Bu, Veri Modelinizin başlangıcıdır. Yağmurun insanların sürüş şeklini nasıl etkilediğini etkilemeye başlar. Ayrıca günün belirli bir saatinde daha fazla insanın seyahat ettiğini görmeye başlar.

Denetlenen Makine Öğrenimi Algoritma Türleri

Regresyon:

Regresyon tekniği, eğitim verilerini kullanarak tek bir çıktı değerini tahmin eder.

Örnek : Eğitim verilerinden ev fiyatını tahmin etmek için regresyon kullanabilirsiniz. Girdi değişkenleri yerellik, evin büyüklüğü vb. Olacaktır.

Güçlü Yönler : Çıktıların her zaman olasılıklı bir yorumu vardır ve algoritma aşırı uydurmayı önlemek için düzenlenebilir.

Zayıf Yönler : Çoklu veya doğrusal olmayan karar sınırları olduğunda lojistik regresyon düşük performans gösterebilir. Bu yöntem esnek değildir, bu nedenle daha karmaşık ilişkileri yakalamaz.

Lojistik regresyon:

Verilen bir dizi bağımsız değişkene dayalı olarak ayrık değerleri tahmin etmek için kullanılan lojistik regresyon yöntemi. Verileri bir logit işlevine sığdırarak bir olayın gerçekleşme olasılığını tahmin etmenize yardımcı olur. Bu nedenle, lojistik regresyon olarak da bilinir. Olasılığı tahmin ettiği için çıktı değeri 0 ile 1 arasındadır.

İşte birkaç tür Regresyon Algoritması

Sınıflandırma:

Sınıflandırma, çıktıyı bir sınıf içinde gruplamak anlamına gelir. Algoritma, girdiyi iki farklı sınıfa etiketlemeye çalışırsa, buna ikili sınıflandırma denir. İkiden fazla sınıf arasında seçim yapmak, çok sınıflı sınıflandırma olarak adlandırılır.

Örnek : Birisinin kredinin temerrüde düşmüş olup olmayacağının belirlenmesi.

Güçlü Yönler : Sınıflandırma ağacı pratikte çok iyi performans gösteriyor

Zayıf Yönler : Kısıtlanmamış, tek tek ağaçlar aşırı uymaya eğilimlidir.

İşte birkaç Sınıflandırma Algoritması türü

Naïve Bayes Sınıflandırıcılar

Naïve Bayes modelinin (NBN) oluşturulması kolaydır ve büyük veri kümeleri için çok kullanışlıdır. Bu yöntem, bir ebeveyn ve birkaç çocuk ile doğrudan döngüsel olmayan grafiklerden oluşur. Ebeveynlerinden ayrılmış alt düğümler arasında bağımsızlık olduğunu varsayar.

Karar ağaçları

Karar ağaçları, örneği özellik değerine göre sıralayarak sınıflandırır. Bu yöntemde, her mod bir örneğin özelliğidir. Sınıflandırılmalıdır ve her dal, düğümün alabileceği bir değeri temsil eder. Sınıflandırma için yaygın olarak kullanılan bir tekniktir. Bu yöntemde sınıflandırma, karar ağacı olarak bilinen bir ağaçtır.

Gerçek değerleri tahmin etmenize yardımcı olur (araba satın alma maliyeti, arama sayısı, toplam aylık satışlar, vb.).

Destek Vektör Makinesi

Destek vektör makinesi (SVM), 1990 yılında geliştirilen bir tür öğrenme algoritmasıdır. Bu yöntem, Vap Nik tarafından sunulan istatistiksel öğrenme teorisinin sonuçlarına dayanmaktadır.

SVM makineleri, öğrenme görevlerinin çoğu için merkezi bir kavram olan çekirdek işlevleriyle de yakından bağlantılıdır. Çekirdek çerçevesi ve SVM, çeşitli alanlarda kullanılmaktadır. Multimedya bilgisi alma, biyoinformatik ve örüntü tanımayı içerir.

Denetimli ve Denetimsiz Makine öğrenimi teknikleri

Dayalı Denetimli makine öğrenimi tekniği Denetimsiz makine öğrenimi tekniği
Giriş Verileri Algoritmalar, etiketli veriler kullanılarak eğitilir. Algoritmalar etiketlenmemiş verilere karşı kullanılır
Hesaplamalı Karmaşıklık Denetimli öğrenme daha basit bir yöntemdir. Denetimsiz öğrenme sayısal olarak karmaşıktır
Doğruluk Son derece doğru ve güvenilir bir yöntem. Daha az doğru ve güvenilir yöntem.

Denetimli makine öğrenimindeki zorluklar

Denetimli makine öğreniminde karşılaşılan zorluklar şunlardır:

  • Alakasız girdi özelliği mevcut eğitim verileri yanlış sonuçlar verebilir
  • Veri hazırlama ve ön işleme her zaman bir sorundur.
  • Eğitim verileri olarak imkansız, olası olmayan ve eksik değerler girildiğinde doğruluk zarar görür
  • İlgili uzman müsait değilse, diğer yaklaşım "kaba kuvvet" dir. Makineyi eğitmek için doğru özellikleri (girdi değişkenleri) düşünmeniz gerektiği anlamına gelir. Yanlış olabilir.

Denetimli Öğrenmenin Avantajları:

  • Denetimli öğrenme, önceki deneyimden veri toplamanıza veya bir veri çıktısı oluşturmanıza olanak tanır
  • Deneyimi kullanarak performans kriterlerini optimize etmenize yardımcı olur
  • Denetimli makine öğrenimi, çeşitli gerçek dünya hesaplama problemlerini çözmenize yardımcı olur.

Denetimli Öğrenmenin Dezavantajları

  • Bir sınıfta olmasını istediğiniz örnekleri içermeyen eğitim setiniz, karar sınırı aşırı eğitilmiş olabilir.
  • Sınıflandırıcıyı eğitirken her sınıftan çok sayıda iyi örnek seçmeniz gerekir.
  • Büyük veriyi sınıflandırmak gerçek bir zorluk olabilir.
  • Denetimli öğrenim için eğitim çok fazla hesaplama süresi gerektirir.

Denetimli Öğrenim için en iyi uygulamalar

  • Başka bir şey yapmadan önce, eğitim seti olarak ne tür verilerin kullanılacağına karar vermelisiniz.
  • Öğrenilen işlevin ve öğrenme algoritmasının yapısına karar vermeniz gerekir.
  • Ya insan uzmanlardan ya da ölçümlerden uygun çıktılar elde edin

Özet

  • Denetimli öğrenmede, makineyi iyi "etiketlenmiş" verileri kullanarak eğitirsiniz.
  • İş yerinizden eve gitmenizin ne kadar süreceğini tahmin etmenize yardımcı olacak bir makine eğitmek istiyorsanız, denetimli öğrenmeye bir örnektir.
  • Regresyon ve Sınıflandırma, iki tür denetimli makine öğrenimi tekniğidir.
  • Denetimli öğrenme daha basit bir yöntemken Denetimsiz öğrenme karmaşık bir yöntemdir.
  • Denetimli öğrenmedeki en büyük zorluk, Alakasız girdi özelliğinin mevcut eğitim verilerinin yanlış sonuçlar vermesidir.
  • Denetimli öğrenmenin temel avantajı, önceki deneyimden veri toplamanıza veya bir veri çıktısı oluşturmanıza izin vermesidir.
  • Bu modelin dezavantajı, eğitim setinizde bir sınıfta olmasını istediğiniz örnekler yoksa, karar sınırının fazla zorlanabilmesidir.
  • Denetimli öğrenmenin en iyi uygulaması olarak, öncelikle bir eğitim seti olarak ne tür verilerin kullanılması gerektiğine karar vermeniz gerekir.