Denetimsiz Makine Öğrenimi: Nedir, Algoritmalar, Örnek

İçindekiler:

Anonim

Denetimsiz Öğrenme

Denetimsiz Öğrenme , kullanıcıların modeli denetlemesine gerek olmayan bir makine öğrenimi tekniğidir. Bunun yerine, modelin daha önce tespit edilmemiş kalıpları ve bilgileri keşfetmesi için kendi başına çalışmasına izin verir. Esas olarak etiketsiz verilerle ilgilenir.

Denetimsiz Öğrenme Algoritmaları

Denetimsiz Öğrenme Algoritmaları , kullanıcıların denetimli öğrenmeye kıyasla daha karmaşık işlem görevlerini gerçekleştirmelerine olanak tanır. Bununla birlikte, denetimsiz öğrenme, diğer doğal öğrenme yöntemlerine kıyasla daha öngörülemez olabilir. Denetimsiz öğrenme algoritmaları arasında kümeleme, anormallik algılama, sinir ağları vb. Yer alır.

Bu eğitimde şunları öğreneceksiniz:

  • Denetimsiz Makine Öğrenimi Örneği
  • Neden Denetimsiz Öğrenim?
  • Denetimsiz Öğrenme Türleri
  • Kümeleme
  • Kümeleme Türleri
  • bağlantı
  • Denetimli ve Denetimsiz Makine Öğrenimi
  • Denetimsiz makine öğreniminin uygulamaları
  • Denetimsiz Öğrenmenin Dezavantajları

Denetimsiz Makine Öğrenimi Örneği

Hadi bir bebek ve ailesinin köpeğini ele alalım.

Bu köpeği tanıyor ve tanımlıyor. Birkaç hafta sonra bir aile arkadaşı bir köpek getirir ve bebekle oynamaya çalışır.

Bebek bu köpeği daha önce görmedi. Ancak birçok özelliğin (2 kulak, göz, 4 ayak üzerinde yürüme) evcil köpeği gibi olduğunu bilir. Yeni hayvanı bir köpek olarak tanımlar. Bu, size öğretilmeyen ancak verilerden öğrendiğiniz denetimsiz öğrenmedir (bu durumda bir köpekle ilgili veriler.) Bu denetimli öğrenme olsaydı, aile arkadaşı bebeğe bunun bir köpek olduğunu söylerdi.

Neden Denetimsiz Öğrenim?

İşte, Denetimsiz Öğrenmeyi kullanmanın başlıca nedenleri:

  • Denetimsiz makine öğrenimi, verilerdeki her tür bilinmeyen kalıbı bulur.
  • Denetimsiz yöntemler, sınıflandırma için yararlı olabilecek özellikleri bulmanıza yardımcı olur.
  • Gerçek zamanlı olarak gerçekleşir, bu nedenle tüm girdi verileri analiz edilecek ve öğrencilerin varlığında etiketlenecektir.
  • Bir bilgisayardan etiketlenmemiş verileri almak, manuel müdahale gerektiren etiketli verilere göre daha kolaydır.

Denetimsiz Öğrenme Türleri

Denetimsiz öğrenme problemleri ayrıca kümeleme ve ilişkilendirme problemleri olarak gruplandırılır.

Kümeleme

Denetimsiz öğrenme söz konusu olduğunda kümeleme önemli bir kavramdır. Esas olarak, kategorize edilmemiş verilerden oluşan bir koleksiyonda bir yapı veya model bulmakla ilgilenir. Kümeleme algoritmaları, verilerinizi işler ve verilerde mevcutsa doğal kümeleri (grupları) bulur. Ayrıca, algoritmalarınızın kaç küme tanımlaması gerektiğini de değiştirebilirsiniz. Bu grupların ayrıntı düzeyini ayarlamanıza olanak tanır.

Kullanabileceğiniz farklı kümeleme türleri vardır:

Özel (bölümleme)

Bu kümeleme yönteminde Veriler, bir verinin yalnızca bir kümeye ait olabileceği şekilde gruplanır.

Örnek: K-anlamı

Aglomeratif

Bu kümeleme tekniğinde her veri bir kümedir. En yakın iki küme arasındaki yinelemeli birleşimler küme sayısını azaltır.

Örnek: Hiyerarşik kümeleme

Örtüşen

Bu teknikte, verileri kümelemek için bulanık kümeler kullanılır. Her nokta, ayrı üyelik derecelerine sahip iki veya daha fazla kümeye ait olabilir.

Burada veriler, uygun bir üyelik değeri ile ilişkilendirilecektir. Örnek: Bulanık C-Ortalamalar

Olasılık

Bu teknik, kümeleri oluşturmak için olasılık dağılımını kullanır

Örnek: Aşağıdaki anahtar kelimeler

  • "erkek ayakkabısı."
  • "kadın ayakkabısı."
  • "kadın eldiveni."
  • "adamın eldiveni."

"ayakkabı" ve "eldiven" veya "erkek" ve "kadın" olmak üzere iki kategoride toplanabilir.

Kümeleme Türleri

  • Hiyerarşik kümeleme
  • K-kümeleme anlamına gelir
  • K-NN (k en yakın komşu)
  • Temel bileşenler Analizi
  • Tekil Değer Ayrışımı
  • Bağımsız Bileşen Analizi

Hiyerarşik kümeleme:

Hiyerarşik kümeleme, bir kümeler hiyerarşisi oluşturan bir algoritmadır. Kendi kümelerine atanan tüm verilerle başlar. Burada iki yakın küme aynı kümede olacak. Bu algoritma, yalnızca bir küme kaldığında sona erer.

K-anlamına gelir Kümeleme

K, her yineleme için en yüksek değeri bulmanıza yardımcı olan yinelemeli bir kümeleme algoritması olduğu anlamına gelir. Başlangıçta istenen sayıda küme seçilir. Bu kümeleme yönteminde, veri noktalarını k grupta kümelemeniz gerekir. Daha büyük bir k, aynı şekilde daha fazla ayrıntıya sahip daha küçük gruplar anlamına gelir. Daha düşük bir k, daha az ayrıntıya sahip daha büyük gruplar anlamına gelir.

Algoritmanın çıktısı bir "etiketler" grubudur. Veri noktasını k gruplarından birine atar. K-ortalamalı kümelemede, her grup, her grup için bir ağırlık merkezi oluşturarak tanımlanır. Centroidler, kendilerine en yakın noktaları yakalayan ve kümeye ekleyen kümenin kalbi gibidir.

K-ortalama kümeleme ayrıca iki alt grubu tanımlar:

  • Aglomeratif kümeleme
  • Dendrogram

Aglomeratif kümeleme:

Bu tür K-anlamına gelen kümeleme, sabit sayıda küme ile başlar. Tüm verileri tam küme sayısına tahsis eder. Bu kümeleme yöntemi, girdi olarak kümelerin sayısını K gerektirmez. Aglomerasyon süreci, her verinin tek bir küme halinde oluşturulmasıyla başlar.

Bu yöntem bir miktar mesafe ölçüsü kullanır, birleştirme işlemi ile küme sayısını (her yinelemede bir tane) azaltır. Son olarak, tüm nesneleri içeren büyük bir kümemiz var.

Dendrogram:

Dendrogram kümeleme yönteminde, her seviye olası bir kümeyi temsil edecektir. Dendrogramın yüksekliği, iki birleştirme kümesi arasındaki benzerlik düzeyini gösterir. Sürecin en altına ne kadar yakınsa, grubun doğal olmayan ve çoğunlukla sübjektif olmayan dendrogramdan bulduğu daha benzer kümelerdir.

K- En yakın komşular

K- en yakın komşu, tüm makine öğrenimi sınıflandırıcılarının en basitidir. Bir model üretmemesi bakımından diğer makine öğrenimi tekniklerinden farklıdır. Mevcut tüm vakaları depolayan ve yeni örnekleri benzerlik ölçüsüne göre sınıflandıran basit bir algoritmadır.

Örnekler arasında bir mesafe olduğunda çok iyi çalışıyor. Eğitim seti büyük olduğunda öğrenme hızı yavaştır ve mesafe hesaplaması önemsiz değildir.

Temel bileşenler Analizi:

Daha yüksek boyutlu bir alan istemeniz durumunda. Bu alan için bir temel seçmeniz ve bu temelin yalnızca en önemli 200 puanını seçmeniz gerekir. Bu taban, temel bileşen olarak bilinir. Seçtiğiniz alt küme, orijinal alana kıyasla boyutu küçük olan yeni bir alandır. Mümkün olduğunca fazla veri karmaşıklığını korur.

bağlantı

İlişkilendirme kuralları, büyük veritabanları içindeki veri nesneleri arasında ilişkiler kurmanıza izin verir. Bu denetimsiz teknik, büyük veritabanlarındaki değişkenler arasındaki ilginç ilişkileri keşfetmekle ilgilidir. Örneğin, yeni mobilya satın alma olasılığı en yüksek olan insanlar yeni bir ev satın alır.

Diğer Örnekler:

  • Gen ekspresyon ölçümlerine göre gruplandırılmış kanser hastalarının bir alt grubu
  • Göz atma ve satın alma geçmişlerine göre müşteri grupları
  • Film izleyicilerinin verdiği puana göre film grubu

Denetimli ve Denetimsiz Makine Öğrenimi

Parametreler Denetimli makine öğrenimi tekniği Denetimsiz makine öğrenimi tekniği
Giriş Verileri Algoritmalar, etiketli veriler kullanılarak eğitilir. Algoritmalar etiketlenmemiş verilere karşı kullanılır
Hesaplamalı Karmaşıklık Denetimli öğrenme daha basit bir yöntemdir. Denetimsiz öğrenme sayısal olarak karmaşıktır
Doğruluk Son derece doğru ve güvenilir bir yöntem. Daha az doğru ve güvenilir yöntem.

Denetimsiz makine öğreniminin uygulamaları

Denetimsiz makine öğrenimi tekniklerinin bazı uygulamaları şunlardır:

  • Kümeleme, veri kümesini benzerliklerine göre otomatik olarak gruplara ayırır
  • Anormallik algılama, veri kümenizdeki olağandışı veri noktalarını keşfedebilir. Hileli işlemleri bulmak için kullanışlıdır
  • İlişkilendirme madenciliği, veri kümenizde sıklıkla birlikte bulunan öğe kümelerini tanımlar
  • Gizli değişken modelleri, veri ön işleme için yaygın olarak kullanılmaktadır. Bir veri kümesindeki özelliklerin sayısını azaltmak veya veri kümesini birden çok bileşene ayırmak gibi

Denetimsiz Öğrenmenin Dezavantajları

  • Veri sıralama ile ilgili kesin bilgi alamazsınız ve denetimsiz öğrenmede kullanılan veriler etiketlendiğinden ve bilinmediğinden çıktı
  • Sonuçların daha az doğruluğu, giriş verilerinin bilinmemesi ve önceden insanlar tarafından etiketlenmemesidir. Bu, makinenin bunu kendisi yapması gerektiği anlamına gelir.
  • Spektral sınıflar her zaman bilgi sınıflarına karşılık gelmez.
  • Kullanıcının bu sınıflandırmayı takip eden sınıfları yorumlamak ve etiketlemek için zaman harcaması gerekir.
  • Sınıfların spektral özellikleri de zamanla değişebilir, böylece bir görüntüden diğerine geçerken aynı sınıf bilgisine sahip olamazsınız.

Özet

  • Denetimsiz öğrenme, modeli denetlemenize gerek olmayan bir makine öğrenimi tekniğidir.
  • Denetimsiz makine öğrenimi, verilerdeki her tür bilinmeyen kalıbı bulmanıza yardımcı olur.
  • Kümeleme ve İlişkilendirme, iki tür Denetimsiz öğrenmedir.
  • Dört tür kümeleme yöntemi 1) Dışlayıcıdır 2) Topaklayıcı 3) Örtüşen 4) Olasılıksaldır.
  • Önemli kümeleme türleri: 1) Hiyerarşik kümeleme 2) K-ortalamalı kümeleme 3) K-NN 4) Temel Bileşen Analizi 5) Tekil Değer Ayrıştırma 6) Bağımsız Bileşen Analizi.
  • İlişkilendirme kuralları, büyük veritabanları içindeki veri nesneleri arasında ilişkiler kurmanıza izin verir.
  • Denetimli öğrenmede, Algoritmalar etiketli veriler kullanılarak eğitilirken, Denetimsiz öğrenmede Algoritmalar etiketlenmemiş verilere karşı kullanılır.
  • Anormallik algılama, veri kümenizdeki dolandırıcılık işlemlerini bulmak için yararlı olan önemli veri noktalarını keşfedebilir.
  • Denetimsiz öğrenmenin en büyük dezavantajı, veri sıralama ile ilgili kesin bilgi alamamanızdır.