Bu eğitimde öğreneceksiniz -
- Windows'ta NLTK'yi Kurmak
- Python'u Windows'ta Kurmak
- NLTK'yi Mac / Linux'ta Kurmak
- NLTK'yi Anaconda aracılığıyla kurma
- NLTK Veri Kümesi
- NLTK'nın tüm paketleri nasıl indirilir
- NLP Komut Dosyasını Çalıştırma
- NLTK Komut Dosyası Nasıl Çalıştırılır
Windows'ta NLTK'yi Kurmak
Bu bölümde terminal üzerinden NLTK kurulumunun nasıl yapılacağını öğreneceğiz (Windows'ta komut istemi).
Aşağıda verilen talimat, python'un kurulu olmadığı varsayımına dayanmaktadır. Yani, ilk adım python kurmaktır.
Python'u Windows'ta Kurmak:
Adım 1) Git bağlamak için https://www.python.org/downloads/ , ve pencereler için son sürümünü seçin.
Not : En son sürümü indirmek istemiyorsanız, indirme sekmesini ziyaret edebilir ve tüm sürümleri görebilirsiniz.
Adım 2) İndirilen Dosyaya tıklayın
Adım 3) Kurulumu Özelleştir'i seçin
Adım 4) İLERİ'ye tıklayın
Adım 5) Sonraki ekranda
- Gelişmiş seçenekleri seçin
- Özel bir yükleme konumu verin. Benim durumumda, kullanım kolaylığı için C sürücüsündeki bir klasör seçildi
- Yükle'ye tıklayın
Adım 6) Kurulum tamamlandıktan sonra Kapat düğmesine tıklayın.
Adım 7) Komut Dosyaları klasörünüzün yolunu kopyalayın.
Adım 8) Windows komut isteminde
- Pip klasörünün konumuna gidin
- NLTK'yi yüklemek için komut girin
pip3 install nltk
- Kurulum başarıyla yapılmalıdır
NOT : Python2 için commandpip2 install nltk komutunu kullanın
Adım 9) Windows Başlat Menüsünde, PythonShell'i arayın ve açın
Adım 10) Kurulumun doğru olup olmadığını aşağıdaki komutu vererek doğrulayabilirsiniz.
import nltk
Herhangi bir hata görmüyorsanız, Kurulum tamamlanmıştır.
NLTK'yi Mac / Linux'ta Kurmak
NLTK'yi Mac / Unix'e kurmak, nltk'yi kurmak için python paket yöneticisi pip gerektirir. Pip kurulu değilse, işlemi tamamlamak için lütfen aşağıdaki talimatları izleyin.
Adım 1) Aşağıdaki komutu yazarak paket dizinini güncelleyin
sudo apt update
Adım 2) Python 3 için pip kurulumu:
sudo apt install python3-pip
Pip'i easy_install kullanarak da kurabilirsiniz.
sudo apt-get install python-setuptools python-dev build-essential
Şimdi easy_install yüklendi. Pip'i kurmak için aşağıdaki komutu çalıştırın
sudo easy_install pip
Adım 3) NLTK'yi kurmak için aşağıdaki komutu kullanın
sudo pip install -U nltksudo pip3 install -U nltk
NLTK'yi Anaconda aracılığıyla kurma
Adım 1) Lütfen anaconda'yı (farklı paketleri kurmak için de kullanılabilir) https://www.anaconda.com/products/individual adresini ziyaret ederek kurun ve anaconda için hangi python sürümünü kurmanız gerektiğini seçin.
Not: Anaconda'yı kurmak için ayrıntılı adımlar için bu eğiticiye bakın
Adım 2) Anaconda isteminde,
- Komut girin
conda install -c anaconda nltk
- Paket yükseltme, düşürme, yükleme bilgilerini gözden geçirin ve evet girin
- NLTK indirildi ve kuruldu
NLTK Veri Kümesi
NLTK modülü, kullanmak için indirmeniz gereken birçok veri kümesine sahiptir. Daha teknik olarak buna korpus denir . Örneklerden bazıları engellenecek kelimeler , gutenberg , framenet_v15 , büyük_grammars vb.
NLTK'nın tüm paketleri nasıl indirilir
Adım 1) Windows veya Linux'ta Python yorumlayıcısını çalıştırın
Adım 2)
- Komutları girin
import nltknltk.download ()
- NLTK İndirilen Penceresi Açılır. Veri setini indirmek için İndir Düğmesine tıklayın. İnternet bağlantınıza bağlı olarak bu işlem zaman alacaktır
NOT: Dosya> İndirme Dizinini Değiştir'i tıklayarak indirme konumunu değiştirebilirsiniz.
Adım 3) Yüklenen verileri test etmek için aşağıdaki kodu kullanın
>>> from nltk.corpus import brown>>>brown.words()
["The", "Fulton", "County", "Grand", "Jüri", "dedi",…]
NLP Komut Dosyasını Çalıştırma
NLP betiğinin yerel PC'mizde nasıl çalıştırılacağını tartışacağız. Piyasada Doğal Dil İşleme için birçok kütüphane bulunmaktadır. Bu nedenle, bir kütüphane seçmek, gereksinimlerinize uymaya bağlıdır. İşte NLP kitaplıklarının listesi.
NLTK Komut Dosyası Nasıl Çalıştırılır
Adım 1) Favori kod düzenleyicinizde, kodu kopyalayın ve dosyayı " NLTKsample.py " olarak kaydedin
from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)
Kod Açıklaması:
- Bu programda amaç, verilen metinden her türlü noktalama işaretini kaldırmaktı. NLTK'nın bir modülü olan "RegexpTokenizer" ı ithal ettik. İstediğiniz tüm ifadeyi, sembolü, karakteri, sayısal veya her şeyi kaldırır.
- Normal İfadeyi "RegexpTokenizer" modülüne geçtiniz.
- Ayrıca, "tokenize" modülünü kullanarak kelimeyi tokenize ettik. Çıktı, "filterdText" değişkeninde saklanır.
- Ve bunları "print ()" kullanarak yazdırdı.
Adım 2) Komut isteminde
- Dosyayı kaydettiğiniz konuma gidin
- Python NLTKsample.py komutunu çalıştırın.
Bu, çıktıyı şu şekilde gösterecektir:
['Merhaba', 'Guru99', 'Siz', 'sahip', 'inşa et', 'a', 'çok', 'iyi', 'site', 've', 'Ben', 'aşk', ' ',' sizin ',' sitenizi 'ziyaret et]