Urllib nedir?
urllib, URL'leri açmak için kullanılabilen bir Python modülüdür. URL işlemlerine yardımcı olacak işlevleri ve sınıfları tanımlar.
Python ile internetten XML, HTML, JSON vb. Gibi verilere erişebilir ve verilere erişebilirsiniz. Bu verilerle doğrudan çalışmak için Python da kullanabilirsiniz. Bu eğitimde, verileri web'den nasıl alabileceğimizi göreceğiz. Örneğin, burada bir guru99 video URL'si kullandık ve bu video URL'sine Python kullanarak ve bu URL'nin HTML dosyasını yazdırarak erişeceğiz.
Bu eğitimde öğreneceğiz
- Urllib kullanarak URL nasıl açılır
- Python'da URL'niz için HTML dosyası nasıl okunur
Urllib kullanarak URL nasıl açılır
İnternet verilerine bağlanmak için kodu çalıştırmadan önce, URL kitaplık modülü veya "urllib" ifadesini içe aktarmamız gerekir.
- Urllib'i içe aktar
- Ana işlevinizi tanımlayın
- WebUrl değişkenini bildirin
- Ardından URL kitaplığındaki urlopen işlevini çağırın
- Açtığımız URL, youtube'daki guru99 öğreticisidir
- Ardından, sonuç kodunu yazdıracağız
- Sonuç kodu, oluşturduğumuz webUrl değişkeninde getcode işlevi çağrılarak alınır.
- Bunu bir dizeye dönüştüreceğiz, böylece "sonuç kodu" dizemizle birleştirilebilir.
- Bu, http isteğinin başarıyla işlendiğini gösteren normal bir HTTP kodu "200" olacaktır.
Python'da HTML dosyası form URL'si nasıl alınır
Python'daki "okuma işlevini" kullanarak da HTML dosyasını okuyabilirsiniz ve kodu çalıştırdığınızda, HTML dosyası konsolda görünecektir.
- WebURL değişkeninde okuma işlevini çağırın
- Değişkeni oku, veri dosyalarının içeriğini okumaya izin verir
- URL'nin tüm içeriğini veri adı verilen bir değişkene okuyun
- Kodu çalıştırın - Verileri HTML formatında yazdıracaktır
İşte tam kod
Python 2 Örneği
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 Örneği
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)