Python 3 ile HTTP Connection

Python 3 ile HTTP Connection

Python 3 ile uzak bir siteden veri çekmek için kullanabileceğiniz bir çok kütüphane bulunmaktadır. Bu yazıda Python 3 içerisinde bulunan urllib kütüphanesini kullanarak uzak siteden veri çekeceğiz.

Urllib ile ilgili dokümantasyona buradan ulaşabilirsiniz.  https://docs.python.org/3.4/library/urllib.html

Urllib içinde yer alan modüllerden biri olan request modülünü projemize dahil edelim.

Modülü kolaylıkla kullanabilmek için bir değişkene aktarıyorum ve uzak siteyle bağlantı kurmak için urlopen metodunu kullanıyorum. Bu metot ile ilgili detaylı bilgiye buradan ulaşabilirsiniz.

connection değişkenini ekrana bastığımızda şöyle bir sonuç çıkacaktır.

Gerekli bağlantı sağlandıktan sonra çıktıyı okumak için read metodunu kullanacağız.

Bu kodu ekrana bastığımızda aşağıdaki gibi bir sonuç çıkacaktır, ve Türkçe karakterler sorun verecektir. Örnek;

Görüldüğü gibi bazı kaçış karakterleri ve dönüşme uğramış Türkçe karakterler yer almakta. Bu sorunu çözmek için Python içerisinde yer alan decode metodundan yararlanacağım.  İncelemek için Python Dokümantasyonunu inceleyebilirsiniz.

Ekran çıktısında kaçış karakterleri ve Türkçe harflerin görüntülendiğini göreceksiniz. Böylelikle temiz bir html çıktısı elde etmiş olduk.

 

Uygulamanın kodlarını toparlayacak olursak;