Geleceği Yazanlar
Python Kütüphanesi: Pandas Kolon ve Satır Sorgulama
Önceki yazımızda pandas kütüphanesine basit bir giriş yaparak küçük bir veri setinin yüklenmesi ve temel fonksiyonlar ile izlenmesini göstermiştik. Bu yazıya başlamadan önce de pandas kütüphanesinin aslında yine Python’ın “numpy” kütüphanesi üzerine geliştirildiğini ve veri işlemlerini daha kolay ele alabilmeyi sağladığını söylemek isterim. Bu yazımızda tanımladığımız veri setinin üzerind...
Önceki yazımızda pandas kütüphanesine basit bir giriş yaparak küçük bir veri setinin yüklenmesi ve temel fonksiyonlar ile izlenmesini göstermiştik. Bu yazıya başlamadan önce de pandas kütüphanesinin aslında yine Python’ın “numpy” kütüphanesi üzerine geliştirildiğini ve veri işlemlerini daha kolay ele alabilmeyi sağladığını söylemek isterim.
Bu yazımızda tanımladığımız veri setinin üzerinde bir takım sorgulama işlemleri yapacağız. Bunlar nedir;
- Satırları filtrelemek
- Kolon seçmek
Daha önceki yazıda yapılan yükleme işlemlerini bu yazıda tekrar etmeyeceğim. Önceki yazımı referans alabilirsiniz. Verileri yükleme adımından sonra aşağıdaki komut ile verinizin kolon ve satır sayısını görebilirsiniz.
Buna göre satır sayımız 5, kolon sayımız 6 diyebiliriz. Verilerin satırlarına ve kolonlarına erişmek için de index ve columns özellikleri kullanılır.
Buna göre satır indexlerinin 0 dan başlayıp 5’te bittiğini ve 1’er adım ile ilerlediğini yorumlayabiliriz. Ulaşmak istediğimiz satıra index numarası ile ulaşabiliriz. Aşağıda bunun için örnek bir kod satırı bulabilirsiniz. Buna göre 1 dâhil, 3 hariç olmak üzere 1 ve 2. Veri satırlarını listelemiş olursunuz.
iloc fonksiyonunda ilk parametreyi vermezseniz ilk kayıttan itibaren tüm satırları alır (veri.iloc[:3]) gibi, ikinci parametreyi vermezseniz (veri.iloc[2:]) sonuna kadar olan verileri alır. Bu fonksiyonu model çalışmalarınızda eğitim ve kontrol veri setlerinizi gerektiği durumlarda ayırma işlemleri için kullanabilirsiniz. Örneğin eğitim ve kontrol setlerinizi de eksik verileri tamamlamak istiyorsunuz. Her iki setinizi birleştirip bu veri temizliği işlemlerinizi yaptıktan sonra bu fonksiyon ile tekrar veri setlerinizi ikiye ayırabilirsiniz. Tabii bu durumlarda veri setlerinin indexlerini değiştirmeden işlem yapmak gerekiyor. Aksi halde verilerinizin satırları kayabilir bu durumda modeliniz doğru sonuçlar üretmez.
iloc fonksiyonu dizi de kabul etmektedir. Buna göre seçmek istediğiniz satırları aşağıdaki gibi tek tek dizi içerisinde de de verebilirsiniz.
Yukarıdaki çıktı ile veri setinizin 1,3 ve 4.satırlarına erişmiş olursunuz. Burada dikkat edilmesi gereken indexlemenin 0’dan başladığını unutmamak gerekir. iloc fonksiyonuyla kolonlarınızı da seçebilirsiniz. Bunun için komut aşağıdaki gibi kullanılmalıdır.
Yukarıdaki komuta göre 1. ve 2. satırlar, 2. ve 3. kolonlar sonuç olarak gelir.
Indexleri update de edebiliriz. İstediğimiz kolon üzerinden indexleme yapabilir ve buna göre verilere ulaşabiliriz. Buna da diğer yazımda devam edeceğim.
Kaynak dosyalar buraya tıklayarak erişebilirsiniz.
19.12.2019
Yorumlar
Teşekkürler bilgilendirici bir içerik olmuş :)
güzel paylaşım
- Güzel paylaşım
Ama keşke resim ler küçük olsaymis çünkü telefondan giriş yapan arkadaşlar görüntüyü tam almak için buyuttuklerinde site 'nın görünümü kötüleşiyor
Teşekkürler
Teşekkürler
Teşekkürler
Teşekkür ederiz.
teşekkürler
Bilgilendirici bir içerik tebrik ederim başarılar.