İçeriğe geç

Makine Öğrenmesi Verilerin Okunması

Makine öğrenmesinde en önemli şeylerden bir tanesi bir veri setinin okunması ve yorumlanması işlemidir. Öncelikle veri setimizi belirlemeliyiz.

Ben buradaki veri setini kullanacağım. Burada sadece okuma işlemi yapacağımız için datanın içeriği bizim için şuan önemli değildir. Fakat detaylı olarak üzerinde çalışacak olsaydık içerik hakkında ufakta olsa bilgi sahibi olmamız gerekirdi. Verdiğim linkte genellikle veri setlerine ait bilgiler bulunmaktadır.

Verileri okumak için numpy ve pandas adındaki python kütüphanelerine ihtiyacımız var genellikle bu kütüphaneler anaconda ile kurulmaktadır. Şimdi kütüphanelerin kullanımı ve verilerimizin okunması işlemine geçelim.

Öncelikle kütüphaneleri import edelim.

import numpy as np
import pandas as pd

import kütüphane_adı as kütüphaneyi_kısaltacağımız_ad

Yani direkt olarak numpy. şeklinde değilde artık np. şeklinde kullanmak için as ile yeniden isimlendiriyoruz.

Sırada veri setinin okunması ve ekrana basılması var.

veriseti = pd.read_csv('bank/bank-full.csv')

print veriseti #python 3.0 print(veriseti)

Burada veriseti adında tanımlama yaptım ve dedim ki pd yani pandas’ın read_csv kütüphanesi yardımı ile oku ekran çıktısı aşağıdaki gibi oldu.

Resimde görüldüğü gibi 45211 adet satırımız var ve içerikleri mevcut variable exp. ile ise print ile basmak yerine direkt olarak tablo şeklinde görebiliyoruz. Burada fark ettiyseniz datalarımız tek kolonda gibi gözükmekte fakat bizim birden fazla kolonumuz var burada bir sorun olduğunu fark edebiliriz. Bu sorunun kaynağı read_csv methodunun dataları , ile split yani parçalamaya çalışması kaynaklıdır. Bunun önüne geçmek için çok kolay bir yöntem var. Kütüphanete sep parametresi ile ‘;’ göndermek yeterli olacaktır. Yani kodumuzun düzenlenmiş hali.

veriseti = pd.read_csv('bank/bank-full.csv', sep=';')
print veriseti

Çok basit bir şekilde artık veri setimizi parçaladık.

Şimdi veri setime ait kolonları almak istiyorum mesela job ve marital kolonlarını alayım bunun için aşağıdakileri yazmam yeterli olacaktır.

job=veriseti[['job','marital']]

print job

Görüldüğü gibi 2 adet kolon aldım ve bunları yazdırabildim. Artık veri setime hakimim. İlk önceliğim olması gereken konuya.

Diğer yazılarda bu veri seti ile yapabileceklerimiz hakkında detaylara gireceğiz.

Tarih:Makine Öğrenmesi

İlk Yorumu Siz Yapın

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir