İçeriğe geç

Makine Öğrenmesi Model Parametre Seçimi

Python da bulunan sklearn kütüphanesindeki GridSearch isimli kütüphane kendisine verilen algoritma ve parametreleri alarak en iyi sonucu hangi modelde ne şekilde alacağımızın sonucunu döndürür.
Kullanılacak olan veri seti buradan indirilebilir. Veri seti hakkında bilgi için dökümantasyon.

Birden fazla algoritma ile aynı anda deneme yapmadım fakat tek algoritma için basitçe kullanımı aşağıdaki gibi.

import pandas as pd
veriler = pd.read_csv('spam7.csv',sep=',') #CVS Okuma İşlemi
X=veriler.iloc[:,1:7]#Seçilecek olan kolonlar 1-7 arası(1 dahil)
y=veriler.iloc[:,7]#Etiket kolonu (y,n şeklinde)
from sklearn import tree
clf = tree.DecisionTreeClassifier()#Karar ağacı ile sınıflandırma
#clf.fit(X,y) #criterion= 'entropy', max_depth=5
from sklearn.model_selection import GridSearchCV
gvparam=[{'criterion':['gini','entropy'], 'max_depth':[1,2,3,4,5,10]},
          {'criterion':['gini','entropy'], 'max_depth':[5,10,15,20,25]}]
clf = GridSearchCV(clf, gvparam, cv=4)
gsearch=clf.fit(X, y)
print(gsearch.best_params_)
print(gsearch.best_score_)

Burada gvparam ile o algoritmaya ait olan parametreler gönderilir gridsearch deneme yapar ve aşağıdaki gibi bir sonuç ekrana basar (printler dolayısı ile).

{'criterion': 'gini', 'max_depth': 5}
0.863942621169311

Buradan anlaşılan ilk satırda verilen parametreler ile en iyi skoru elde etmiş ve bu skorda 0.86’lı kısımdır.

 

Tarih:Makine Öğrenmesi

İlk Yorumu Siz Yapın

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir