Veri madenciliği modeli – CRISP-DM

Cross-Industry Standard Process for Data Mining
Şu an için en geçerliliği olan, sektöre bir standart geliştime amacıyla oluşturulmuş modeldir.
Modelin genel akışı 

1- Model problemi anlamak ile başlıyor. Model anlaşıldığında toplanan veride daha kaliteli – gürültüsüz olabiliyor.
2- Daha sonra veri inceleniyor. Problemi anlama ve veriyi analama bir biri arasında  geçişlerle devam eden bir süreç.
3- Verinin ön işlenmesi, hazırlanması aşmasında veri içerinde görüldü- eksikleri çıkartılıyor. veri dönüştürülüyor (örneğin metin verisi sayısal değerlere dönüştürülüyor)
4- Model oluşturma aşmasında veri içerisindeki örüntüler ortaya çıkartılıyor- makine öğrenmesi aşaması bu sırada gerçekleştiriliyor. Model oluşturma aşmasında gerekirse veri ön işleme aşamasına dönerek işlem tekrarlanabilir.
5-Model sonucunda sürecin ve modelin başarılı olup olmadığı değerlendirilir.
6- Eğer model başarılı ise üretim aşamasında geçiliyor. Eğer model başarılı değilse problemin anlaşılması aşamasına geri dönülüyor. 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir