Hafta |
Konu |
Ön Hazırlık |
1) |
. Hangi Veri Madenciliğini Motive Edersiniz? Neden Önemlidir?
• Peki, Veri Madenciliği Nedir?
• Veri Madenciliği - Ne Tür Veri Üzerine uygulanır?
• Veri Madenciliği İşlevsellikleri-Ne Türlü Modeller Olabilir? |
Kitabın 1.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
2) |
• Veri nedir?
•Öznitellikler.
• Nitelik türleri.
• Ayrık ve sürekli değişkenler.
• Veri kümesinin türleri.
•Kayıt verileri.
•Veri matrisi.
• Belge verileri.
•Işlem verileri.
• Grafik verileri.
• Kimyasal veriler.
• Sipariş edilen veriler.
• Neden veri ön işleme tabi tutuluyor?
• Veriler neden kirlidir?
• Veri önişleme neden önemlidir?
• Veri kalitesinin çok boyutlu ölçümü.
• Veri önişlemede başlıca görevler.
•Veri kalitesi.
•Gürültü, ses.
• Aykırı. |
Kitabın 2.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
3) |
•Kayıp veriler.
• Çift veri.
• Verilerin tanımlayıcı özelliklerinin madenciliği.
• Merkezi eğilimi ölçmek.
• Simetrik ve çarpık veriler.
• Normal dağılım eğrisinin özellikleri.
• Histogram analizi.
• Pozitif ve negatif korelasyonlu veriler.
• İlişkili olmayan veriler.
•Veri temizleme.
• Kayıp veriler nasıl ele alınır?
• Gürültülü veriler nasıl ele alınır?
• Basit ayrıklaştırma yöntemleri: Binning.
• Regresyon.
•Küme analizi.
• Süreç olarak veri temizleme.
• Toplama.
• Örnekleme.
• Örnekleme türleri.
•Örnek boyut. |
Kitabın 2.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
4) |
• Sınıflandırma.
• Sınıflandırma işlemini açıklamak.
• Sınıflandırma örnekleri.
• Sınıflandırma teknikleri.
• Bir karar ağacı örneği.
• Karar ağacına bir başka örnek.
• Test verilerine model uygulama.
• Karar ağacı oluşturma.
• Konular: veri hazırlama.
• Konular: sınıflandırma yöntemlerinin değerlendirilmesi.
• Karar ağacı çıkarımı için algoritma (ID3 / C4.3).
• Öznitelik seçim ölçeği: Bilgi kazancı.
• Karar ağacı örneği. |
Kitabın 8.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
5) |
• Sayısal değişkenler ve eksik değerler.
• Aşırı uydurma ve ağaç budama.
• Temel karar ağacı iyileştirme.
• Model değerlendirmesi.
• Performans değerlendirme metrikleri.
• Doğruluk sınırı.
• Maliyet matrisi.
• Doğruluk hesaplanması.
• Maliyete duyarlı önlemler.
• Model değerlendirmesi.
• Performans değerlendirme yöntemleri.
• Tahmin yöntemleri.
• ROC (Alıcı İşletim Karakteristiği).
• Örnek Temelli Sınıflandırma.
• En yakın komşu sınıflandırması.
• k-En yakın komşu algoritması örneği. |
Kitabın 8 ve 9.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
6) |
• Kümeleme analizi nedir?
• Kümeleme analizi uygulamaları.
• Kümeleme analizi ne değildir?
• Kümeleme kavramı belirsiz olabilir.
• Kümeleme türleri.
• Giriş verilerinin özellikleri önemlidir.
• Kümeleme algoritmaları.
•Hiyerarşik kümeleme.
. Aglomeratif kümeleme algoritması.
• Küme uzaklığı ölçüleri.
• Tek link (min) hiyerarşik kümeleme.
• Tek link (min) hiyerarşik kümeleme örneği. |
Kitabın 10.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
7) |
•Komple link (maks.) Hiyerarşik kümeleme örneği.
• K-ortalama algoritması
• Başlangıçtaki centroid'lerin seçilmesinin önemi.
• K-ortalama algoritmasının kısıtları.
• k-ortalama algoritmasının sınırlamalarını aşmak.
• K-ortalama örneği |
Kitabın 10.bölümünün okunması
Data Mining Concept and Techniques
J.Han and M.Kamber
@2012| Morgan Kaufmann Publishers
ISBN 978-0-12-381479-1
|
8) |
Arasınav1 |
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
9) |
Birliktelik kuralı madenciliği
• Sık öğe seti
•Birliktelik kuralı
• Birliktelik kuralı madenciliği
. Apriori algoritması
• Apriori algoritması örneği |
Kitabın 6.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
10) |
• İstatistiksel sınıflandırma modelleri.
• Bayes teoremi ve sınıflandırıcı.
• Bayes sınıflandırıcı örneği.
•Sürekli değişkenler. |
Kitabın 6.bölümünün okunması
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
11) |
• Metin ve web madenciliği.
• Doğal dil işleme.
• Konuşma parçasının etiketlenmesi.
• Sözcük mantıktan anlam ayrılığı.
• Metin veritabanları ve IR.
• İndeksleme teknikleri.
• Metin veri madenciliği türleri.
• Metin sınıflandırması.
• Belge kümelemesi.
• Metin sınıflandırması.
• Sınıflandırma yöntemleri.
• Vektör uzayı modeli. |
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
12) |
Arasınav2 |
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
13) |
Proje sunumları |
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
14) |
Proje sunumları |
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
15) |
Final sınavı |
J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011 |
|
Dersin Program Kazanımlarına Etkisi |
Katkı Payı |
1) |
Proje yönetimi ile risk yönetimi ve değişiklik yönetimi gibi iş hayatındaki uygulamalar hakkında bilgi; girişimcilik, yenilikçilik ve sürdürebilir kalkınma hakkında farkındalık. |
|
2) |
Matematik, fen bilimleri ve kendi dalları ile ilgili mühendislik konularında yeterli bilgi birikimi; bu alanlardaki kuramsal ve uygulamalı bilgileri mühendislik problemlerini modelleme ve çözme için uygulayabilme becerisi. |
|
3) |
Karmaşık mühendislik problemlerini saptama, tanımlama, formüle etme ve çözme becerisi; bu amaçla uygun analiz ve modelleme yöntemlerini seçme ve uygulama becerisi. |
|
4) |
Karmaşık bir sistemi, süreci, cihazı veya ürünü gerçekçi kısıtlar ve koşullar altında, belirli gereksinimleri karşılayacak şekilde tasarlama becerisi; bu amaçla modern tasarım yöntemlerini uygulama becerisi. (Gerçekçi kısıtlar ve koşullar tasarımın niteliğine göre, ekonomi, çevre sorunları, sürdürülebilirlik, üretilebilirlik, etik, sağlık, güvenlik, sosyal ve politik sorunlar gibi ögeleri içerirler.) |
|
5) |
Mühendislik uygulamaları için gerekli olan modern teknik ve araçları geliştirme, seçme ve kullanma becerisi; bilişim teknolojilerini etkin bir şekilde kullanma becerisi. |
|
6) |
Mühendislik problemlerinin incelenmesi için deney tasarlama, deney yapma, veri toplama, sonuçları analiz etme ve yorumlama becerisi. |
|
7) |
Türkçe sözlü ve yazılı etkin iletişim kurma becerisi; en az bir yabancı dil bilgisi. |
|
8) |
Yaşam boyu öğrenmenin gerekliliği bilinci; bilgiye erişebilme, bilim ve teknolojideki gelişmeleri izleme ve kendini sürekli yenileme becerisi. |
|
9) |
Mesleki ve etik sorumluluk bilinci. |
|
10) |
Mühendislik uygulamalarının evrensel ve toplumsal boyutlarda sağlık, çevre ve güvenlik üzerindeki etkileri ile çağın sorunları hakkında bilgi; mühendislik çözümlerinin hukuksal sonuçları konusunda farkındalık. |
|
11) |
Disiplin içi ve çok disiplinli takımlarda etkin biçimde çalışabilme becerisi; bireysel çalışma becerisi. |
|