BIL394 Veri Madenciliğiİstanbul Okan ÜniversitesiAkademik Programlar Enerji Sistemleri Mühendisliği (İngilizce)Öğrenciler için Genel BilgiDiploma EkiErasmus BeyanıUlusal Yeterlilikler
Enerji Sistemleri Mühendisliği (İngilizce)
Lisans TYYÇ: 6. Düzey QF-EHEA: 1. Düzey EQF-LLL: 6. Düzey

Ders Genel Tanıtım Bilgileri

Ders Kodu: BIL394
Ders İsmi: Veri Madenciliği
Ders Yarıyılı: Güz
Ders Kredileri:
Teorik Pratik Kredi AKTS
3 0 3 7
Öğretim Dili: TR
Ders Koşulu:
Ders İş Deneyimini Gerektiriyor mu?: Hayır
Dersin Türü: Zorunlu Ders
Dersin Seviyesi:
Lisans TYYÇ:6. Düzey QF-EHEA:1. Düzey EQF-LLL:6. Düzey
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Prof. Dr. PINAR YILDIRIM
Dersi Veren(ler): Dr. BİLİNMİYOR BEKLER
Prof. Dr. PINAR YILDIRIM
Dersin Yardımcıları:

Dersin Amaç ve İçeriği

Dersin Amacı: Bu dersin amacı öğrencilere veri madenciliği temel kavramlarını ve yöntemlerini öğretmektir.
Dersin İçeriği: Ders şu konuları içerir: veriler,önişleme, sınıflandırma, kümeleme, ilişkilendirme algoritmaları, metin ve web madenciliği, farklı alanlarda yapılan veri madenciliği çalışmaları ve bilgi keşfi.

Öğrenme Kazanımları

Bu dersi başarıyla tamamlayabilen öğrenciler;
Öğrenme Kazanımları
1 - Bilgi
Kuramsal - Olgusal
1) Veri madenciliği kavramlarını açıklayabilme
2) Veri önişleme tekniklerini uygulayabilme
3) Veri madenciliği algoritmalarını kullanabilme
4) Veri madenciliği araçlarını kullanabilme
5) Veri madenciliği konularında çözümler üretebilme.
2 - Beceriler
Bilişsel - Uygulamalı
3 - Yetkinlikler
İletişim ve Sosyal Yetkinlik
Öğrenme Yetkinliği
Alana Özgü Yetkinlik
Bağımsız Çalışabilme ve Sorumluluk Alabilme Yetkinliği

Ders Akış Planı

Hafta Konu Ön Hazırlık
1) . Hangi Veri Madenciliğini Motive Edersiniz? Neden Önemlidir? • Peki, Veri Madenciliği Nedir? • Veri Madenciliği - Ne Tür Veri Üzerine uygulanır? • Veri Madenciliği İşlevsellikleri-Ne Türlü Modeller Olabilir? Kitabın 1.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
2) • Veri nedir? •Öznitellikler. • Nitelik türleri. • Ayrık ve sürekli değişkenler. • Veri kümesinin türleri. •Kayıt verileri. •Veri matrisi. • Belge verileri. •Işlem verileri. • Grafik verileri. • Kimyasal veriler. • Sipariş edilen veriler. • Neden veri ön işleme tabi tutuluyor? • Veriler neden kirlidir? • Veri önişleme neden önemlidir? • Veri kalitesinin çok boyutlu ölçümü. • Veri önişlemede başlıca görevler. •Veri kalitesi. •Gürültü, ses. • Aykırı. Kitabın 2.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
3) •Kayıp veriler. • Çift veri. • Verilerin tanımlayıcı özelliklerinin madenciliği. • Merkezi eğilimi ölçmek. • Simetrik ve çarpık veriler. • Normal dağılım eğrisinin özellikleri. • Histogram analizi. • Pozitif ve negatif korelasyonlu veriler. • İlişkili olmayan veriler. •Veri temizleme. • Kayıp veriler nasıl ele alınır? • Gürültülü veriler nasıl ele alınır? • Basit ayrıklaştırma yöntemleri: Binning. • Regresyon. •Küme analizi. • Süreç olarak veri temizleme. • Toplama. • Örnekleme. • Örnekleme türleri. •Örnek boyut. Kitabın 2.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
4) • Sınıflandırma. • Sınıflandırma işlemini açıklamak. • Sınıflandırma örnekleri. • Sınıflandırma teknikleri. • Bir karar ağacı örneği. • Karar ağacına bir başka örnek. • Test verilerine model uygulama. • Karar ağacı oluşturma. • Konular: veri hazırlama. • Konular: sınıflandırma yöntemlerinin değerlendirilmesi. • Karar ağacı çıkarımı için algoritma (ID3 / C4.3). • Öznitelik seçim ölçeği: Bilgi kazancı. • Karar ağacı örneği. Kitabın 8.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
5) • Sayısal değişkenler ve eksik değerler. • Aşırı uydurma ve ağaç budama. • Temel karar ağacı iyileştirme. • Model değerlendirmesi. • Performans değerlendirme metrikleri. • Doğruluk sınırı. • Maliyet matrisi. • Doğruluk hesaplanması. • Maliyete duyarlı önlemler. • Model değerlendirmesi. • Performans değerlendirme yöntemleri. • Tahmin yöntemleri. • ROC (Alıcı İşletim Karakteristiği). • Örnek Temelli Sınıflandırma. • En yakın komşu sınıflandırması. • k-En yakın komşu algoritması örneği. Kitabın 8 ve 9.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
6) • Kümeleme analizi nedir? • Kümeleme analizi uygulamaları. • Kümeleme analizi ne değildir? • Kümeleme kavramı belirsiz olabilir. • Kümeleme türleri. • Giriş verilerinin özellikleri önemlidir. • Kümeleme algoritmaları. •Hiyerarşik kümeleme. . Aglomeratif kümeleme algoritması. • Küme uzaklığı ölçüleri. • Tek link (min) hiyerarşik kümeleme. • Tek link (min) hiyerarşik kümeleme örneği. Kitabın 10.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
7) •Komple link (maks.) Hiyerarşik kümeleme örneği. • K-ortalama algoritması • Başlangıçtaki centroid'lerin seçilmesinin önemi. • K-ortalama algoritmasının kısıtları. • k-ortalama algoritmasının sınırlamalarını aşmak. • K-ortalama örneği Kitabın 10.bölümünün okunması Data Mining Concept and Techniques J.Han and M.Kamber @2012| Morgan Kaufmann Publishers ISBN 978-0-12-381479-1
8) Arasınav1 J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
9) Birliktelik kuralı madenciliği • Sık öğe seti •Birliktelik kuralı • Birliktelik kuralı madenciliği . Apriori algoritması • Apriori algoritması örneği Kitabın 6.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
10) • İstatistiksel sınıflandırma modelleri. • Bayes teoremi ve sınıflandırıcı. • Bayes sınıflandırıcı örneği. •Sürekli değişkenler. Kitabın 6.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
11) • Metin ve web madenciliği. • Doğal dil işleme. • Konuşma parçasının etiketlenmesi. • Sözcük mantıktan anlam ayrılığı. • Metin veritabanları ve IR. • İndeksleme teknikleri. • Metin veri madenciliği türleri. • Metin sınıflandırması. • Belge kümelemesi. • Metin sınıflandırması. • Sınıflandırma yöntemleri. • Vektör uzayı modeli. J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
12) Arasınav2 J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
13) Proje sunumları J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
14) Proje sunumları J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
15) Final sınavı J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011

Kaynaklar

Ders Notları / Kitaplar: Data Mining Concept and Techniques
J.Han and M.Kamber
@2012| Morgan Kaufmann Publishers
ISBN 978-0-12-381479-1
Diğer Kaynaklar: Yok / None

Ders - Program Öğrenme Kazanım İlişkisi

Ders Öğrenme Kazanımları

1

2

3

4

5

Program Kazanımları
1) Kapatılan Bölüm

Ders - Öğrenme Kazanımı İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı
1) Kapatılan Bölüm

Öğrenme Etkinliği ve Öğretme Yöntemleri

Ders
Proje Hazırlama

Ölçme ve Değerlendirme Yöntemleri ve Kriterleri

Yazılı Sınav (Açık uçlu sorular, çoktan seçmeli, doğru yanlış, eşleştirme, boşluk doldurma, sıralama)
Bireysel Proje

Ölçme ve Değerlendirme

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Projeler 1 % 10
Ara Sınavlar 2 % 50
Final 1 % 40
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 60
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 40
Toplam % 100

İş Yükü ve AKTS Kredisi Hesaplaması

Aktiviteler Aktivite Sayısı İş Yükü
Ders Saati 16 48
Proje 2 40
Ara Sınavlar 12 100
Final 4 32
Toplam İş Yükü 220