CENG394 Data Miningİstanbul Okan ÜniversitesiAkademik Programlar Bilgisayar Mühendisliği (İngilizce)Öğrenciler için Genel BilgiDiploma EkiErasmus BeyanıUlusal Yeterlilikler
Bilgisayar Mühendisliği (İngilizce)
Lisans TYYÇ: 6. Düzey QF-EHEA: 1. Düzey EQF-LLL: 6. Düzey

Ders Genel Tanıtım Bilgileri

Ders Kodu: CENG394
Ders İsmi: Data Mining
Ders Yarıyılı: Güz
Ders Kredileri:
Teorik Pratik Kredi AKTS
3 0 3 7
Öğretim Dili: EN
Ders Koşulu:
Ders İş Deneyimini Gerektiriyor mu?: Hayır
Dersin Türü: Zorunlu Ders
Dersin Seviyesi:
Lisans TYYÇ:6. Düzey QF-EHEA:1. Düzey EQF-LLL:6. Düzey
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Doç. Dr. PINAR YILDIRIM
Dersi Veren(ler): Doç. Dr. PINAR YILDIRIM
Dersin Yardımcıları:

Dersin Amaç ve İçeriği

Dersin Amacı: Bu dersin amacı öğrencilere veri madenciliği temel kavramlarını ve yöntemlerini öğretmektir.
Dersin İçeriği: Ders şu konuları içerir: veriler,önişleme, sınıflandırma, kümeleme, ilişkilendirme algoritmaları, metin ve web madenciliği, farklı alanlarda yapılan veri madenciliği çalışmaları ve bilgi keşfi.

Öğrenme Kazanımları

Bu dersi başarıyla tamamlayabilen öğrenciler;
Öğrenme Kazanımları
1 - Bilgi
Kuramsal - Olgusal
1) Veri madenciliği kavramlarını açıklayabilme
2) Veri önişleme tekniklerini uygulayabilme
3) Veri madenciliği algoritmalarını kullanabilme
4) Veri madenciliği araçlarını kullanabilme
5) Veri madenciliği konularında çözümler üretebilme.
2 - Beceriler
Bilişsel - Uygulamalı
3 - Yetkinlikler
Bağımsız Çalışabilme ve Sorumluluk Alabilme Yetkinliği
Alana Özgü Yetkinlik
Öğrenme Yetkinliği
İletişim ve Sosyal Yetkinlik

Ders Akış Planı

Hafta Konu Ön Hazırlık
1) . Hangi Veri Madenciliğini Motive Edersiniz? Neden Önemlidir? • Peki, Veri Madenciliği Nedir? • Veri Madenciliği - Ne Tür Veri Üzerine uygulanır? • Veri Madenciliği İşlevsellikleri-Ne Türlü Modeller Olabilir? Kitabın 1.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
2) • Veri nedir? •Öznitellikler. • Nitelik türleri. • Ayrık ve sürekli değişkenler. • Veri kümesinin türleri. •Kayıt verileri. •Veri matrisi. • Belge verileri. •Işlem verileri. • Grafik verileri. • Kimyasal veriler. • Sipariş edilen veriler. • Neden veri ön işleme tabi tutuluyor? • Veriler neden kirlidir? • Veri önişleme neden önemlidir? • Veri kalitesinin çok boyutlu ölçümü. • Veri önişlemede başlıca görevler. •Veri kalitesi. •Gürültü, ses. • Aykırı. Kitabın 2.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
3) •Kayıp veriler. • Çift veri. • Verilerin tanımlayıcı özelliklerinin madenciliği. • Merkezi eğilimi ölçmek. • Simetrik ve çarpık veriler. • Normal dağılım eğrisinin özellikleri. • Histogram analizi. • Pozitif ve negatif korelasyonlu veriler. • İlişkili olmayan veriler. •Veri temizleme. • Kayıp veriler nasıl ele alınır? • Gürültülü veriler nasıl ele alınır? • Basit ayrıklaştırma yöntemleri: Binning. • Regresyon. •Küme analizi. • Süreç olarak veri temizleme. • Toplama. • Örnekleme. • Örnekleme türleri. •Örnek boyut. Kitabın 2.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
4) • Sınıflandırma. • Sınıflandırma işlemini açıklamak. • Sınıflandırma örnekleri. • Sınıflandırma teknikleri. • Bir karar ağacı örneği. • Karar ağacına bir başka örnek. • Test verilerine model uygulama. • Karar ağacı oluşturma. • Konular: veri hazırlama. • Konular: sınıflandırma yöntemlerinin değerlendirilmesi. • Karar ağacı çıkarımı için algoritma (ID3 / C4.3). • Öznitelik seçim ölçeği: Bilgi kazancı. • Karar ağacı örneği. Kitabın 8.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
5) • Sayısal değişkenler ve eksik değerler. • Aşırı uydurma ve ağaç budama. • Temel karar ağacı iyileştirme. • Model değerlendirmesi. • Performans değerlendirme metrikleri. • Doğruluk sınırı. • Maliyet matrisi. • Doğruluk hesaplanması. • Maliyete duyarlı önlemler. • Model değerlendirmesi. • Performans değerlendirme yöntemleri. • Tahmin yöntemleri. • ROC (Alıcı İşletim Karakteristiği). • Örnek Temelli Sınıflandırma. • En yakın komşu sınıflandırması. • k-En yakın komşu algoritması örneği. Kitabın 8 ve 9.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
6) • Kümeleme analizi nedir? • Kümeleme analizi uygulamaları. • Kümeleme analizi ne değildir? • Kümeleme kavramı belirsiz olabilir. • Kümeleme türleri. • Giriş verilerinin özellikleri önemlidir. • Kümeleme algoritmaları. •Hiyerarşik kümeleme. . Aglomeratif kümeleme algoritması. • Küme uzaklığı ölçüleri. • Tek link (min) hiyerarşik kümeleme. • Tek link (min) hiyerarşik kümeleme örneği. Kitabın 10.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
7) •Komple link (maks.) Hiyerarşik kümeleme örneği. • K-ortalama algoritması • Başlangıçtaki centroid'lerin seçilmesinin önemi. • K-ortalama algoritmasının kısıtları. • k-ortalama algoritmasının sınırlamalarını aşmak. • K-ortalama örneği Kitabın 10.bölümünün okunması Data Mining Concept and Techniques J.Han and M.Kamber @2012| Morgan Kaufmann Publishers ISBN 978-0-12-381479-1
8) Arasınav1 J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
9) Birliktelik kuralı madenciliği • Sık öğe seti •Birliktelik kuralı • Birliktelik kuralı madenciliği . Apriori algoritması • Apriori algoritması örneği Kitabın 6.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
10) • İstatistiksel sınıflandırma modelleri. • Bayes teoremi ve sınıflandırıcı. • Bayes sınıflandırıcı örneği. •Sürekli değişkenler. Kitabın 6.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
11) • Metin ve web madenciliği. • Doğal dil işleme. • Konuşma parçasının etiketlenmesi. • Sözcük mantıktan anlam ayrılığı. • Metin veritabanları ve IR. • İndeksleme teknikleri. • Metin veri madenciliği türleri. • Metin sınıflandırması. • Belge kümelemesi. • Metin sınıflandırması. • Sınıflandırma yöntemleri. • Vektör uzayı modeli. J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
12) Arasınav2 J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
13) Proje sunumları J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
14) Proje sunumları J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
15) Final sınavı J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011

Kaynaklar

Ders Notları / Kitaplar: Data Mining Concept and Techniques
J.Han and M.Kamber
@2012| Morgan Kaufmann Publishers
ISBN 978-0-12-381479-1
Diğer Kaynaklar: Yok / None

Ders - Program Öğrenme Kazanım İlişkisi

Ders Öğrenme Kazanımları

1

2

3

4

5

Program Kazanımları
1) Matematik, fen bilimleri ve kendi dalları ile ilgili mühendislik konularında yeterli bilgi birikimi; bu alanlardaki kuramsal ve uygulamalı bilgileri mühendislik problemlerini modelleme ve çözme için uygulayabilme becerisi.
2) Karmaşık mühendislik problemlerini saptama, tanımlama, formüle etme ve çözme becerisi; bu amaçla uygun analiz ve modelleme yöntemlerini seçme ve uygulama becerisi.
3) Karmaşık bir sistemi, süreci, cihazı veya ürünü gerçekçi kısıtlar ve koşullar altında, belirli gereksinimleri karşılayacak şekilde tasarlama becerisi; bu amaçla modern tasarım yöntemlerini uygulama becerisi. (Gerçekçi kısıtlar ve koşullar tasarımın niteliğine göre, ekonomi, çevre sorunları, sürdürülebilirlik, üretilebilirlik, etik, sağlık, güvenlik, sosyal ve politik sorunlar gibi ögeleri içerirler.)
4) Mühendislik uygulamaları için gerekli olan modern teknik ve araçları geliştirme, seçme ve kullanma becerisi; bilişim teknolojilerini etkin bir şekilde kullanma becerisi.
5) Mühendislik problemlerinin incelenmesi için deney tasarlama, deney yapma, veri toplama, sonuçları analiz etme ve yorumlama becerisi.
6) Disiplin içi ve çok disiplinli takımlarda etkin biçimde çalışabilme becerisi; bireysel çalışma becerisi.
7) Türkçe sözlü ve yazılı etkin iletişim kurma becerisi; en az bir yabancı dil bilgisi.
8) Yaşam boyu öğrenmenin gerekliliği bilinci; bilgiye erişebilme, bilim ve teknolojideki gelişmeleri izleme ve kendini sürekli yenileme becerisi.
9) Mesleki ve etik sorumluluk bilinci.
10) Proje yönetimi ile risk yönetimi ve değişiklik yönetimi gibi iş hayatındaki uygulamalar hakkında bilgi; girişimcilik, yenilikçilik ve sürdürebilir kalkınma hakkında farkındalık.
11) Mühendislik uygulamalarının evrensel ve toplumsal boyutlarda sağlık, çevre ve güvenlik üzerindeki etkileri ile çağın sorunları hakkında bilgi; mühendislik çözümlerinin hukuksal sonuçları konusunda farkındalık.

Ders - Öğrenme Kazanımı İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı
1) Matematik, fen bilimleri ve kendi dalları ile ilgili mühendislik konularında yeterli bilgi birikimi; bu alanlardaki kuramsal ve uygulamalı bilgileri mühendislik problemlerini modelleme ve çözme için uygulayabilme becerisi.
2) Karmaşık mühendislik problemlerini saptama, tanımlama, formüle etme ve çözme becerisi; bu amaçla uygun analiz ve modelleme yöntemlerini seçme ve uygulama becerisi. 2
3) Karmaşık bir sistemi, süreci, cihazı veya ürünü gerçekçi kısıtlar ve koşullar altında, belirli gereksinimleri karşılayacak şekilde tasarlama becerisi; bu amaçla modern tasarım yöntemlerini uygulama becerisi. (Gerçekçi kısıtlar ve koşullar tasarımın niteliğine göre, ekonomi, çevre sorunları, sürdürülebilirlik, üretilebilirlik, etik, sağlık, güvenlik, sosyal ve politik sorunlar gibi ögeleri içerirler.)
4) Mühendislik uygulamaları için gerekli olan modern teknik ve araçları geliştirme, seçme ve kullanma becerisi; bilişim teknolojilerini etkin bir şekilde kullanma becerisi. 3
5) Mühendislik problemlerinin incelenmesi için deney tasarlama, deney yapma, veri toplama, sonuçları analiz etme ve yorumlama becerisi.
6) Disiplin içi ve çok disiplinli takımlarda etkin biçimde çalışabilme becerisi; bireysel çalışma becerisi. 5
7) Türkçe sözlü ve yazılı etkin iletişim kurma becerisi; en az bir yabancı dil bilgisi.
8) Yaşam boyu öğrenmenin gerekliliği bilinci; bilgiye erişebilme, bilim ve teknolojideki gelişmeleri izleme ve kendini sürekli yenileme becerisi.
9) Mesleki ve etik sorumluluk bilinci.
10) Proje yönetimi ile risk yönetimi ve değişiklik yönetimi gibi iş hayatındaki uygulamalar hakkında bilgi; girişimcilik, yenilikçilik ve sürdürebilir kalkınma hakkında farkındalık. 3
11) Mühendislik uygulamalarının evrensel ve toplumsal boyutlarda sağlık, çevre ve güvenlik üzerindeki etkileri ile çağın sorunları hakkında bilgi; mühendislik çözümlerinin hukuksal sonuçları konusunda farkındalık.

Öğrenme Etkinliği ve Öğretme Yöntemleri

Ders
Proje Hazırlama

Ölçme ve Değerlendirme Yöntemleri ve Kriterleri

Yazılı Sınav (Açık uçlu sorular, çoktan seçmeli, doğru yanlış, eşleştirme, boşluk doldurma, sıralama)
Bireysel Proje

Ölçme ve Değerlendirme

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Projeler 1 % 10
Ara Sınavlar 2 % 50
Final 1 % 40
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 60
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 40
Toplam % 100

İş Yükü ve AKTS Kredisi Hesaplaması

Aktiviteler Aktivite Sayısı İş Yükü
Ders Saati 16 48
Proje 2 40
Ara Sınavlar 12 100
Final 4 32
Toplam İş Yükü 220