CENG394 Data Miningİstanbul Okan ÜniversitesiAkademik Programlar Gıda Mühendisliği (İngilizce)Öğrenciler için Genel BilgiDiploma EkiErasmus BeyanıUlusal Yeterlilikler
Gıda Mühendisliği (İngilizce)
Lisans TYYÇ: 6. Düzey QF-EHEA: 1. Düzey EQF-LLL: 6. Düzey

Ders Genel Tanıtım Bilgileri

Ders Kodu: CENG394
Ders İsmi: Data Mining
Ders Yarıyılı: Güz
Ders Kredileri:
Teorik Pratik Kredi AKTS
3 0 3 7
Öğretim Dili: EN
Ders Koşulu:
Ders İş Deneyimini Gerektiriyor mu?: Hayır
Dersin Türü: Zorunlu Ders
Dersin Seviyesi:
Lisans TYYÇ:6. Düzey QF-EHEA:1. Düzey EQF-LLL:6. Düzey
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Prof. Dr. PINAR YILDIRIM
Dersi Veren(ler): Prof. Dr. PINAR YILDIRIM
Dersin Yardımcıları:

Dersin Amaç ve İçeriği

Dersin Amacı: Bu dersin amacı öğrencilere veri madenciliği temel kavramlarını ve yöntemlerini öğretmektir.
Dersin İçeriği: Ders şu konuları içerir: veriler,önişleme, sınıflandırma, kümeleme, ilişkilendirme algoritmaları, metin ve web madenciliği, farklı alanlarda yapılan veri madenciliği çalışmaları ve bilgi keşfi.

Öğrenme Kazanımları

Bu dersi başarıyla tamamlayabilen öğrenciler;
Öğrenme Kazanımları
1 - Bilgi
Kuramsal - Olgusal
1) Veri madenciliği kavramlarını açıklayabilme
2) Veri önişleme tekniklerini uygulayabilme
3) Veri madenciliği algoritmalarını kullanabilme
4) Veri madenciliği araçlarını kullanabilme
5) Veri madenciliği konularında çözümler üretebilme.
2 - Beceriler
Bilişsel - Uygulamalı
3 - Yetkinlikler
İletişim ve Sosyal Yetkinlik
Öğrenme Yetkinliği
Alana Özgü Yetkinlik
Bağımsız Çalışabilme ve Sorumluluk Alabilme Yetkinliği

Ders Akış Planı

Hafta Konu Ön Hazırlık
1) . Hangi Veri Madenciliğini Motive Edersiniz? Neden Önemlidir? • Peki, Veri Madenciliği Nedir? • Veri Madenciliği - Ne Tür Veri Üzerine uygulanır? • Veri Madenciliği İşlevsellikleri-Ne Türlü Modeller Olabilir? Kitabın 1.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
2) • Veri nedir? •Öznitellikler. • Nitelik türleri. • Ayrık ve sürekli değişkenler. • Veri kümesinin türleri. •Kayıt verileri. •Veri matrisi. • Belge verileri. •Işlem verileri. • Grafik verileri. • Kimyasal veriler. • Sipariş edilen veriler. • Neden veri ön işleme tabi tutuluyor? • Veriler neden kirlidir? • Veri önişleme neden önemlidir? • Veri kalitesinin çok boyutlu ölçümü. • Veri önişlemede başlıca görevler. •Veri kalitesi. •Gürültü, ses. • Aykırı. Kitabın 2.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
3) •Kayıp veriler. • Çift veri. • Verilerin tanımlayıcı özelliklerinin madenciliği. • Merkezi eğilimi ölçmek. • Simetrik ve çarpık veriler. • Normal dağılım eğrisinin özellikleri. • Histogram analizi. • Pozitif ve negatif korelasyonlu veriler. • İlişkili olmayan veriler. •Veri temizleme. • Kayıp veriler nasıl ele alınır? • Gürültülü veriler nasıl ele alınır? • Basit ayrıklaştırma yöntemleri: Binning. • Regresyon. •Küme analizi. • Süreç olarak veri temizleme. • Toplama. • Örnekleme. • Örnekleme türleri. •Örnek boyut. Kitabın 2.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
4) • Sınıflandırma. • Sınıflandırma işlemini açıklamak. • Sınıflandırma örnekleri. • Sınıflandırma teknikleri. • Bir karar ağacı örneği. • Karar ağacına bir başka örnek. • Test verilerine model uygulama. • Karar ağacı oluşturma. • Konular: veri hazırlama. • Konular: sınıflandırma yöntemlerinin değerlendirilmesi. • Karar ağacı çıkarımı için algoritma (ID3 / C4.3). • Öznitelik seçim ölçeği: Bilgi kazancı. • Karar ağacı örneği. Kitabın 8.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
5) • Sayısal değişkenler ve eksik değerler. • Aşırı uydurma ve ağaç budama. • Temel karar ağacı iyileştirme. • Model değerlendirmesi. • Performans değerlendirme metrikleri. • Doğruluk sınırı. • Maliyet matrisi. • Doğruluk hesaplanması. • Maliyete duyarlı önlemler. • Model değerlendirmesi. • Performans değerlendirme yöntemleri. • Tahmin yöntemleri. • ROC (Alıcı İşletim Karakteristiği). • Örnek Temelli Sınıflandırma. • En yakın komşu sınıflandırması. • k-En yakın komşu algoritması örneği. Kitabın 8 ve 9.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
6) • Kümeleme analizi nedir? • Kümeleme analizi uygulamaları. • Kümeleme analizi ne değildir? • Kümeleme kavramı belirsiz olabilir. • Kümeleme türleri. • Giriş verilerinin özellikleri önemlidir. • Kümeleme algoritmaları. •Hiyerarşik kümeleme. . Aglomeratif kümeleme algoritması. • Küme uzaklığı ölçüleri. • Tek link (min) hiyerarşik kümeleme. • Tek link (min) hiyerarşik kümeleme örneği. Kitabın 10.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
7) •Komple link (maks.) Hiyerarşik kümeleme örneği. • K-ortalama algoritması • Başlangıçtaki centroid'lerin seçilmesinin önemi. • K-ortalama algoritmasının kısıtları. • k-ortalama algoritmasının sınırlamalarını aşmak. • K-ortalama örneği Kitabın 10.bölümünün okunması Data Mining Concept and Techniques J.Han and M.Kamber @2012| Morgan Kaufmann Publishers ISBN 978-0-12-381479-1
8) Arasınav1 J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
9) Birliktelik kuralı madenciliği • Sık öğe seti •Birliktelik kuralı • Birliktelik kuralı madenciliği . Apriori algoritması • Apriori algoritması örneği Kitabın 6.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
10) • İstatistiksel sınıflandırma modelleri. • Bayes teoremi ve sınıflandırıcı. • Bayes sınıflandırıcı örneği. •Sürekli değişkenler. Kitabın 6.bölümünün okunması J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
11) • Metin ve web madenciliği. • Doğal dil işleme. • Konuşma parçasının etiketlenmesi. • Sözcük mantıktan anlam ayrılığı. • Metin veritabanları ve IR. • İndeksleme teknikleri. • Metin veri madenciliği türleri. • Metin sınıflandırması. • Belge kümelemesi. • Metin sınıflandırması. • Sınıflandırma yöntemleri. • Vektör uzayı modeli. J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
12) Arasınav2 J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
13) Proje sunumları J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
14) Proje sunumları J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011
15) Final sınavı J.Han and M.Kamber, Data Mining Concept and Techniques, Morgan Kaufmann Publishers, 2011

Kaynaklar

Ders Notları / Kitaplar: Data Mining Concept and Techniques
J.Han and M.Kamber
@2012| Morgan Kaufmann Publishers
ISBN 978-0-12-381479-1
Diğer Kaynaklar: Yok / None

Ders - Program Öğrenme Kazanım İlişkisi

Ders Öğrenme Kazanımları

1

2

3

4

5

Program Kazanımları
1) Matematik, fen bilimleri ve kendi dalları ile ilgili mühendislik konularında yeterli altyapıya sahiptir.
2) Matematik, fen bilimleri ve kendi alanlardaki kuramsal ve uygulamalı bilgileri mühendislik çözümleri için beraber kullanır.
3) Mühendislik problemlerini saptar, tanımlar, formüle eder ve çözer, bu amaçla uygun analitik yöntemler ve modelleme tekniklerini seçer ve uygular.
4) Bir sistemi, sistem bileşenini ya da süreci analiz eder ve istenen gereksinimleri karşılamak üzere gerçekçi kısıtlar altında tasarlar; bu doğrultuda modern tasarım yöntemlerini uygular.
5) Mühendislik uygulamaları için gerekli olan modern teknik ve araçları seçer ve kullanır.
6) Deney tasarlar, deney yapar, veri toplar sonuçları analiz eder ve yorumlar.
7) Bireysel olarak ve çok disiplinli takımlarda etkin olarak çalışır.
8) Bilgiye erişir ve bu amaçla kaynak araştırması yapar, veri tabanları ve diğer bilgi kaynaklarını kullanır.
9) Bilgiye erişir ve bu amaçla kaynak araştırması yapar, veri tabanları ve diğer bilgi kaynaklarını kullanır.
10) Yaşam boyu öğrenmenin gerekliliği bilincindedir; bilim ve teknolojideki gelişmeleri izler ve kendini sürekli yeniler.
11) Matematik, fen bilimleri ve kendi alanlardaki kuramsal ve uygulamalı bilgileri mühendislik çözümleri için beraber kullanır.
12) Mühendislik problemlerini saptar, tanımlar, formüle eder ve çözer, bu amaçla uygun analitik yöntemler ve modelleme tekniklerini seçer ve uygular.
13) Bir sistemi, sistem bileşenini ya da süreci analiz eder ve istenen gereksinimleri karşılamak üzere gerçekçi kısıtlar altında tasarlar; bu doğrultuda modern tasarım yöntemlerini uygular.
14) Mühendislik uygulamaları için gerekli olan modern teknik ve araçları seçer ve kullanır.
15) Bireysel olarak ve çok disiplinli takımlarda etkin olarak çalışır.
16) Alanının gerektirdiği en az Avrupa Bilgisayar Kullanma Lisansı İleri Düzeyinde bilgisayar yazılımı ile birlikte bilişim ve iletişim teknolojilerini kullanır.
17) Sözlü ve yazılı etkin iletişim kurar; bir yabancı dili en az Avrupa Dil Portföyü B1 Genel Düzeyinde kullanır.
18) Teknik resim kullanarak iletişim kurar.
19) Bilgiye erişir ve bu amaçla kaynak araştırması yapar, veri tabanları ve diğer bilgi kaynaklarını kullanır.
20) Mühendislik çözümlerinin ve uygulamalarının evrensel ve toplumsal boyutlardaki etkilerinin bilincinde olur; girişimcilik ve yenilikçilik konularının farkında olur ve çağın sorunları hakkında bilgiye sahiptir.
21) Mesleki ve etik sorumluluk bilincine sahiptir.
22) Proje yönetimi, işyeri uygulamaları, çalışanların sağlığı, çevre ve iş güvenliği konularında bilinç; mühendislik uygulamalarının hukuksal sonuçları hakkında farkındalığa sahiptir.
23) Mühendislik çözümlerinin ve uygulamalarının evrensel ve toplumsal boyutlardaki etkilerinin bilincinde olduğunu gösterir; girişimcilik ve yenilikçilik konularının farkındadır ve çağın sorunları hakkında bilgi sahibidir.

Ders - Öğrenme Kazanımı İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı
1) Matematik, fen bilimleri ve kendi dalları ile ilgili mühendislik konularında yeterli altyapıya sahiptir.
2) Matematik, fen bilimleri ve kendi alanlardaki kuramsal ve uygulamalı bilgileri mühendislik çözümleri için beraber kullanır.
3) Mühendislik problemlerini saptar, tanımlar, formüle eder ve çözer, bu amaçla uygun analitik yöntemler ve modelleme tekniklerini seçer ve uygular.
4) Bir sistemi, sistem bileşenini ya da süreci analiz eder ve istenen gereksinimleri karşılamak üzere gerçekçi kısıtlar altında tasarlar; bu doğrultuda modern tasarım yöntemlerini uygular.
5) Mühendislik uygulamaları için gerekli olan modern teknik ve araçları seçer ve kullanır.
6) Deney tasarlar, deney yapar, veri toplar sonuçları analiz eder ve yorumlar.
7) Bireysel olarak ve çok disiplinli takımlarda etkin olarak çalışır.
8) Bilgiye erişir ve bu amaçla kaynak araştırması yapar, veri tabanları ve diğer bilgi kaynaklarını kullanır.
9) Bilgiye erişir ve bu amaçla kaynak araştırması yapar, veri tabanları ve diğer bilgi kaynaklarını kullanır.
10) Yaşam boyu öğrenmenin gerekliliği bilincindedir; bilim ve teknolojideki gelişmeleri izler ve kendini sürekli yeniler.
11) Matematik, fen bilimleri ve kendi alanlardaki kuramsal ve uygulamalı bilgileri mühendislik çözümleri için beraber kullanır.
12) Mühendislik problemlerini saptar, tanımlar, formüle eder ve çözer, bu amaçla uygun analitik yöntemler ve modelleme tekniklerini seçer ve uygular.
13) Bir sistemi, sistem bileşenini ya da süreci analiz eder ve istenen gereksinimleri karşılamak üzere gerçekçi kısıtlar altında tasarlar; bu doğrultuda modern tasarım yöntemlerini uygular.
14) Mühendislik uygulamaları için gerekli olan modern teknik ve araçları seçer ve kullanır.
15) Bireysel olarak ve çok disiplinli takımlarda etkin olarak çalışır.
16) Alanının gerektirdiği en az Avrupa Bilgisayar Kullanma Lisansı İleri Düzeyinde bilgisayar yazılımı ile birlikte bilişim ve iletişim teknolojilerini kullanır.
17) Sözlü ve yazılı etkin iletişim kurar; bir yabancı dili en az Avrupa Dil Portföyü B1 Genel Düzeyinde kullanır.
18) Teknik resim kullanarak iletişim kurar.
19) Bilgiye erişir ve bu amaçla kaynak araştırması yapar, veri tabanları ve diğer bilgi kaynaklarını kullanır.
20) Mühendislik çözümlerinin ve uygulamalarının evrensel ve toplumsal boyutlardaki etkilerinin bilincinde olur; girişimcilik ve yenilikçilik konularının farkında olur ve çağın sorunları hakkında bilgiye sahiptir.
21) Mesleki ve etik sorumluluk bilincine sahiptir.
22) Proje yönetimi, işyeri uygulamaları, çalışanların sağlığı, çevre ve iş güvenliği konularında bilinç; mühendislik uygulamalarının hukuksal sonuçları hakkında farkındalığa sahiptir.
23) Mühendislik çözümlerinin ve uygulamalarının evrensel ve toplumsal boyutlardaki etkilerinin bilincinde olduğunu gösterir; girişimcilik ve yenilikçilik konularının farkındadır ve çağın sorunları hakkında bilgi sahibidir.

Öğrenme Etkinliği ve Öğretme Yöntemleri

Ders
Proje Hazırlama

Ölçme ve Değerlendirme Yöntemleri ve Kriterleri

Yazılı Sınav (Açık uçlu sorular, çoktan seçmeli, doğru yanlış, eşleştirme, boşluk doldurma, sıralama)
Bireysel Proje

Ölçme ve Değerlendirme

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Projeler 1 % 10
Ara Sınavlar 2 % 50
Final 1 % 40
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 60
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 40
Toplam % 100

İş Yükü ve AKTS Kredisi Hesaplaması

Aktiviteler Aktivite Sayısı İş Yükü
Ders Saati 16 48
Proje 2 40
Ara Sınavlar 12 100
Final 4 32
Toplam İş Yükü 220