Vorlesung Knowledge Discovery WS 2005-06 [25784]

Prof. Dr. Rudi Studer,
Dr. Andreas Abecker,
Dipl. Inf.-Wirt Stephan Bloehdorn

Aktuelles:

Übersicht

Inhalt

Die Vorlesung gibt einen Überblick über Verfahren zur Wissensgewinnung aus strukturierten Daten und Texten. Behandelt werden voraussichtlich:

Organisatorisches

Eintrag im Kommentierten Vorlesungsverzeichnis.

Zeiten & Orte:

Prüfung & Co:

Übungen:

Termine & Inhalte für Vorlesung und Übung

Die geplanten Termine sind in der folgenden Tabelle aufgeführt. Termine die ausfallen sind nicht aufgeführt, außerplanmäßige Termine sind hervorgehoben. Vorlesungsfolien und Übungsblätter werden begleitend zur Vorlesung zum Download angeboten. Die Folien werden ähnlich (aber nicht gleich!) denen des letzten Wintersemesters sein.
Datum V/Ü Inhalt Material Literatur
26.10.2005 V Organisatorisches, Einführung 0-Organisatorisches
I-Einfuehrung
02.11.2005 V CRISP Prozessmodell I II-CRISP CRISP Data Mining Guide (externer Link)
09.11.2005 V CRISP Prozessmodell II
16.11.2005 V Data Warehouse, OLAP, Visualisierung I III-DWh-OLAP-Visualisierung Berthold/Hand: Chapter 11;
D. Keim: Datenvisualisierung und Data Mining,
Datenbank Sepktrum 02/2002 (externer Link)
21.11.2005 Ü (CIP-Pool) Rechnerübung: Visualisierung Übungsblatt 1
Folien aus der Übung
MATLAB Diary Datei (Aufg 3/4)
Orange Documentation (externer Link)
MATLAB Primer (externer Link)
23.11.2005 V Data Warehouse, OLAP, Visualisierung II
30.11.2005 V Entscheidungsbäume IV-1-Entscheidungsbaeume Mitchell: Chapter 3
07.12.2005 V Künstliche Neuronale Netze I IV-2-AB-Neuronale-Netze Mitchell: Chapter 4
Berthold/Hand: Chapter 8.1-8.4
12.12.2005 Ü Übung (Korrekturblatt)
(Ergebnisse: siehe oben)
Übungsblatt 2 (Korrekturblatt)
Folien aus der Übung (korrigiert)
Ausführliche Lösung zu Aufgabe 3
14.12.2005 V Künstliche Neuronale Netze II
Support Vector Machines
IV-2-CD-Neuronale-Netze-IV-3-Kernels-SVM Mitchell: Chapter 4 (NN)
Berthold/Hand: Chapters 8.1-8.4 (NN)
Berthold/Hand: Chapter 5 (Kernel/SVM)
Müller et al: An introduction to Kernel-Based Learning Algorithms. IEEE Neur.Netw., 12(2), 2001. (externer Link)
19.12.2005 Ü (CIP-Pool) Rechnerübung: Weka und Evaluierung Übungsblatt 3
Folien aus der Übung
21.12.2005 V Instance Based Learning IV-4-IBL Mitchell: Chapter 8
Pause bis 11.01.06 (Weihnachten/Neujahr)
11.01.2006 V Clustering V-1-Clustering AK Jain MN Murty and PJ Flynn: Data Clustering: A Review. ACM Computing Surveys 31(3), 1999. (externer Link)
16.01.2006 Ü Übung (Korrekturblatt) Übungsblatt 4 (Korrekturblatt)
Musterlösung zu Übungsblatt 4
18.01.2006 V Clustering cont.
Assoziationsregeln
V-2-Assoziationsregeln
23.01.2006 Ü Übung: IBL, Clustering, Assoziationsregeln Übungsblatt 5
Folien zur Übung (korrigiert)
Detaillierte Lösung zu Aufgabe 2
25.01.2006 V Text Mining I VI-123-TextMining F. Sebastiani: Machine learning in automated text categorization, ACM Computing Surveys 34(1), 2002 (externer Link)
01.02.2006 V Text Mining II VI-4-TextMining P. Cimiano et al: Learning Concept Hierarchies from Text Corpora using Formal Concept Anaylsis, Journal of Artificial Intelligence Research (JAIR) 24: 305-339. August 2005.
06.02.2006 Ü (CIP-Pool) Übung (Korrekturblatt) Übungsblatt 6 (Korrekturblatt) (Hinweis !)
kdd.jar - Java Paket zu Aufg 1/2
Detaillierte Lösung zu Aufgabe 4
08.02.2006 V Induktive Logikprogrammierung (ILP) VII-ILP Berthold/Hand: Chapter 7
15.02.2006 V Fragestunde

Literatur

In der Vorlesung wird kein spezifisches Lehrbuch verwendet. Folgende Bücher behandeln Themen der Vorlesung und sind als weiterführende Literatur geeignet:

Software

Folgenden Softwareprodukte/-projekte sind zum praktischen Ausprobieren der Themen der Vorlesung interessant, mit einigen davon wird auch in den Rechnerübungen gearbeitet. Ein nettes Repository bekannter Mining Datensätze: das UCI Machine Learning Repository