Forschungsgruppe Data Mining in der Medizin
print

Links und Funktionen

Navigationspfad


Inhaltsbereich

Bachelorseminar "Information-theoretic Data Mining" im SoSe20

Aktuelles

  • 28.04.2020 Die Vorbesprechung am 05.05.2020 findet NICHT als Präsenzveranstaltung sondern als Zoom-Meeting statt.
  • 30.03.2020 Das Seminar wird auch im Sommersemester angeboten. Leider können wir aktuell noch nicht abschließend sagen, ob das Seminar als Präsenzveranstaltung oder online stattfinden wird. Wir werden auf dieser Seite und über Uni2Work informieren, sobald Näheres bekannt ist.

Inhalt

Neue informationstheoretische Ansätze verbinden Data Mining mit Daten-Kompression: Data Mining Methoden finden Muster oder Regelmäßigkeiten in Daten. Je effektiver diese Daten mit Hilfe der gefundenen Muster komprimiert werden können, desto größer ist der gewonnene Informationsgehalt. Das Potential dieser Methodik wird in vielen wissenschaftlichen Arbeiten verdeutlicht: Informationstheoretische Ansätze können vollständige Parameterfreiheit gewährleisten, so dass der Nutzer keine Eingabeparameter spezifizieren muss, die oft schwer zu schätzen sind. Des Weiteren können informationstheoretische Methoden eine Vielzahl von Data Mining Techniken integrieren, wie zum Beispiel Clustering, Outlier Detection und Association Rule Mining. Außerdem können die Verfahren auf verschiedenste Datenstrukturen angewandt werden, wie numerische Feature Vektoren, kategorische Daten oder Graphen.

Im Rahmen dieses Seminars sollen aktuelle Forschungsarbeiten aus dem Bereich informationstheoretisches Data Mining präsentiert und diskutiert werden.

Für eine erfolgreiche Teilnahme am Seminar gibt es folgende Voraussetzungen:

  • Teilnahme an der Vorbesprechung
  • Aktive Teilnahme an beiden Seminartagen
  • Eigenständig vorbereitete Präsentation, die zeigt, dass die präsentierte Forschung verstanden wurde
  • Schriftliche Ausarbeitung von etwa 5-10 Seiten

Grundkenntnisse im Bereich Data Mining und/oder Machine Learning sind hilfreich aber nicht verpflichtend.

Die Vortragszeit beträgt 25 Min., darauf folgen 5-10 Min. Diskussion. Die Teilnehmerzahl ist auf 15 Teilnehmer begrenzt.



Organisation


Anmeldung

Die Anmeldung erfolgt über die Uni2Work-Zentralanmeldung

Ablauf

Jeder Teilnehmer bekommt eine wissenschaftliche Veröffentlichung. Diese soll in einem Referat von 25 Minuten vorgestellt werden. Weiterhin relevante Literatur soll vom jeweiligen Referenten selbständig hinzugezogen werden. Im Anschluss an jedes Referat wird die vorgestellte Veröffentlichung von allen Teilnehmern diskutiert.

Nach dem Blockseminar soll jeder Teilnehmer eine schriftliche Ausarbeitung von etwa 5-10 Seiten einreichen, die sowohl die wesentlichen Punkte der vorgestellten Veröffentlichung als auch die Ergebnisse der Diskussion präsentiert. Für die Erstellung der Ausarbeitung soll dieses LaTeX Template verwendet werden (bare_conf_compsoc.tex).

In die Bewertung gehen sowohl Qualität von Referat und schriftlicher Ausarbeitung ein als auch qualifizierte Mitarbeit und Teilnahme an den Diskussionen jeder Sitzung.


Planung

Die folgenden Termine sind noch vorläufig und kleinere Änderungen sind möglich.

Veranstaltung Datum Zeit Hinweise
Vorbesprechung Di, 05.05.2020 18.00-20.00 Uhr (s.t.) Zoom-Meeting Raum 165 (Oettingenstr. 67)
Verteilung restlicher Themen Mo, 11.05.2020 bis 12:00 Uhr Verteilung nach FIFO-Prinzip per Mail an Collin Leiber
Abgabe Präsentationfolien Di, 21.07.2020 bis 12:00 Uhr Folien als PDF; per E-Mail an Dominik Mautz
Seminarblock 1 Di, 28.07.2020 10.00-18.00 Uhr Raum wird noch bekannt gegeben
Seminarblock 2 Mi, 29.07.2020 10.00-18.00 Uhr Raum wird noch bekannt gegeben
Abgabe erster Entwurf Fr, 07.08.2020 bis 12:00 Uhr Als PDF; per E-Mail an Dominik Mautz
Abgabe Feedback für zugeteilten Entwurf Fr, 14.08.2020 bis 12:00 Uhr Als PDF; per E-Mail an Dominik Mautz
Abgabe Ausarbeitung Fr, 21.08.2020 bis 12:00 Uhr Als PDF; per E-Mail an Dominik Mautz

Themen

Die Paper können Sie hier herunterladen. Das Passwort verschicken wir nach der Vorbesprechung per E-Mail.
Paper vergeben
1-1 RIC ja
1-2 NonparamClustering ja
1-3 OCI ja
1-4 minCEntropy ja
1-5 INTEGRATE ja
1-6 INCONCO ja
1-7 DependencyClustering ja
1-8 OverlappingSubpaceClusters ja
2-1 CrossAssociations ja
2-2 PICS ja
2-3 BipartiteGraphs ja
2-4 CompressionBasedGraphMining ja
2-5 VoG ja
2-6 MeGS ja
2-7 CausalInferenceByCompression ja
2-8 IIC ja

Zusätzliche Informationen

Latex

Literaturrecherche

Lesen & Verstehen

Vortrag

Ausarbeitung


Vorhergehende Semester

WS 19/20, SS 19, WS 18/19, SS 18, WS 17/18, SS 17, WS 16/17, SS 16, WS 15/16, WS 14/15