Max Planck Institute for Molecular Genetics

 Department of Computational Molecular Biology

Home page

NOTE: We moved August 2009 to http://bioinformatics.rutgers.edu.

Home page  Contact us  Site map 

 

 

SS 2008

WS 2006/07

P: Applied Data Mining

Format: Blockveranstaltung 5.- 16.03.2007 ganztägig im PC-Pool, 3. Stock, MPI. 5 credits, Schwerpunktbereiche C und D.

Vorbesprechung: 8.2.2007, Raum 331, Turm 2, 3. Stock, MPI für Molekulare Genetik. 15:00-16:00 Uhr

Inhalt: In diesem praktischen Kompaktkurs wird den teilnehmenden Studierenden die Möglichkeit geboten, die in Seminaren bzw. Vorlesungen zur statistischen Mustererkennung bzw. zum Data Mining erworbenen Kenntnisse durch praktische Analyse exemplarischer molekularbiologischer Datensätze zu vertiefen und zu ergänzen. Der thematische Schwerpunkt sind Hidden-Markov- Modelle. Elementare Programmierkenntnisse (C, C++, Python) werden vorausgesetzt, der Schwerpunkt liegt aber auf dem Erlernen der Data Mining Methodik.Für die Implementation der behandelten Methoden stellt die Bibliothek GHMM (http://ghmm.org) die benötigten Algorithmen und Datenstrukturen zur Verfügung. Die verbleibenden Programmieraufgaben beziehen sich auf problemspezifische Adaptionen, Datenaufbereitung und Ergebnisvisualisierung. Während des ganztägigen Kompaktkurses sollen die Teilnehmer/innen ausserdem die Arbeit in einem Team kennenlernen. Ein Leistungsnachweis wird durch die Präsentation der Projektergebnisse erworben.

Voraussetzungen: Erfolgreiche Teilnahme an der Vorlesung "Algorithmische Bioinformatik"; Statistik-Kenntnisse.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de). Additional lecturers: Benjamin Georgi. Teaching assistants: Ivan G Costa, Janne Grunau.

 

WS 2005/06

S: Algebraic Statistics

Format: Bookseminar. Thursdays 14:00-16:00 SR, 3. Stock, MPI. 2 SWS, Nr. 19714 im FU-KVV. Anrechenbar in Schwerpunkt C und D.

Inhalt: In this seminar we will work through the book Algebraic Statistics for Computational Biology" by Lior Pachter and Bernd Sturmfels (eds.). The format will be a book-seminar in which all participants have to read the material every time and turns are taken with giving presentations; several talks per participant are to be expected. This seminar is targeted at students at the final Master's resp. graduate level and will not review elementary material. Prerequesites are statistics and algebra and applications of statistical models in bioinformatics.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

P: Applied Data Mining

Format: Blockveranstaltung 6.- 17.03.2006 ganztägig im PC-Pool, 3. Stock, MPI. 5 credits (Schwerpunktbereiche C und D).

Vorlesungen:

Vorbesprechung: 18.1.2006, Raum 331, Turm 2, 3. Stock, MPI für Molekulare Genetik. 15:00-16:00 Uhr

Inhalt: In diesem praktischen Kompaktkurs wird den teilnehmenden Studierenden die Möglichkeit geboten, die in Seminaren bzw. Vorlesungen zur statistischen Mustererkennung bzw. zum Data Mining erworbenen Kenntnisse durch praktische Analyse exemplarischer molekularbiologischer Datensätze zu vertiefen und zu ergänzen. Die thematischen Schwerpunkte sind Support-Vector-Maschinen und Hidden-Markov- Modelle. Elementare Programmierkenntnisse (C, C++, Python, R) werden vorausgesetzt, der Schwerpunkt liegt aber auf dem Erlernen der Data Mining Methodik.

Voraussetzungen: Erfolgreiche Teilnahme an einem der Seminare "Elements of Statistical Learning" oder "Clusteranalyse heterogener Daten", sowie erfolgreiche Teilnahme an der Vorlesung "Algorithmische Bioinformatik".

Details: Microarrays, Proteinstrukturen, Text Mining --- die Liste ist fortführbar. Das Erkennen komplexer Strukturen in hochdimensionalen Räumen ist ein immer wiederkehrendes Problem in der Bioinformatik. Support Vector Machines (SVM) sind eine junge aber sehr erfolgreiche Klassifikationsmethode, mit deren Hilfe viel Probleme erfolgreich bearbeitet werden können.

Ähnlich verhält es sich mit Hidden Markov Models (HMM). Auf Ihnen basieren z.B. die Standardmethoden für Gen-Vorhersage und das Auffinden homologer Proteinsequenzen. Neben zahlreichen Anwendungen in der Sequenzanalyse, werden Sie auch in für die Analyse von Microarrays eingesetzt.

Die erste Woche des Softwarepraktikums beschäftigt sich mit SVM für Regression und Klassifikation, die zweite Woche mit HMM und der Analyse --- Annotation und Klassifikation --- von biologischen Sequenzen.

Die beiden Blöcke haben analogen Aufbau. Am ersten Tag wird eine Einführung gegeben, am letzten Tag steht Zeit zum Schreiben eines Berichtes zur Verfügung. Jeweils von Dienstag bis Donnerstag werden morgens praktische Aspekte erläutert. Danach wird in kleinen praktischen Schritten auf ein für diesen Tag von den Teilnehmern selbständig zu bearbeitendes Problem hingeführt.

Die Aufgaben sind individuell zu bearbeiten. Die Ergebnisse werden in einem Bericht zusammengefasst. Gruppenarbeit ist erlaubt, die Beiträge Einzelner müssen jedoch klar gekennzeichnet sein. Am Ende jedes Blocks findet bei jedem Teilnehmer die Begutachtung der Implementierung einer der drei Aufgaben statt.

Aus der Güte der Begutachtung und des schriftlichen Berichtes ergeben sich die Note.

Voraussetzungen: Erfolgreiche Teilnahme an der Vorlesung "Algorithmische Bioinformatik"; Statistik-Kenntnisse.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de). Additional lecturers: Alexander Schliep, Benjamin Georgi. Teaching assistants: Janne Grunau.

V: Algorithmische Bioinformatik

Inhalt: Vorlesungen zu Hidden Markov Modellen (Einführung, Profil-HMMs) und Gene Finding im Rahmen der Vorlesung Algorithmische Bioinformatik (Reinert et al.)

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

 

SS 2005

S: Information theoretic methods in bioinformatics

Format: Book seminar. Th 14:00 - 16:00, SR, 3. Stock, MPI. 2 SWS (Anrechenbar in Schwerpunkt C und D)

Description: In this seminar we will review information theoretic appraches based on the book "Information Theory, Inference and Learning Algorithms" by David J.c. MacKay. The format will be a book-seminar in which all participants have to read the material every time and turns are taken with giving presentations. Depending on the number of participants several talks are to be expected. Towards the end we will focus on information theoretic approaches for HMMs using original literature, using the book-seminar format. This seminar is targeted at students at the final Master's resp. graduate level and will not review elementary material. Prerequesites are successful attendance of "Algorithmische Bioinformatik" and "Hidden Markov Models" or further advanced course work. A good working knowledge of HMMs and Bayesian statistics in general is required.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

P: Implementing information theoretic methods in bioinformatics

Format: Programming project after the end of the seminar. Grading based on resulting software. For Masters students (Anrechenbar in den Schwerpunkten C und D.).

Inhalt: In this practical course we will implement selected methods covered in the book seminar "Information theoretic methods in bioinformatics" and perform numerical experiments to further investigate theoretical observations. A particular emphasis will be put on information theoretic methods as applied to clustering problems and, more generally, in the context of HMMs. This practical course is targeted at students at the final Master's resp. graduate level. Prerequesites are successful attendance of "Algorithmische Bioinformatik" and "Hidden Markov Models" or further advanced course work. A good working knowledge of HMMs and Bayesian statistics in general is required. Solid programming experience in Python an C is required.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

 

WS 2004/05

V: Statistische Mustererkennung in der Bioinformatik mit HMMs

Format: Fr 12:00-14:00, Informatik 1.27. 2 SWS

Inhalt: Vorlesung an der Martin-Luther-Universität Halle-Wittenberg.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

V: Analyse von DNA-Microarrays

Format: Di 10:00-12:00, Informatik 1.26. 2 SWS

Inhalt: Vorlesung an der Martin-Luther-Universität Halle-Wittenberg.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

U: Analyse von DNA-Microarrays

Format: Di 14:00-15:00, Informatik 1.03. 1 SWS

Inhalt: Übung zur Vorlesung Analyse von DNA-Microarrays an der Martin-Luther-Universität Halle-Wittenberg.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

U: Statistische Mustererkennung in der Bioinformatik mit HMMs

Format: Di 15:00-16:00, Informatik 1.03. 1 SWS

Inhalt: Übung zur Vorlesung Statistische Mustererkennung in der Bioinformatik mit HMMs an der Martin-Luther-Universität Halle-Wittenberg.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

S: Problemstellungen der Bioinformatik

Format: Fr 10:00-12:00, Informatik 1.03. 2 SWS

Inhalt: Seminar an der Martin-Luther-Universität Halle-Wittenberg.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

V: Algorithmische Bioinformatik

Format: Mo 12:00-14:00 HS 001 Arnimallee, Mi 12:00-14:00 SR 005 Takustrasse 9. 4 SWS

Inhalt: Vorlesungen zu Hidden Markov Modellen und Gene Finding im Rahmen der Vorlesung Algorithmische Bioinformatik (Vingron et al.)

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

 

SS 2004

S: Statistische Gruppentests

Format: Do 14:00 - 16:00, SR, 3. Stock, MPI. 2 SWS

Inhalt: Mit einem Gruppentest bezeichnet man einen Ansatz 'teure' Experimente an einzelnen Proben einzusparen, indem man Gruppen gleichzeitig testet. Dies findet z.B. Anwendung bei der Qualitätskontrolle, z.B. Tests auf HIV oder Hepatitits mittels PCR, von Blutkonserven. Gruppentests sind aber viel allgemeiner anwendbar, wie z.B. bei der Bestimmung von Haplotyp und Genotyp, Erstellung physikalischer Kartierungen und beim Design von DNA-chips. Die zugrundeliegende Theorie ist reizvoll, da sie diskrete Mathematik (Kombinatorik, Kodierungstheorie) und Statistik eng verknüpft.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

V: Statistische Mustererkennung in der Bioinformatik

Format: Do 10:00 - 12:00, SR 119 Arnimallee 3. 2 SWS

Inhalt: Hidden-Markov-Modelle (HMM) sind eine flexible Klasse statistischer Modelle insb. für biologische Sequenzen und Zeitreihen. Ausgehend von der klassischen Definition eines HMM werden wir anhand von Anwendungen in der Molekularbiologie Modellerweiterungen (z.B. Zustände höherer Ordnung, multi-variate Ausgaben) und Klassifizierungs- und Gruppierungsverfahren auf der Basis von HMMs vorstellen. Dies wird ergänzt um eine Einordnung der HMMs in die Hierarchie statistischer Modelle. Ein zusätzlicher Schwerpunkt liegt auf einer Darstellung effektiver Techniken für eine effiziente und numerisch stabile Implementation.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

S: Softwarepraktikum Statistische Mustererkennung

Format: ganztägig, PC Pool, 3. Stock, MPI. 12 cr

Inhalt: Aufbauend auf der GHMM-Bibliothek (http://ghmm.org) bietet das Praktikum die Möglichkeit an aktuellen Fragestellungen der Bioinformatik im Bereich der Analyse von DNA-Sequenzen zu arbeiten. Um gleichzeitig verschiedene Informationsquellen (z.B. Primär- und Sekundärstruktur bei Proteinen) in der Analyse nutzen zu können, ist es nötig, multi-variate, oder vektor-wertige, Ausgaben zu unterstützen. Auf dieser Basis werden wir ein Programm zum Auffinden von Genen in DNA-Sequenzen eukaryontischer Genome entwerfen und implementieren. Dabei gilt es, das biologische Problem zu modellieren, einen Lösungsansatz zu entwerfen und Erweiterungen bzw. Anpassungen an der Bibliothek vorzunehmen. Für Training und Evaluation sind geeignete biologische Datensätze zu erstellen. Während des Praktikums sollen Teilnehmer/innen die selbständige Arbeit als Team (zwei Teams mit je vier Teilnehmern) kennenlernen und Erfahrungen mit Methodik (Extreme Programming) und Softwarewerkzeugen (z.B. für Versionskontrolle, Tests und Dokumentationen) des Software Engineering sammeln.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de). Teaching assistants: Wasinee Rungsarityotin.

 

WS 2003/04

S: Clusteranalyse heterogener Daten

Format: Di 10:00 - 12:00, SR, 3. Stock, MPI. 2 SWS

Inhalt: Der Gegenstand des Seminars sind Verfahren, die es erlauben unterschiedliche Datentypen (heterogene Daten) auszunutzen, um die Robustheit und Aussagekraft bei der Analyse zu verbessern.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

S: Statistical Classification: Support Vector Machines and Generalized Linear Models

Format: Do 14:00 - 16:00, Raum 111, Arnimallee 2-6. 2 SWS

Inhalt: Gemeinsames Seminar mit Ehrhard Behrends und Peter Martus.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

P: Applied Data Mining

Format: Ganztägig 1-12.03.2004, PC-Pool, 3. Stock, MPI. 2 SWS Schwerpunktbereiche C und D.

Inhalt: Gemeinsame Veranstaltung mit Knut Reinert sowie Dennis Kostka und Florian Markowetz.

In diesem praktischen Kompaktkurs wird den teilnehmenden Studierenden die Möglichkeit geboten, die in Seminaren bzw. Vorlesungen zur statistischen Mustererkennung bzw. zum Data Mining erworbenen Kenntnisse durch praktische Analyse exemplarischer molekularbiologischer Datensätze zu vertiefen und zu ergänzen. Die thematischen Schwerpunkte sind Support-Vector-Maschinen und Hidden-Markov- Modelle. Elementare Programmierkenntnisse (C, C++, Python, R) werden vorausgesetzt, der Schwerpunkt liegt aber auf dem Erlernen der Data Mining Methodik.

Voraussetzungen: Erfolgreiche Teilnahme an einem der Seminare "Elements of Statistical Learning" oder "Clusteranalyse heterogener Daten", sowie erfolgreiche Teilnahme an der Vorlesung "Algorithmische Bioinformatik".

Details: Microarrays, Proteinstrukturen, Text Mining --- die Liste ist fortführbar. Das Erkennen komplexer Strukturen in hochdimensionalen Räumen ist ein immer wiederkehrendes Problem in der Bioinformatik. Support Vector Machines (SVM) sind eine junge aber sehr erfolgreiche Klassifikationsmethode, mit deren Hilfe viel Probleme erfolgreich bearbeitet werden können.

Ähnlich verhält es sich mit Hidden Markov Models (HMM). Auf Ihnen basieren z.B. die Standardmethoden für Gen-Vorhersage und das Auffinden homologer Proteinsequenzen. Neben zahlreichen Anwendungen in der Sequenzanalyse, werden Sie auch in für die Analyse von Microarrays eingesetzt.

Die erste Woche des Softwarepraktikums beschäftigt sich mit SVM für Regression und Klassifikation, die zweite Woche mit HMM und der Analyse --- Annotation und Klassifikation --- von biologischen Sequenzen.

Die beiden Blöcke haben analogen Aufbau. Am ersten Tag wird eine Einführung gegeben, am letzten Tag steht Zeit zum Schreiben eines Berichtes zur Verfügung. Jeweils von Dienstag bis Donnerstag werden morgens praktische Aspekte erläutert. Danach wird in kleinen praktischen Schritten auf ein für diesen Tag von den Teilnehmern selbständig zu bearbeitendes Problem hingeführt.

Die Aufgaben sind individuell zu bearbeiten. Die Ergebnisse werden in einem Bericht zusammengefasst. Gruppenarbeit ist erlaubt, die Beiträge Einzelner müssen jedoch klar gekennzeichnet sein. Am Ende jedes Blocks findet bei jedem Teilnehmer die Begutachtung der Implementierung einer der drei Aufgaben statt.

Aus der Güte der Begutachtung und des schriftlichen Berichtes ergeben sich die Note.

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de). Additional lecturers: Wasinee Rungsarityotin. Teaching assistants: Benjamin Georgi.

V: Algorithmische Bioinformatik

Format: 4 SWS, Mo 10:00-12:00 SR 005 Takustrasse 9, Mi 10:00-12:00 SR 005 Takustrasse 9

Inhalt: Vorlesungen zu Hidden Markov Modellen (Einführung, Profil-HMMs) und Gene Finding im Rahmen der Vorlesung Algorithmische Bioinformatik (Reinert et al.).

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

 

SS 2003

V: Statistische Mustererkennung in der Bioinformatik

Format: Do 10:00 - 12:00, SR 119 Arnimallee 3. 2 SWS

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de). Teaching assistants: Wasinee Rungsarityotin.

S: Softwarepraktikum Statistische Mustererkennung

Format: 2 SWS, ganztägig, PC Pool, 3. Stock, MPI

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de). Teaching assistants: Wasinee Rungsarityotin.

 

WS 2002/03

S: Markov Ketten

Format: 2 SWS, Fr 16:00-18:00, SR 059 Takustrasse 9

Inhalt: Gemeinsames Seminar mit Huisinga, Schütte und Vingron

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).

V: Algorithmische Bioinformatik

Format: 4SWS, Mo 10:00-12:00 SR 005, Takustrasse 9, Mi 10:00-12:00 SR 031, Arnimallee 2-6

Inhalt: Vorlesungen zu Hidden Markov Modellen (Einführung, Profil-HMMs) und Gene Finding im Rahmen der Vorlesung Algorithmische Bioinformatik (Vingron et al.)

Contact: Alexander Schliep (alexander.schliep@molgen.mpg.de).