Projekt

SESAM

Beschreibung:

Zur Identifikation von Proteinen in biologischen Proben kommt üblicherweise Massenspektrometrie (MS) zum Einsatz: Proteine werden verdaut, die daraus resultierenden Peptide (Fragmente von Proteinen) werden anschließend analysiert. Innerhalb der letzten Jahrzehnte wurde eine neue Generation von Massenspektrometern entwickelt, die imstande sind, Massenspektren mit hoher Auflösung und hoher Massengenauigkeit aufzunehmen. Dies hat die Charakteristiken der Massenspektren erheblich verändert, jedoch ging dieser Fortschritt nicht einher mit der Entwicklung neuer Identifikationsalgorithmen für Peptide, die in der Lage sind, verfügbare Informationen vollständig auszuschöpfen.

Aus diesem Grund sollen in dem hier beantragten, interdisziplinären Bioinformatik-Forschungsprojekt eine Reihe von neuen Identifikationsalgorithmen, die speziell für die Analyse solcher Massenspektren konzipiert sind und verschiedenste Informationsquellen miteinbeziehen, erforscht und entwickelt werden.

Die ersten wissenschaftlichen Resultate sind vielversprechend: Das Projektkonsortium bestehend aus der Proteomik-Gruppe des IMP Wien und der Bioinformatik-Forschungsgruppe der FH OÖ (Campus Hagenberg) hat bereits erfolgreich ein gemeinsames Forschungsprojekt über die Analyse von Massenspektren durchgeführt; mit Hilfe einer neuartigen Scoring-Funktion, welche in diesem Projekt entwickelt wurde, konnten Identifikationsraten erreicht werden, die vergleichbar bzw. sogar höher sind als jene von Mascot, dem derzeitigen Standard-Verfahren in der Identifikation von Massenspektren.

Bestärkt durch diese ersten Ergebnisse sind wir überzeugt, dass die Berücksichtigung von zusätzlichen Informationsquellen zu einer weiteren Verbesserung der Identifikationsraten von Massenspektren führen wird – deshalb widmet sich dieses Projekt der Erforschung folgender neuer Ansätze und deren Kombination: Wir planen Methoden der künstlichen Intelligenz zu entwickeln, um Elutionszeiten von Peptiden, Fragmentierungsmuster und instrumentenspezifische Charakteristiken der Massengenauigkeit zu identifizieren und zu analysieren; zusätzlich werden die beobachteten m/z Werte mit Hilfe des Massenfehlers von verifizierten Identifikationen re-kalibriert und der verbleibende Massenfehler in Bezug auf die erlernte Verteilung in die Scoring-Funktion eingebunden. Maschinelles Lernen soll weiters eingesetzt werden, um Peak-Auswahlverfahren zu entwickeln. Mit Hilfe dieser Verbesserungen soll die Identifikationsrate speziell in schwierigen Situationen wie hybriden Spektren und exhaustiven Suchen nach einer großen Menge an post-translationalen Modifikationen erhöht werden. Tatsächlich führt gerade dieser Ansatz zu exponentiell wachsenden Suchräumen und einem damit einhergehenden Einbruch der Identifikationsrate, da die Informationen in Massenpektren allein nicht ausreichend sind um den erweiterten Suchraum zu bewältigen. Im Gegensatz zu den zumeist angewandten Brute-Force Strategien soll dieses Problem in diesem Projekt mit Hilfe von Konstruktionsheuristiken gelöst werden, nämlich mit evolutionären Algorithmen, die intelligente Suchstrategien für eine große Anzahl an post-translationalen Modifikationen durch eine Kombination aus Datenbanksuche und de-novo Identifizierung realisieren.

Alle in diesem Projekt erzielten Forschungsresultate sollen im Detail publiziert und der Bioinformatik- und Proteomik-Community frei zur Verfügung gestellt werden. Verbesserte Identifikationsraten von Peptiden im Allgemeinen und von unbekannten Modifikationen im Speziellen werden eine größere Einsicht in das Proteom ermöglichen; die Informatik bildet in diesem Zusammenhang eine neue Basis für die Suche nach Antworten zu wichtigen biologischen und medizinischen Fragestellungen.

2013-03-01 - 2016-02-29

Leitung:

Personen:

Forschungsschwerpunkte:

Forschungseinheiten:

Forschungsprogramm:

FWF Translational Research

Das Projekt wird im Translational Research Programm durch den FWF Wissenschaftsfonds gefördert.

Publikationen: