Projekt

SESAM

Projekt

März 2013 - Feb. 2016

Zur Identifikation von Proteinen in biologischen Proben kommt üblicherweise Massenspektrometrie (MS) zum Einsatz: Proteine werden verdaut, die daraus resultierenden Peptide (Fragmente von Proteinen) werden anschließend analysiert. Innerhalb der letzten Jahrzehnte wurde eine neue Generation von Massenspektrometern entwickelt, die imstande sind, Massenspektren mit hoher Auflösung und hoher Massengenauigkeit aufzunehmen. Dies hat die Charakteristiken der Massenspektren erheblich verändert, jedoch ging dieser Fortschritt nicht einher mit der Entwicklung neuer Identifikationsalgorithmen für Peptide, die in der Lage sind, verfügbare Informationen vollständig auszuschöpfen.

Aus diesem Grund sollen in dem hier beantragten, interdisziplinären Bioinformatik-Forschungsprojekt eine Reihe von neuen Identifikationsalgorithmen, die speziell für die Analyse solcher Massenspektren konzipiert sind und verschiedenste Informationsquellen miteinbeziehen, erforscht und entwickelt werden.

Die ersten wissenschaftlichen Resultate sind vielversprechend: Das Projektkonsortium bestehend aus der Proteomik-Gruppe des IMP Wien und der Bioinformatik-Forschungsgruppe der FH OÖ (Campus Hagenberg) hat bereits erfolgreich ein gemeinsames Forschungsprojekt über die Analyse von Massenspektren durchgeführt; mit Hilfe einer neuartigen Scoring-Funktion, welche in diesem Projekt entwickelt wurde, konnten Identifikationsraten erreicht werden, die vergleichbar bzw. sogar höher sind als jene von Mascot, dem derzeitigen Standard-Verfahren in der Identifikation von Massenspektren.

Bestärkt durch diese ersten Ergebnisse sind wir überzeugt, dass die Berücksichtigung von zusätzlichen Informationsquellen zu einer weiteren Verbesserung der Identifikationsraten von Massenspektren führen wird – deshalb widmet sich dieses Projekt der Erforschung folgender neuer Ansätze und deren Kombination: Wir planen Methoden der künstlichen Intelligenz zu entwickeln, um Elutionszeiten von Peptiden, Fragmentierungsmuster und instrumentenspezifische Charakteristiken der Massengenauigkeit zu identifizieren und zu analysieren; zusätzlich werden die beobachteten m/z Werte mit Hilfe des Massenfehlers von verifizierten Identifikationen re-kalibriert und der verbleibende Massenfehler in Bezug auf die erlernte Verteilung in die Scoring-Funktion eingebunden. Maschinelles Lernen soll weiters eingesetzt werden, um Peak-Auswahlverfahren zu entwickeln. Mit Hilfe dieser Verbesserungen soll die Identifikationsrate speziell in schwierigen Situationen wie hybriden Spektren und exhaustiven Suchen nach einer großen Menge an post-translationalen Modifikationen erhöht werden. Tatsächlich führt gerade dieser Ansatz zu exponentiell wachsenden Suchräumen und einem damit einhergehenden Einbruch der Identifikationsrate, da die Informationen in Massenpektren allein nicht ausreichend sind um den erweiterten Suchraum zu bewältigen. Im Gegensatz zu den zumeist angewandten Brute-Force Strategien soll dieses Problem in diesem Projekt mit Hilfe von Konstruktionsheuristiken gelöst werden, nämlich mit evolutionären Algorithmen, die intelligente Suchstrategien für eine große Anzahl an post-translationalen Modifikationen durch eine Kombination aus Datenbanksuche und de-novo Identifizierung realisieren.

Alle in diesem Projekt erzielten Forschungsresultate sollen im Detail publiziert und der Bioinformatik- und Proteomik-Community frei zur Verfügung gestellt werden. Verbesserte Identifikationsraten von Peptiden im Allgemeinen und von unbekannten Modifikationen im Speziellen werden eine größere Einsicht in das Proteom ermöglichen; die Informatik bildet in diesem Zusammenhang eine neue Basis für die Suche nach Antworten zu wichtigen biologischen und medizinischen Fragestellungen.


Forschungsprogramm

FWF Translational Research


Das Projekt wird im Translational Research Programm durch den FWF Wissenschaftsfonds gefördert.

2015
V. Dorfer, S. Maltsev, S. Dreiseitl, K. Mechtler, S. M. Winkler - A Symbolic Regression Based Scoring System Improving Peptide Identifications for MS Amanda - Proceedings of the 11th GECCO Workshop on Medical Applications of Genetic and Evolutionary Computation MedGEC, Madrid, Spanien, 2015 mehr
2015
V. Dorfer, S. Maltsev, S. M. Winkler, K. Mechtler - Chimeric MS/MS Spectra Identification using MS Amanda - Proceedings of 63rd ASMS Conference on Mass Spectrometry and Allied Topics (ASMS 2015), St. Louis, Vereinigte Staaten von Amerika, 2015 mehr
2014
V. Dorfer, G. Dürnberger, S. M. Winkler, K. Mechtler - Searching Chimeric MS/MS Spectra with MS Amanda - Proceedings of the 12th Austrian Proteomic Research Symposium (APRS 2014), Salzburg, Österreich, 2014 mehr
2014
V. Dorfer, P. Pichler, T. Stranzl, J. Stadlmann, T. Taus, S. M. Winkler, K. Mechtler - MS Amanda, a Universal Identification Algorithm Optimized for High Accuracy Tandem Mass Spectra - Journal of Proteome Research, Vol. 13, No. 8, 2014, pp. 3679-3684 mehr
2014
V. Dorfer, P. Pichler, T. Stranzl, G. Dürnberger, S. M. Winkler, K. Mechtler - A Standalone Version of MS Amanda for Integration into Proteomics Workflows - Proceedings of the 13th Human Proteome Organization World Congress (HUPO 2014), Madrid, Spanien, 2014 mehr
2014
V. Dorfer, P. Pichler, T. Stranzl, S. M. Winkler, K. Mechtler - MS Amanda Stand-Alone for Integration in Proteomics Workflows - Proceedings of 62rd ASMS Conference on Mass Spectrometry and Allied Topics (ASMS 2014), Baltimore, Vereinigte Staaten von Amerika, 2014 mehr
2013
V. Dorfer, P. Pichler, S. M. Winkler, K. Mechtler - MS Amanda: A Novel Algorithm for the Identification of High Accuracy Tandem Mass Spectrometry Data - Proceedings of 11th Austrian Proteomic Research Symposium (APRS 2013), Innsbruck, Österreich, 2013 mehr
2013
V. Dorfer, P. Pichler, S. M. Winkler, K. Mechtler - MS Amanda: A Novel Algorithm for the Identification of High Accuracy Tandem Mass Spectrometry Data - Proceedings of 61st ASMS Conference on Mass Spectrometry and Allied Topics, Minneapolis, Vereinigte Staaten von Amerika, 2013 mehr