Fortschritte in der Identifizierung organischer Spurenstoffe: Zusammenführung der Hilfsmittel und Standardisierung der Suspected- und Non-Target Analytik (FOR-IDENT)

Viele anthropogene und biogene Spurenstoffe gelangen täglich mit unserem Abwasser in die wässrige Umwelt. Werden die Spurenstoffe abgebaut, bilden sich oft unbekannte Transformationsprodukte (TP) bzw. Metaboliten. Viele dieser Spurenstoffe, Metaboliten und TP werden bei derzeitigen Routineanalysen oftmals nicht erfasst.

Bild1 Bild2
Abb. 1: Die FOR-IDENT Plattform
Abb. 2: Software Architektur von FOR-IDENT

In den Vorgängerprojekten RISK-IDENT und ASKURIS wurde nach analytischen LC-MS Methoden gesucht, um die nur in Spuren auftretenden Substanzen zu identifizieren. Dabei wurde der analytische Weg des Non-Target Screenings bzw. des Suspects Screenings beschritten. Im Rahmen des RISK-IDENT Projektes entstand die Stoffdatenbank „STOFF-IDENT“, in der bis dahin knapp 8.000 Chemikalien mit sogenannten Identifiern und physikochemischen Daten gelistet sind. Im Rahmen des FOR-IDENT Projektes wurde diese Datenbank zu einer Arbeitsplattform erweitert. Diese analytische Arbeitsplattform beinhaltet nun weitere externe Software-Komponenten, die eine weitergehende Charakterisierung (bis zur Identifizierung) bis dahin unbekannter Moleküle zulässt.

Ein großer Teil der Arbeit der HSWT an dem Projekt bestand in der Überarbeitung der Software-Architektur des bestehenden Systems, die nun auf die Basis neuester Software-Technologie gestellt wurde. Dazu wurden folgende Technologien eingesetzt:

- Java Version 8: das derzeit neueste Release von Java enthält neue Funktionen, Verbesserungen und Bugkorrekturen zur Verbesserung der Effizienz beim Entwickeln und Ausführen von Java-Programmen.
- Spring 4: Das neueste Release des quelloffenen Spring-Frameworks, welches auf Java 8 basiert. Das Spring-Framework unterstützt vereinfachte und gute Programmiertechniken (Dependency injection, Aspect Oriented Programming).
- Spring Boot: Ein Framework für die Erstellung einzelner lauffähiger Applikationen, die auf Spring basieren.
- Vaadin 7: Ein freies Web-Framework für die Erstellung Rich Client Applications, wobei ein Großteil der Applikationslogik auf dem Server läuft. Auf der Client-Seite baut Vaadin auf dem Ajax-Framework Google Web Toolkit auf.
- Gradle: Ein auf Java basierendes Build-Management-Automatisierungs-Tool.

Diese neuen Technologien wurden allumfassend für die bestehende Software eingeführt. Mit dieser technischen Umstellung wurde es leichter die gegebenen Ansprüche bezüglich Wartbarkeit, Ausbaufähigkeit, Wiederverwendbarkeit und Nutzbarkeit an die Softwareplattform umzusetzen. Die Software besteht zu Projektende aus nahezu 60 Modulen, die die einzelnen Aufgaben der Plattform strukturieren und kapseln. Der modulare Aufbau lässt das Testen einzelner Komponenten mit Unit-Tests zu, sowie eine saubere Weiterentwicklung der Plattform.

Das User-Interface wurde von Grund auf neu mit Hilfe der Vaadin Technologie aufgebaut. Das Design, sowie intuitive Elemente (z. B. Transformationsgraph) wurden mit den Anwendern während des Entwicklungsprozesses erarbeitet und ermöglichen eine ansprechende und einfache Handhabung der Plattform.

In Zusammenarbeit mit den Projektpartnern (TUM, LfU, LW, BWB) konnten die grundlegenden Anforderungen an die Arbeitsplattform FOR-IDENT aufgenommen werden. Dafür wurden Workflows aufgestellt, die einzelnen Schritte der Workflows analysiert und dazu verwendbare Tools identifiziert.
Ein Kriterium für die zu integrierten Software-Tools war die kostenfreie, nicht kommerzielle Nutzung um diese selbst kostenfrei anbieten zu können. Die Tools können je nach vorliegenden Eingangsdaten prozessiert werden.

Bild3 Bild4
Abb. 3: Beispiel User Interface: Transformationsgraph mit Strukturdarstellung
Abb. 4: Schematischer Workflow unter Berücksichtigung der eingebetteten Tools

RTI

Der vom Partner der TUM spezifizierte Retention Time Index wurde als eigenständiges Tool umgesetzt und kann bei vorliegender Kalibration in den Eingangsdaten Stoffvorschläge über den Abgleich der Retentionszeit liefern.

MetFrag

Das Open-Source Tool MetFrag vom IPB Halle kann MS-Spektren für vorgegeben Substanzen prognostizieren. In FOR-IDENT hochgeladenen MS-Spektren von zunächst unbekannten Substanzen können dann mit vorhergesagten MS-Spektren für Stoffvorschläge von FOR-IDENT abgeglichen und somit die Validität des Stoffvorschlags erhöht werden. Bei der Integration wurde die MetFrag-Bibliothek vollständig in die FOR-IDENT Software integriert.

EnviPath

EnviPath von der Universität Mainz und der Eawag stellt Pathways von mikrobiellen Biotransformationen der Universität Minnesota bereit, die in der Datenbank EAWAGBBD gebündelt vorliegen. Dieses Tool wurde in FOR-IDENT integriert und ermöglicht es Pathways für mehrere hundert gefundene Stoffvorschläge anzuzeigen. Dafür wurde in FOR-IDENT eine eigene graphische Komponente entwickelt, die die vorliegenden Pathways als interaktiven Graph darstellt und weitere unbekannte Massen aus den Eingangsdaten markiert.

MassBank

MassBank vom NARA INSTITUTE of SCIENCE and TECHNOLOGY ist eine freie, online Datenbank für gerätespezifische Massenspektren. Links zu diesen Spektren wurden für die Substanzen in STOFF-IDENT hinterlegt und werden sowohl auf der STOFF-IDENT Plattform sowie der FOR-IDENT Plattform bei Suchtreffern angezeigt.
Die Validität der Stoffvorschläge wird durch eine Bewertungsfunktion angegeben, einem Wert zwischen 0 und 1. Dieser ergibt sich aus der gewichteten Summe der prozessierten Tools. Die Gewichte dafür kann der Benutzer beliebig einstellen.

Ein weiterer wichtiger Punkt zur Optimierung von Workflows war das Einlesen der Geräteherstellerformate von Firmen wie Agilent, Waters, Sciex oder Thermo Fisher. Insgesamt wurde die Plattform auf eine neue, leistungsstärkere Basis gestellt. Es wurden in Zusammenarbeit mit den Partnern weitere funktionale Anforderungen erhoben und daraus resultierende Änderungen in der Software umgesetzt. Vor allem ist es gelungen, verschiedene externe Werkzeuge in die Plattform zu integrieren, wodurch der Leistungsumfang erheblich gesteigert werden konnte. Die Software wurde in Zusammenarbeit mit der TUM intensiv getestet und schließlich auf einem Server des LRZ installiert und öffentlich unter der Adresse https://water.for-ident.org zur Verfügung gestellt. Im Rahmen eines internationalen Workshops (SWEMSA, Nov. 2016) wurde die Plattform einer breiten Öffentlichkeit vorgestellt.

Auf Grund der erfolgreichen Resonanz wurde vom BMBF ein Nachfolgeprojekt „FOR-IDENT Nachhaltigkeit“ für weitere 2 Jahre genehmigt, in dem die Plattform zur öffentlichen Nutzung und Weiterentwicklung zur Verfügung gestellt werden soll.