Sie sind hier: Startseite / Newsroom / Jahresberichte / 2016 / Rechner für die Bioinformatik

Rechner für die Bioinformatik

Schnelle Datenanalyse und einfache Interpretation
Seit 2013 werden insgesamt 21 Cluster-interne Projekte gefördert. Sie wurden mit Unterstützung externer Gutachter ausgewählt. Die Projekte behandeln Hauptthemen des Clusters der zweiten Förderperiode und beziehen dabei neue und originelle wissenschaftliche Fragestellungen und Methoden ein. Der Großteil der Projekte aus der ersten Förderperiode wurde bereits im Jahresbericht 2015 im Detail vorgestellt. Hier folgen fünf weitere Berichte über Projekte der ersten Ausschreibung, sowie alle Berichte über Projekte der zweiten Ausschreibung.

Wenige Minuten Rechnerlaufzeit statt vieler Stunden oder sogar Tage und eine Energieeinsparung von bis zu 99 Prozent – die Kooperation mit der Technischen Informatik hat sich für Bioinformatiker der Kieler Universität gelohnt. In einem vom Cluster geförderten Projekt wurde gezeigt, dass Berechnungen 10 bis 2000 mal schneller laufen können, wenn alternative Rechnerstrukturen genutzt werden. Das verwendete Gerät nutzt spezielle Hardware-Bausteine, die für eine definierte Aufgabe rekonfiguriert werden. Und es hat nur die Größe eines normalen PCs, während üblicherweise Großrechner des Rechenzentrums verwendet werden. Ebenfalls beteiligt am Projekt waren Designer der Muthesius Kunsthochschule Kiel. Sie entwickelten eine intuitive Benutzeroberfläche für die vereinfachte Dateninterpretation (siehe Jahresbericht 2013).

Der Nachweis ist erbracht. „Wir wollten eine Testinfrastruktur auf Basis von Field Programmable Gate Arrays (FPGA) aufbauen, die eine ultraschnelle und einfache Verarbeitung von genetischen Daten und deren anschließende Interpretation ermöglicht. Das ist gelungen“, sagt Professor David Ellinghaus vom Institut für Klinische Molekularbiologe (IKMB) der Kieler Universität. In Zusammenarbeit mit Dr. Lars Wienbrandt, ehemals Doktorand der Kieler Arbeitsgruppe Technische Informatik und jetzt Wissenschaftler am IKMB, wurden einige sehr rechenintensive Programme und Algorithmen für die FPGA-Rechnerarchitektur umgeschrieben. „Das funktioniert nicht bei allen Programmen gleich gut. Aber eine Aufgabe konnten wir tatsächlich in bis zu 2000facher Geschwindigkeit durchrechnen“, betont der Bioinformatiker. Dadurch wurde ein Rechenprozess, der etliche Wochen auf einem gut ausgestatteten Großrechner im Rechenzentrum läuft, auf zwei Stunden verkürzt, der Stromverbrauch konnte um bis zu 99 Prozent reduziert werden.



David Ellinghaus
leitet die Arbeitsgruppe Biomedizinische Informatik
von Phänotypdefinitionen am Institut für Klinische Molekularbiologie (IKMB) der Christian-Albrechts-Universität zu Kiel. Der Bioinformatiker erforscht molekulargenetische Risikoprofile für chronisch entzündliche Erkrankungen.

Klingt fantastisch, ist aber nicht ganz trivial. „Für die herkömmliche CPU-Rechnerarchitektur (CPU: Central Processing Unit, Prozessor) ist es sehr viel einfacher zu programmieren. Bei Verwendung alternativer FPGA-Architekturen werden diese entsprechend der Aufgabe mittels einer Hardware-Beschreibungssprache konfiguriert und die Berechnungsabläufe dadurch optimiert. „Sinn macht das vor allem für eine Anwendung, die den größten Teil der Rechenzeit dafür benötigt, eine kleinere Teilaufgabe immer wiederholt durchzuführen, zum Beispiel zur Berechnung eines statistischen Tests. Hier lohnt es, die benötigte Hardware zu kaufen oder dafür zu optimieren. Dann läuft diese Maschine wie ein Automat“, erklärt Informatiker Wienbrandt.

Lars Wienbrandt
ist wissenschaftlicher Mitarbeiter am IKMB. Der promovierte Informatiker entwickelt mit Jan Kässens und David Ellinghaus ein FPGA-GPUHybridsystem, dass die Datenverarbeitung in der Bioinformatik beschleunigt. Kooperationspartner: Prof. Dr. Johann Oltmann Schröder (Exzellenzzentrum Entzündungsmedizin, CCIM Kiel), Prof. Andre Franke, Jan Christian Kässens (Institut für Klinische Molekularbiologie, Kiel), Prof. Dr. Manfred Schimmler (Institut für Informatik, Kiel), Prof. Frank Jakob, Benjamin Schwarz, Simon Koch, Prof. (em.) Dr. Rainer W. Ernst (Muthesius Kunsthochschule Kiel).

Ziel des Projekts war aber nicht nur die schnelle und zuverlässige Datenverarbeitung, sondern auch die benutzerfreundliche Aufbereitung. „Diese Maschine ist schon sehr ‚informatiklastig‘ zu bedienen und anzusteuern. In der Praxis würde sich das kaum bewähren.“ Die Lösung ist eine passende Gestaltung einer interaktiven Bedienoberfläche. An der Muthesius Kunsthochschule Kiel betreut Cluster-Mitglied Professor Frank Jacob diesen Schwerpunkt. Die Benutzeroberfläche sollte intuitiv zu bedienen sein, sodass die Arbeitsschritte leicht von der Hand gehen und nicht aufwändig erlernt werden müssen. Zudem soll eine Hilfestellung gegeben werden, wie diese Tools zu nutzen sind, ohne dass man den Algorithmus im Detail verstehen muss. Innerhalb einer Masterarbeit wurde ein entsprechendes Interface für die Anwendung zur HLA-Typisierung entwickelt.

Aufbauend auf den guten Erfahrungen der interdisziplinären Zusammenarbeit soll in einem Nachfolgeprojekt ein sehr häufig verwendeter Algorithmus aus der genetischen Epidemiologie, die sogenannte Haplotyp-Genotyp-Vorhersage, auf einem neuen FPGA-GPU-Hybridsystem am IKMB umgesetzt werden. Ellinghaus: „Dabei geht es darum, mit Hilfe von Referenzdaten, die es überall auf der Welt gibt, die eigenen genetischen Datensätze zu vergleichen und zu komplementieren. Datenpunkte, die man selbst nicht gemessen hat, lassen sich so schätzen. Bisher sind die CPU-basierten Algorithmen jedoch sehr rechenintensiv. Und je mehr Daten die Referenz enthält, umso größer ist die Rechenlaufzeit.

Für die Anwendung zur Haplotyp-Genotyp-Vohersage haben Professor Frank Jacob und sein ehemaliger Masterstudent, Benjamin Schwarz, einen Prototyp für eine grafische Benutzeroberfläche entworfen und umgesetzt. Diese informiert auch darüber, ob die Daten zur Referenz passen und eine gute Berechnung mit den vorliegenden Daten zu erwarten ist, gibt Hilfestellung bei der Interpretation der Ergebnisse und deren Visualisierung.

Artikelaktionen