Sie sind hier: Startseite / Newsroom / Jahresberichte / 2013 / Schnelle Rechnerarchitektur

Schnelle Rechnerarchitektur

Für Anwendungen in der Bioinformatik

Für die schnelle und einfache Verarbeitung von genomischen Sequenzdaten wird eine Computerarchitektur zum Einsatz kommen, die ursprünglich dafür entwickelt wurde, gängige Verschlüsselungsverfahren zu brechen. Das Gerät nutzt spezielle Hardware-Bausteine (FPGA-Chips), die auf eine spezielle Aufgabe rekonfiguriert werden und dadurch im Vergleich zu herkömmlichen Rechern einige Größenordnungen schneller arbeiten können. Dieses interdisziplinäre Projekt im Cluster-Labor IX „Theoretische Biologie“ betreiben Kieler Informatiker und Wissenschaftler des Instituts für Klinische Molekularbiologie (IKMB) und der Technischen Informatik der CAU zusammen mit Designern der Muthesisus Kunsthochschule Kiel.

 
Die neuen Techniken der Next-Generation

Sequenzierung bieten eine Fülle von Möglichkeiten, doch im Prinzip produzieren sie zunächst einmal eine Menge an Daten. Diese zu analysieren braucht Knowhow, Zeit und genügend Rechner sowie Strom. „Um die Rohdaten aufzubereiten, die ein zweitägiger Probendurchlauf mit einem Gerät der Next-Generation Sequenzierung liefert, benötigt ein konventioneller Rechnerverbund, wie er in jedem Rechenzentrum steht, etwa sieben Tage“, verdeutlicht der Bioinformatiker Dr. David Ellinghaus vom Institut für Klinische Molekularbiologe der Christian-Albrechts- Universität zu Kiel (CAU). „Dieser erste Arbeitsablauf gibt die digitale Version der DNA-Basenabfolge aus und detektiert genetische Variation, die man anschließend visualisieren kann“, ergänzt Lars Wienbrandt der in der Kieler Arbeitsgruppe Technische Informatik (Leitung: Professor Manfred Schimmler) promoviert. Die eigentliche Arbeit, also die Auswertung der Daten hinsichtlich der wissenschaftlichen Fragestellung fängt dann eigentlich erst an.

Die FPGA-Rechnerarchitektur RIVYERA S6-LX150 hat die Größe eines einfachen Servers, erreicht für bestimmte Anwendungen jedoch die Rechenleistung eines gesamten herkömmlichen Computerclusters.

Mit dem Ziel, die Datenverarbeitung effizienter zu machen, haben sich innerhalb des Clusters mehrere Arbeitsgruppen zusammengeschlossen. Die hierbei verwendete FPGA-Architektur ist oftmals nicht nur schneller und leistungseffizienter als herkömmliche Computerarchitekturen. Um zukünftige Anforderungen und ein breites Feld von biologischen und medizinischen Anwendungen bedienen zu können, muss diese auch flexibel sein. Beteiligt an dem Projekt sind neben Ellinghaus und Wienbrandt Professor Andre Franke, Spezialist für Genetik und Hochdurchsatz- Technologien am IKMB, der Informatiker Professor Manfred Schimmler, die Industriedesigner Professor Frank Jacob und Simon Koch von der Muthesius Kunsthochschule sowie Professor Johann Oltmann Schröder aus der Medizin.

Technische Grundlage für die neue Rechnerarchitektur sind so genannte Field Programmable Gate Arrays (FPGAs). Das sind Hardware-Bausteine, die auf eine spezielle Aufgabe getrimmt werden können und dadurch im Vergleich zu herkömmlichen Rechern bedeutend schneller arbeiten. Mit einer derartigen FPGA-Architektur, der sogenannten RIVYERA, hat Informatik-Professor Schimmler vor einigen Jahren einen Spezialrechner zur Entschlüsselung von Daten entwickelt. Prinzipiell eignet sich das Gerät aber auch dazu, andere Problemstellungen zu lösen, wie die Suche nach wiederkehrenden Gensequenzen oder der optimale Vergleich von genomischen Sequenzen. Dazu muss es jedoch entsprechend „programmiert“ werden.

Eine bioinformatische Fragestellung wurde bereits auf der RIVYERA eingerichtet. „Die Maschine bearbeitet einen bestimmten Algorithmus, den Smith-Waterman- Algorithmus. Sie kann dann zwar nur das, ist aber mindestens zwei Größenordnungen schneller als hochperformante Computer-Cluster“, berichtet Wienbrandt. „In dem konkreten Beispiel haben wir einen Geschwindigkeitszuwachs von über 150. Das heißt, um die gleiche Aufgabe mit normalen PCs zu lösen, bräuchte man 150 Rechner.“

STICHWORT FPGA
Das FPGA (Field Programmable Gate Array) ist ein programmierbarer Chip, der zum Aufbau digitaler logischer Schaltungen dient. Er besteht aus einzelnen Logikblöcken, die in einer regelmäßigen Struktur (Array) angeordnet sind. Die Funktionen der einzelnen Logikblöcke sind jedoch nicht von vornherein festgelegt, sondern frei konfigurierbar. Man hat also einen technisch vorgefertigten Chip, dessen Funktionalität jeweils gezielt auf die beabsichtigte Anwendung hin eingerichtet wird.

 Das spart nicht nur Rechnerkapazitäten sondern auch enorme Strommengen. Denn hier kommt nur ein FPGA-Gerät zum Einsatz, das nicht mehr Strom als zwei bis drei Rechner benötigt. Die Dimensionen werden vor allem dann deutlich, wenn man berücksichtigt, dass diese Rechenoperationen immer wiederkehrende Arbeitsabläufe sind.

Jetzt sollen noch weitere bioinformatische Anwendungen auf dem Gerät umgesetzt werden. Ein erfolgreiches Beispiel ist die Umsetzung eines Algorithmus’ für genetische Interaktion (Epistasis) mit bis zu 1000-facher Beschleunigung auf der RIVYERA. Langfristig haben die Wissenschaftler auch eine konkrete Anwendung in der Diagnostik im Blick. „Wenn das funktioniert, wollen wir das Gerät für einen Routinevorgang in der immunologischen Diagnostik - die HLA-Typisierung - nutzen“, sagt David Ellinghaus. Das humane Leukozytenantigen-System (HLA-System) dient unter anderem dazu, Vorhersagen darüber treffen zu können, ob bestimmte Therapien im Einzelfall anschlagen oder nicht. Dies werde auch heute schon gemacht, aber mit der neuen Technik könnte die Analyse schneller, zuverlässiger und kostengünstiger sein. „Die Idee ist, dass man die Rohdaten durch die Maschine laufen lässt und nach einer kurzen Zeit die Maschine das Ergebnis wiedergibt: Patient A hat mit hoher Wahrscheinlichkeit das Risiko-Allel B.“

Die schnelle und zuverlässige Datenverarbeitung ist die eine Sache, die benutzerfreundliche Aufbereitung eine andere. Dabei geht es um Interface-Design, also die sinnvolle Gestaltung von interaktiven Bedienoberflächen.
An der Muthesius Kunsthochschule betreut Cluster-Mitglied Professor Frank Jacob diesen Schwerpunkt im Industriedesign. Sein Mitarbeiter Simon Koch hat in seiner Masterarbeit einen Prototyp für die Anwendung zur HLA-Typisierung entwickelt. Dabei geht es nicht nur um ein ansprechendes Design, sondern vor allem darum die Arbeitsschritte so zu gestalten, dass sie leicht von der Hand gehen und nicht erst aufwändig erlernt werden müssen. Wienbrandt: „Simon Koch hat verschiedenen Arbeitsgruppen im Labor über die Schulter geschaut und beobachtet, wie die Menschen arbeiten. Darauf aufbauend hat er das Interface entworfen und zwar so, dass die wichtigen Bereiche in den Fokus rücken und mit wenigen Klicks und vor allem auch mit wenig Augenbewegung erfasst werden können.“

Lars Wienbrandt
ist Doktorand am Institut für Informatik der Christian-Albrechts-Universität zu Kiel. Sein Arbeitsschwerpunkt ist die Hardwarebeschleunigung von Algorithmen der Bioinformatik.

David Ellinghaus
ist seit 2008 wissenschaftlicher Mitarbeiter am Institut für Klinische Molekularbiologie der Christian-Albrechts-Universität zu Kiel. Forschungsschwerpunkte: Identifizierung genetischer Risikovarianten, Implementierung und Anwendung von genetisch-epidemiologischen Studien.

Steckbrief Cluster-Labor IX

Artikelaktionen