BRIDGEcereal: Selbstlernende Web-App verbessert Geschwindigkeit und Genauigkeit bei der Klassifizierung von DNA-Variationen zwischen Getreidesorten
computer generated picture
Mit den rasanten Fortschritten auf dem Gebiet der Genomik in den letzten 25 Jahren hat sich ein entscheidender Faktor für die Verbesserung von Kulturpflanzen herauskristallisiert, das so genannte Pan-Genom, das als die zusammengestellten Genomsequenzen mehrerer Sorten einer Art definiert ist. Das Verständnis und die Verbesserung von Kulturpflanzen auf der Grundlage der riesigen Datenmengen, die erzeugt wurden, stellen die Forscher jedoch auch vor eine Herausforderung, da es an effizienten und benutzerfreundlichen Bioinformatik-Tools mangelt, insbesondere an solchen, die für den Umgang mit großen Mengen an DNA-Variationen in einer Art ausgelegt sind.
Nehmen wir zum Beispiel Weizen. Das Standard-Referenzweizengenom - das für die Weizensorte Chinese Spring erstellt wurde - ist fünfmal größer als das menschliche Genom. Außerdem haben die Forscher seit langem mit den großen Unterschieden in den Positionen der Gene zu kämpfen, die wichtige agronomische Merkmale auf den 21 Chromosomen des Weizens steuern. Zurzeit sind ein Dutzend Weizengenome öffentlich zugänglich.
Das ergibt eine riesige Datenmenge, deren Analyse selbst für Forscher mit fortgeschrittenen bioinformatischen Kenntnissen ein mühsamer Prozess ist. Eine besondere Herausforderung besteht darin, alle Daten zu sortieren, um ähnliche DNA-Abschnitte zu identifizieren, die möglicherweise dasselbe Merkmal steuern, unabhängig davon, wo sie sich auf einem Chromosom befinden.
BRIDGEcereal wurde entwickelt, um den Prozess der Identifizierung großer DNA-Variationen von mühsam zu effizient zu machen.
"Indem man BRIDGEcereal einfach die gewünschte DNA-Sequenz vorlegt, kann es den Suchprozess in weniger als einer Minute abschließen", erklärt der ARS-Forschungsbiologe Xianran Li, Leiter des BRIDGEcereal-Projekts. Li arbeitet in der ARS-Forschungseinheit für Weizengesundheit, Genetik und Qualität in Pullman, Washington.
"Und BRIDGEcereal organisiert die gefundenen Daten und stellt sie in leicht verständlichen Diagrammen dar, die alle Muster hervorheben, in denen sich die DNA befindet", so Li weiter.
Es dauerte nur eine Minute, bis BRIDGEcereal ein vielversprechendes Kandidatengen identifizierte, das für eine Weizenmutation verantwortlich ist, die die Länge der Grannen, der borstenartigen Fortsätze des Weizenkorns, reduziert. Seit den 1940er Jahren war bekannt, dass ein Gen auf dem Weizenchromosom 4A die Entwicklung der Grannen steuert, ein typisches Weizenmerkmal. Aber das genaue Gen, das dieses Merkmal steuert, war bisher unbekannt.
"Indem wir mit BRIDGEcereal Dutzende potenzieller Gene durchsuchten, konnten wir schnell ein Gen mit einer großen DNA-Variation als dasjenige identifizieren, das den Forschern bisher entgangen war", so Li.
Die Wissenschaftler haben BRIDGEcereal auch so konzipiert, dass es selbstlernend ist - auch als unüberwachtes maschinelles Lernen bezeichnet -, d. h. BRIDGEcereal kann selbstständig lernen, neue Muster zu erkennen, ohne dass explizite Anweisungen befolgt werden müssen.
"Was wir also entwickelt haben, ist ein One-Stop-Gateway zur effizienten Auswertung von öffentlich zugänglichen Getreide-Pan-Genomen, das mit zunehmender Datenmenge nur noch effizienter werden wird", so Li.
Bosen Zhang, Postdoktorand an der Washington State University und Mitentwickler der Web-App, fügte hinzu: "Für Forscher ist BRIDGEcereal ein unschätzbares Werkzeug für die Auswahl und Priorisierung von Genkandidaten, die bestimmte Merkmale von Getreidepflanzen kontrollieren."
BRIDGEcereal wurde zunächst für die Arbeit mit Weizen entwickelt. Es wurde bereits angepasst, um ähnliche Daten von Gerste, Mais, Sorghum und Reis zu analysieren.
Hinweis: Dieser Artikel wurde mit einem Computersystem ohne menschlichen Eingriff übersetzt. LUMITOS bietet diese automatischen Übersetzungen an, um eine größere Bandbreite an aktuellen Nachrichten zu präsentieren. Da dieser Artikel mit automatischer Übersetzung übersetzt wurde, ist es möglich, dass er Fehler im Vokabular, in der Syntax oder in der Grammatik enthält. Den ursprünglichen Artikel in Englisch finden Sie hier.