01/2020
Press Release
Gemeinsame Pressemitteilung des Leibniz-Instituts für Pflanzengenetik und Kulturpflanzenforschung (IPK), der Martin-Luther-Universität Halle-Wittenberg (MLU) und des Leibniz-Instituts für Pflanzenbiochemie (IPB)
Mit „Kmasker plants“ Genomsequenzen einfacher bearbeiten
Gatersleben, 20.01.2020 Die Entwicklung von Next-Generation-Sequencing (NGS) hat es Forschern ermöglicht, Genome zu untersuchen, die zuvor als zu komplex oder aufgrund ihrer Größe als zu teuer galten. Trotzdem ist die Analyse komplexer Pflanzengenome, die oft einen enormen Anteil an repetitiven Sequenzen besitzen, noch immer eine Herausforderung. Daher haben Bioinformatiker des Leibniz-Instituts für Pflanzengenetik und Kulturpflanzenforschung (IPK) in Gatersleben, der Martin-Luther-Universität Halle-Wittenberg (MLU) und des Leibniz-Instituts für Pflanzenbiochemie (IPB) nun „Kmasker plants“ entwickelt – ein Programm, welches durch die Identifizierung repetitiver Sequenzen die Analyse von Pflanzengenomen vereinfacht.
In der Bioinformatik wird der Begriff k-mer verwendet, um eine Nukleotidsequenz
einer bestimmten Länge „k“ zu beschreiben. Indem sie solche Sequenzen festlegen
und zählen, können Forscher sich wiederholende, also repetitive, Sequenzen in dem
Genom, welches sie gerade untersuchen, quantifizieren und entsprechenden
Positionen zuordnen. Bereits 2014 benutzten Wissenschaftler des IPK in
Gatersleben diesen Ansatz, um das in-silico (Computer-basierte) Werkzeug „Kmasker“ zu entwicklen. Es diente der Erkennung von Wiederholungen bei der
Charakterisierung des Genoms der Gerste (Schmutzer et al., 2014).
Zusammenfassung:
- Die korrekte Charakterisierung von Pflanzengenomen kann durch große
Mengen repetetitiver Sequenzen erschwert werden.
- Forscher haben ein Bioinformatik-Tool für die automatische Erkennung repetitiver Genomabschnitte entwickelt, welches auf der Identifizierung von k-
meren (Nukleotidsequenzen einer vorbestimmten Länge) aufbaut.
- Das Werkzeug wurde unter dem Namen „Kmasker plants“ im The Plant
Journal veröffentlicht.
- „Kmasker plants“ steht als Webservice zur Verfügung oder kann installiert
werden via: https://github.com/tschmutzer/kmasker.
Die Verwendung von NGS gewinnt immer weiter an Bedeutung, dennoch ist die fehlerfreie Zusammensetzung der komplexen Genome aus NGS Ergebnissen noch
immer eine Herausforderung. Aus diesem Grund beschlossen die Wissenschaftler
vor Kurzem, ihrer Machbarkeitsstudie neues Leben einzuhauchen und ihr Projekt zu
erweitern. Angeleitet von Dr. Thomas Schmutzer, ehemals Mitglied der
Arbeitsgruppe „Bioinformatik und Informationstechnologie“ des IPK, heute tätig am
Institut für Agrarwissenschaften der MLU, arbeiteten Forscher der Universität in Halle, des IPK in Gatersleben, des IPB in Halle sowie von Wageningen University &
Research gemeinsam an der Neukonzeptionierung und Entwicklung von „Kmasker
plants“. Die Zusammenarbeit wurde von den zwei Servicezentren „GCBN“ und „CiBi“
des Deutschen Netzwerks für Bioinformatik-Infrastruktur “de.NBI” unterstützt.
„Kmasker plants“ ermöglicht die schnelle und referenzfreie Analyse von
Nukleotidsequenzen, basierend auf genomweit abgeleiteten k-meren. In Erweiterung der vorherigen Version können nun auch Vergleichsstudien zwischen
verschiedenen Kultursorten oder nah verwandten Arten gemacht werden. Weiterhin
ermöglicht das Tool die Identifizierung von geeigneten Sequenzen für die
Fluoreszenz-in-situ-Hybridisierung (FISH) sowie von sogenannten „guide RNAs“ für
die CRISPR/Cas9-basierte gezielte Veränderung von Genen. Zudem wurde
„Kmasker plants“ als Webservice veröffentlicht, welcher vorberechnete Indizes für
Gerste, Weizen und andere ausgewählte bedeutsame Nutzpflanzen beinhaltet. Dr. Schmutzer betont, „dass dieses Werkzeug es Pflanzenforschern auf der ganzen
Welt ermöglichen wird, Pflanzengenome zu testen und so, beispielsweise,
interessante Repeat-freie Sequenzen zu identifizieren.“ Außerdem sei es dank der
erweiterten Features möglich, Sequenzkandidatenregionen zu finden, die sich im
Genom einer Art vervielfacht haben, aber in anderen Arten fehlen oder in kleineren
Kopienanzahlen vorkommen. Dies ist ein häufig auftretender Effekt, welcher zur
Entstehung landwirtschaftlich wichtiger phänotypischer Variationen verschiedener
Kulturarten führt. Ein bedeutsames Beispiel ist das Vrn-H2 Gen, das in Wintergerste in einer einzigen Kopie vorhanden ist, während es in Sommergerste fehlt.
Der „Kmasker plants“ Webservice steht als Teil der IPK Crop Analysis Tool Suite
(CATS) und somit als Service der de.NBI Service Plattform zur Verfügung. Alternativ
kann auf den Quellcode via GitHub direkt zugegriffen und „Kmasker plants“ installiert
werden.
Original publication: Beier et al. (2019), Kmasker plants - a tool for assessing
complex sequence space in plant species. The Plant Journal.
DOI: 10.1111/tpj.14645
Abbildung zur freien Verwendung:
Was kurze Sequenzstücke (k-mer) verraten. Anwendungen und Methoden des bioinformatischen Tools „Kmasker plants“ zur Analyse von Sequenzdaten. (Abbildung: Chris Ulpinnis / IPB Halle & Pixabay). Wissenschaftliche Kontakte Dr. Sebastian Beier Leibniz Institute of Plant Genetics and Crop Plant Research (IPK) Tel.: +49 39482 5659 E-mail: [email protected] Dr. Thomas Schmutzer Martin-Luther-Universität Halle-Wittenberg (MLU) Tel.: +49 345 55-22692 E-Mail: [email protected]
Allgemeiner Kontakt Managing Office I Public Relations Leibniz Institute of Plant Genetics and Crop Plant Research (IPK) Tel. +49 39482 5424 E-Mail: [email protected]