Das “Vertebrate Genomes Project”: eine neue Ära der Genomsequenzierung

16 neue hochqualitative Referenzgenome von Wirbeltieren werden veröffentlicht und bringen die vergleichende Biologie, die Erhaltung von Arten und die medizinische Forschung voran.

Große Hufeisennase (Rhinolophus ferrumequinum) © Daniel Whitby

Das internationale Vertebrate Genomes Project (VGP) veröffentlicht heute in einer Sonderausgabe von Nature seine Flaggschiff-Studie die sich mit der Qualität und Standardisierung von Genomassemblierungen beschäftigt, zusammen mit 20 dazugehörigen Publikationen. In dieser Studie werden 16 diploide, hochqualitative, nahezu fehlerfreie und fast vollständige Referenzgenome von Wirbeltieren beschrieben, die das Ergebnis der fünfjährigen Pilotphase des VGP-Projekts sind. Auf der Grundlage der Genome aller Wirbeltiere besteht nun die Möglichkeit, zu untersuchen, wie Gene zur Evolution und zum Überleben dieser Arten beigetragen haben und damit offene Fragen zu menschlichen Krankheiten beantwortet werden könnten. Der überwiegende Teil der Genomdaten wurde an drei Sequenzierzentren erstellt, darunter das Rockefeller University Vertebrate Genome Lab in New York, USA (teilweise unterstützt durch das Howard Hughes Medical Institute), das Wellcome Sanger Institute in Großbritannien, und das Max-Planck-Institut für molekulare Zellbiologie und Genetik in Dresden.

Entstanden aus der zehn Jahre alten Mission der "Genome 10K Community of Scientists (G10K)", die Genome von 10.000 Wirbeltierarten zu sequenzieren, und anderen vergleichenden Genomforschungsprojekten ist es das Ziel des VGP, nahezu fehlerfreie Referenzgenome von allen 71.000 existierenden Wirbeltierarten zu erstellen. Referenzgenome sind jeweils ein Beispielgenom einer Art und liefern eine Karte der DNA-Sequenz einer Spezies und ihres räumlichen Kontexts, also wo entlang der Chromosomen ein bestimmtes Stück der DNA-Sequenz zu finden ist. Diese Genome sollen helfen, grundlegende Fragen der Biologie, der Biodiversität, und menschlicher Krankheiten zu beantworten. Außerdem sollen die Arten identifiziert und sequenziert werden, die vom Aussterben bedroht sind, und so ihre genetischen Informationen für zukünftige Generationen bewahrt werden. Die hochqualitativen VGP-Genome sollen in Zukunft zu den wichtigsten Referenzquellen für Spezies werden. In einer digitalen Bibliothek für Genome, der „Genom-Arche“, werden diese dann gespeichert und öffentlich zugänglich.

Kosten der Genomsequenzierung
In der Vergangenheit war die Erstellung von Referenzgenomsequenzen teuer und arbeitsintensiv, sodass sie nur für den Menschen und die wichtigsten Modellorganismen erstellt wurden. Diese Genome enthielten immer noch Lücken und Fehler. Für ein vollständiges Verstehen evolutionärer Prozesse und anderer grundlegender Fragen in der Biologie werden jedoch qualitativ hochwertige Referenzgenome benötigt. Adam Phillippy, Vorsitzender der VGP-Genomassemblierungs- und Informatik-Arbeitsgruppe mit über 100 Mitgliedern und Leiter der Genom-Informatik-Abteilung des National Human Genome Research Institute, National Institutes of Health, Bethesda, Maryland, USA, sagt: „Die Fertigstellung des ersten Wirbeltier-Referenzgenoms, des Menschen, dauerte über 10 Jahre und kostete 3 Milliarden Dollar. Dank der fortlaufenden Forschung und der Investitionen in die DNA-Sequenzierungstechnologie in den letzten 20 Jahren können wir diese erstaunliche Leistung jetzt mehrmals täglich für nur wenige tausend Dollar pro Genom wiederholen.“

Beteiligung von Max-Planck-Instituten am VGP
Einer der Standorte für die Sequenzierung ist das Max-Planck-Institut für molekulare Zellbiologie und Genetik (MPI-CBG) in Dresden. Gene Myers, Leiter des VGP-Sequenzier-Hubs am MPI-CBG und am Zentrum für Systembiologie Dresden (CSBD), sagt: „Das VGP-Projekt steht an der Spitze der Erstellung eines Katalogs von Genomen in Analogie zu Linnaeus' Klassifizierung des Lebens. Ich und meine Kollegen in Dresden sind begeistert, dass wir mit der finanziellen Unterstützung der Max-Planck-Gesellschaft Deutschland solche hervorragenden Genom-Rekonstruktionen beisteuern können.“ Die Dresdner Wissenschaftler sind Teil des DRESDEN-concept Genome Center (DcGC) und verfügen über besondere Expertise beim Einsatz verschiedener „long-read“ Sequenzierungstechnologien. Längere Sequenzstücke sind wichtig, da sie komplexe und sich wiederholende Teile im Genom auflösen und überspannen können und damit eindeutige Zuordnungen erlauben. Das Dresdner Hub hat zu drei der 16 veröffentlichten Genome beigetragen: zur Großen Hufeisennase (Rhinolophus ferrumequinum), dem Buntbarsch (Archocentrus centrarchus) und dem Genom der Kleinen Lanzennase (Phyllostomus discolor). Die ersten beiden Genome wurden vollständig vom Dresdner Hub erarbeitet, und für P. discolor wurden die Genomdaten am Rockefeller Hub und die Assemblierung und die transkriptomischen Daten in Dresden erstellt.

Die Gewebeproben der Fledermäuse wurden von Mitgliedern des Bat1K-Konsortiums unter der Leitung von Sonja Vernes vom Max-Planck-Institut für Psycholinguistik in den Niederlanden und der University of St Andrews, UK, und Emma Teeling vom University College Dublin zur Verfügung gestellt. Das Bat1K-Konsortium hat sich zum Ziel gesetzt, alle lebenden Fledermausarten zu sequenzieren und war maßgeblich an der Sequenzierung und Analyse von Fledermausgenomen in Zusammenarbeit und als Partner des Gesamtprojekts VGP beteiligt. Die Gewebeproben der Fliegerbuntbarsche stammen von Axel Meyer, Universität Konstanz, Deutschland.

Robert Kraus vom Max-Planck-Instituts für Verhaltensbiologie in Konstanz, Deutschland,
trug schon früh dazu bei, Ideen und Visionen für die Mission des VGP zu entwickeln und setzte den Fokus dabei auf weniger Genome, aber höhere Qualität für jedes Genom. Robert Kraus sequenzierte auch mehrere Vogelarten, um die Ursachen für die Immunantwort der Vogelgrippe zu untersuchen. Diese Genome sind noch im Hintergrund des VGP und werden Teil der nächsten Veröffentlichungen sein.

Sequenzierte Spezies
Die exzellente Qualität dieser Genome ermöglicht neue Erkenntnisse in noch nie dagewesenem Ausmaß für die Charakterisierung der Artenvielfalt für alles Leben, den Artenerhalt und die menschliche Gesundheit. Die ersten hochqualitativen Referenzgenome von sechs Fledermausarten, die im Bat 1K-Konsortium erstellt und im Juli 2020 in Nature veröffentlicht wurden, zeigten die Auslese und den Verlust von Genen im Zusammenhang mit dem Immunsystem, die möglicherweise die besondere Toleranz von Fledermäusen gegenüber Virusinfektionen erklären könnten. Damit könnte auch die erhöhte Überlebensfähigkeit erklärt werden, die insbesondere für neu auftretende Infektionskrankheiten wie die aktuelle COVID-19-Pandemie von Bedeutung sind.

Sonja Vernes, eine Gründungsdirektorin des Bat1K-Konsortiums und UKRI Future Leaders Fellow, sagte: „Diese neuen Genome sind ein großer Schritt zur Beantwortung wichtiger Fragen zur Biologie und Evolution bei Wirbeltieren. Wir können bereits jetzt spannende neue Merkmale der Evolution von Chromosomen erkennen, einschließlich der Veränderungen, die in den sechs vom Bat1K-Konsortium bereitgestellten Fledermausarten gefunden wurden und die möglicherweise zu einem verbesserten Immunsystem und einer Toleranz gegenüber Krankheitserregern beitragen. In Zukunft werden uns diese Genome auch helfen, komplexe Verhaltensweisen zu verstehen, wie die Evolution der tierischen Kommunikation und wie sich die menschliche Sprache entwickelt hat.“

Analysen der VGP-Genome des Kakapo, eines flugunfähigen Papageis, der in Neuseeland endemisch ist, und des Vaquita, eines kleinen Schweinswals und des am stärksten gefährdeten Meeressäugers im Golf von Mexiko, deuten auf evolutionäre und demografische Entwicklungen hin, bei denen schädliche Mutationen in freier Wildbahn beseitigt wurden.
 
Eine neue Ära in der Genomforschung durch Kooperationen
Dieses umfangreiche vergleichende Genomprojekt stellt eine neue Ära in der Genomforschung dar, indem es neuartige Pipelines für hochmoderne und konsistente Sequenzierungs-, Assemblierungs- und Annotationstechniken entwickelt und einsetzt. Diese können helfen, grundlegende Fragen der vergleichenden Biologie, Genetik, Biodiversität, Artenerhaltung und Gesundheit in Zukunft zu beantworten. Das Projekt dient auch als Modell für wissenschaftlichen Kooperationen, vor allem für weitere groß angelegte Genomprojekte. Beispielhaft sind die umfangreiche Infrastruktur sowie die erfolgreiche Zusammenarbeit von Hunderten internationalen Wissenschaftlern aus mehr als 50 Institutionen in 12 verschiedenen Ländern, seit das VGP im Jahr 2016 initiiert wurde.

Im nächsten Schritt wird das VGP die weltweite Zusammenarbeit mit anderen Konsortien fortsetzen, um Phase 1 des Projekts abzuschließen, dessen Ziel die Sequenzierung jeweils einer repräsentativen Art aus den 260 Ordnungen der Wirbeltiere ist. Technologische Fortschritte, verbesserte Berechnungsmethoden und die ständig sinkenden Sequenzierungskosten ermöglichen es dem VGP, das ehrgeizige Ziel zu verfolgen, ein Referenzgenom für jede existierende Wirbeltierart der Erde zu erstellen. In der ersten Phase des Projekts konzentriert sich das VGP auf Verbesserung von Genomsequenzierungs- und Assemblierungsansätzen sowie Erstellung von 260 hochwertigen Genomen von Arten, die alle Wirbeltierordnungen repräsentieren. Das VGP wird weiterhin weltweit aktiv sein und mit anderen Konsortien zusammenarbeiten, um Phase 1 des Projekts abzuschließen. Phase 2 wird repräsentativen Arten aus jeder Wirbeltierfamilie beinhalten. Zurzeit werden die zu sequenzierenden Tierarten identifiziert und Mittel zur Finanzierung beschafft. Das VGP hat eine Politik der offenen Tür und heißt weitere Kollaborationspartner willkommen, sich diesem Projekt anzuschließen, angefangen von der Mittelbeschaffung über die Probensammlung bis hin zur Erstellung von Genomassemblierungen oder man kann seine eigenen Genomassemblierungen einbringen, die die VGP-Metriken als Teil der Gesamtmission erfüllen.  

Alle Sequenzdaten und Referenzgenome werden frei in der GenomeArk sichtbar und verfügbar sein.   
(https://vgp.github.io/genomeark/), Genbank (https://www.ncbi.nlm.nih.gov/bioproject/489243), Ensembl (https://projects.ensembl.org/vgp/), and UCSC (https://hgdownload.soe.ucsc.edu/hubs/VGP/).


Das G10 Konsortium. Foto: Matthew Septimus

 

Vollständige Liste der 16 Genome:
Kleine Lanzennase (Phyllostomus discolor)
Große Hufeisennase (Rhinolophus ferrumequinum)
Kanadischer Luchs (Lynx canadensis)
Schnabeltier (Ornithorhynchus anatinus)
Zebrafink (Taeniopygia guttata)
Kakapo (Strigops habroptilus)
Annakolibri (Calypte anna)
Goode's thornscrub Schildkröte (Gopherus evgoodei)
Zweizeilige Caecilians (Rhinatrema bivittatum)
Riesen-Stachelaal (Mastacembelus armatus)
Kletterfisch (Anabas testudineus)
Flier Cichlid (Buntbarch) (Archocentrus centrarchus)
Astatotilapia (Buntbarsch) (Astatotilapia calliptera)
Channel bull blenny (Cottoperca gobio)
Stumpfschnäuziger Schildbauch (Gouania willdenowi)
Sternrochen (Amblyraja radiata)

Kontakt für Journalisten:
Prof. Gene Myers
Email: myers@mpi-cbg.de

Katrin Boes
Pressesprecherin MPI-CBG
Email: kboes@mpi-cbg.de
Telefon: +49 351 210 2080

-----------

Über das MPI-CBG
Das Max-Planck-Institut für molekulare Zellbiologie und Genetik (MPI-CBG) in Dresden ist eines von über 80 Instituten der Max-Planck-Gesellschaft, einer unabhängigen gemeinnützigen Organisation in Deutschland. 550 Menschen aus 50 Ländern aus den verschiedensten Disziplinen arbeiten am MPI-CBG und lassen sich von ihrem Forscherdrang antreiben, um die Frage zu klären: Wie organisieren sich Zellen zu Geweben?
www.mpi-cbg.de, Twitter: @mpicbg

Über die Rockefeller University
Die Rockefeller University ist eine der weltweit führenden biomedizinischen Forschungsuniversitäten und widmet sich der Durchführung innovativer, qualitativ hochwertiger Forschung, um das Verständnis des Lebens zum Wohle der Menschheit zu verbessern. Die 70 Laboratorien der Universität forschen in den Bereichen Neurowissenschaften, Immunologie, Biochemie, Genomik und vielen anderen Gebieten. Auf unserem 16 Hektar großen Campus in Manhattan arbeiten 2.000 Dozenten, Studenten, Postdocs, Techniker, Kliniker und Verwaltungspersonal. Unser einzigartiger Ansatz in der Wissenschaft hat zu einigen der weltweit revolutionärsten und transformativsten Beiträge zur Biologie und Medizin geführt. In der 120-jährigen Geschichte von Rockefeller wurden unsere Wissenschaftler mit 26 Nobelpreisen, 24 Albert Lasker Medical Research Awards und 20 National Medals of Science ausgezeichnet.

Wellcome Sanger Institute
Das Wellcome Sanger Institute ist ein weltweit führendes Forschungszentrum für Genomik. Wir führen groß angelegte Forschungsarbeiten durch, die die Grundlagen des Wissens in Biologie und Medizin bilden. Wir sind offen und kooperativ; unsere Daten, Ergebnisse, Werkzeuge und Technologien werden weltweit geteilt, um die Wissenschaft voranzubringen. Unser Ehrgeiz ist groß - wir nehmen Projekte in Angriff, die sonst nirgendwo möglich sind. Wir nutzen die Möglichkeiten der Genomsequenzierung, um die Informationen in der DNA zu verstehen und nutzbar zu machen. Finanziert von Wellcome haben wir die Freiheit und Unterstützung, die Grenzen der Genomik zu erweitern. Unsere Erkenntnisse werden zur Verbesserung der Gesundheit und zum Verständnis des Lebens auf der Erde eingesetzt.

Über das DRESDEN-concept Genome Center (DcGC)
Das DcGC ist ein gemeinsames Sequenzierzentrum der Technischen Universität Dresden und dem MPI-CBG. Es ist eines von vier DFG-geförderten Kompetenzzentren für Next Generation Sequencing in Deutschland. Das Kooperationsprojekt vereint Next Generation Sequencing- und Genomik-Experten der TU Dresden und des MPI-CBG, sowie des Zentrums für Systembiologie Dresden (CSBD) und des Zentrums für Regenerative Therapien Dresden (CRTD) der TU Dresden. Das Zentrum besteht aus drei Plattformen mit den Schwerpunkten Long-Read-Sequenzierungstechnologien, Einzelzell- und Short-Read-Sequenzierungen und deckt die wichtigsten Next-Generation-Sequenziergeräte nach dem neuesten Stand der Technik ab. Die Long-Read-Plattform betreibt mehrere PacBio SEQUEL-Systeme, einen Oxford Nanopore PromethION-Sequenzer, ein Saphyr „optical mapping“ Gerät von Bionano Genomics und bietet verschiedene Chromatin Confirmation Capture-Protokolle an. Wir haben langjährige Erfahrung in der Generierung und Assemblierung von Genomen höchster Qualität aus komplexen Organismen. Wir arbeiten routinemäßig mit Wissenschaftlern und Experten zusammen, um aus anspruchsvollen Proben die besten Genomdaten zu gewinnen. Unsere Bioinformatik- und Computerexperten arbeiten an Assemblierungen aller Arten von Genomen, die auch sehr große und komplexe Genome umfassen, die über den normalen Maßstab hinausgehen. Wenn Sie mehr über das DcGC erfahren möchten, besuchen Sie uns bitte unter genomecenter.tu-dresden.de/about-us und folgen Sie uns auf Twitter unter @DcGenomeCenter.

Vertebrate Genome Laboratory der Rockefeller University
Das Vertebrate Genome Laboratory (VGL) an der Rockefeller University ist auf Long-Read-Genomtechnologien spezialisiert. Das VGL ist einer der drei VGP-Sequenzierknotenpunkte. Es ist mit modernsten genomischen Technologien ausgestattet, darunter mehrere Sequenzer von Pacific Biosciences und Oxford Nanopore, ein optischer Mapper von Bionano Genomics Saphyr und ein Mikrofluidik-Instrument von 10x Genomics Chromium. Das VGL besteht aus einem Team von Experten für Long Reads und ultrahochmolekulare DNA und ist bestrebt, einen Weg zu finden, den Bauplan des Lebens aus beliebigen Proben zu entschlüsseln, selbst aus den schwierigsten. Mit Hilfe modernster Technologien und umfangreicher internationaler Kooperationen widmen wir uns der Aufgabe, die Lücke zwischen Feldwissenschaftlern und Genetikern zu schließen. Wir sind besonders stolz darauf, unseren kleinen Teil dazu beizutragen, das Artensterben aufzuhalten, indem wir die Genome von gefährdeten Arten sequenzieren, bevor es zu spät ist. Erfahren Sie mehr über uns unter vertebrategenomelab.org und folgen Sie uns auf Twitter unter @genomewarriors

Howard Hughes Medical Institute
Das Howard Hughes Medical Institute spielt eine wichtige Rolle bei der Förderung der wissenschaftlichen Forschung und Ausbildung in den Vereinigten Staaten. Seine Wissenschaftler, die im ganzen Land und auf der ganzen Welt tätig sind, haben wichtige Entdeckungen gemacht, die sowohl die menschliche Gesundheit als auch unser grundlegendes Verständnis der Biologie voranbringen. Das Institut möchte auch die naturwissenschaftliche Ausbildung in ein kreatives, interdisziplinäres Vorhaben umwandeln, das die Spannung der echten Forschung widerspiegelt. Der Hauptsitz des HHMI befindet sich in Chevy Chase, Maryland, in der Nähe von Washington, DC.


Originalpublikation

Rhie et al.: Towards complete and error-free genome assemblies of all vertebrate
species. Nature. 28. April 2021 doi: dx.doi.org/10.1038/s41586-021-03451-0