02.12.2021 - Max-Planck-Institut für molekulare Genetik

Betriebsanweisung für die Genregulation

Wie viel gewebespezifische Information ist in Enhancer-Sequenzen enthalten?

Woher wissen Zellen, wann sie welches Gen aktivieren müssen? Diese Information muss in der Sequenz der DNA verschlüsselt sein – wie genau, ist immer noch unklar. Forschende haben nun ausgelotet, welche Informationen aus Sequenzdaten extrahiert werden können, um vorherzusagen, welches Gen in welchem Gewebe aktiv ist. 

Ein guter Erzähler weiß genau, mit welchen Anekdoten die Figuren seiner Geschichte zum Leben erwachen. Indem es die richtige Story zur richtigen Zeit erzählt, schafft es unser Genom schafft sogar, für jede Zelle unseres Körpers einen individuellen Lebensweg zu zeichnen. So entstehen hunderte verschiedene Zelltypen mit typischen Lebensgeschichten.

Der Code, der dieses Drehbuch des Lebens steuert und dafür Gene nacheinander an- und abschaltet, ist über das gesamte Erbgut verstreut. Insbesondere DNA-Abschnitte namens „Enhancer“ (engl. für „Verstärker“) spielen in diesem Prozess eine herausragende Rolle. Sie ziehen Transkriptionsfaktor-Proteine an, die Gene anschalten und deren Aktivität also in gewisser Weise „verstärken“. Nicht selten sind diese Erbgutabschnitte weit von dem Gen entfernt, das sie aktivieren.

Die Forscher Philipp Benner und Martin Vingron vom Max-Planck-Institut für molekulare Genetik (MPIMG) wollten herausfinden, wann und wie stark Gene in verschiedenen Zelltypen und embryonalen Geweben der Maus aktiviert werden.

Mit einer Reihe von statistischen und bioinformatischen Methoden identifizierten die Wissenschaftler mehrere hundert gewebespezifische DNA-Teilsequenzen oder „Codewörter“ in Enhancern, die Transkriptionsfaktoren steuern. Damit bestätigten sie nicht nur bereits aus anderen Studien bekannte Sequenzen, sondern identifizierten auch viele neue. Die Ergebnisse wurden in mehreren Artikeln in den Fachzeitschriften NAR Genomics and Bioinformatics und Journal of Computational Biology veröffentlicht.

Eine theoretische Modellrechnung

„Momentan geht man davon aus, dass alle Informationen in der DNA-Sequenz enthalten sind, einschließlich der Informationen für bestimmte Zelltypen, Gewebe und Organe“, sagt Martin Vingron, Direktor am MPIMG. Gemäß der vorherrschenden Theorie erkennen die Transkriptionsfaktoren bestimmte „Codewörter“ in den Enhancern-Sequenzen, die für einen bestimmten Zelltyp charakteristisch sind. Das ermöglicht es dem Genom zu den richtigen Kapiteln zu springen, um die Lebensgeschichte der Zelle weiter zu spinnen. „Wir wollten sehen, wie weit wir mit diesem Denkansatz kommen und seine Grenzen ausloten“, sagt Vingron.

Die Forscher entwickelten ein Programm, das diese gewebespezifischen Codewörter in Sequenzdaten anhand statistischer Merkmale erkennt. Dafür fütterten sie das Programm zunächst mit vorhandenen Sequenzierungsdaten von acht unterschiedlichen Geweben der embryonalen Maus, wie zum Beispiel Herz, Lunge, Gehirn oder Leber. So lernte das Programm, welcher Enhancer in welchem Gewebe aktiv ist.

Aus Daten werden Vorhersagen

Durch den Vergleich der Daten verschiedener Gewebe lernte das Programm dann die Sequenzmuster in Enhancern zu erkennen, die für bestimmte Gewebe charakteristisch sind.

Dies verriet den Forschern, welche zelltypspezifische regulatorische Information tatsächlich in der DNA-Sequenz von Enhancern enthalten ist, erklärt Philipp Benner, Postdoktorand in Vingrons Labor: „Je besser unser Algorithmus einen bestimmten Enhancer klassifizieren kann, desto mehr Informationen enthält dieser auch über die Gewebe- oder Zelltypen, für die er verantwortlich ist.“

Die statistischen Klassifikatoren des Programms spucken sodann auch die DNA-Teilsequenzen aus, die der zelltypspezifischen Genaktivierung zugrunde liegen. Tatsächlich fand Benner neben zahlreichen bereits bekannten mehrere hundert neue dieser „Codewörter“.

„Insgesamt haben wir ein leistungsfähiges Modell entwickelt, dessen Ergebnisse sich leicht interpretieren lassen, was ein großer Vorteil ist“, sagt Benner.

Die Grenze ist fast erreicht

„Mit unseren ausgeklügelten Methoden gelingen uns vielversprechende Vorhersagen, die aber bei weitem nicht perfekt sind“, sagt Vingron. „Alles deutet darauf hin, dass wir den zelltypspezifischen Regulationscode noch immer nur unvollständig verstehen.“

Eine mögliche Erklärung: In Wirklichkeit sind nicht alle benötigten Informationen in der DNA-Sequenz von Enhancern enthalten, sondern an anderen Stellen im Genom verteilt. Einige Querverweise im Geschichtenbuch des Genoms könnten sich sogar in anderen regulatorischen Sequenzen verstecken, wie etwa in Promotorregionen, die sich in unmittelbarer Nähe zum eigentlichen Gen befinden.

Fakten, Hintergründe, Dossiers

  • Genregulation
  • Gene
  • Transkriptionsfaktoren

Mehr über MPI für molekulare Genetik

  • News

    Durchbruch in der Zellkulturtechnik: Mini-Gehirne für die Forschung der Zukunft

    „Outer Radial Glia“ (oRG)-Zellen sind Stammzellen des Nervensystems und für die Entwicklung der menschlichen Großhirnrinde von entscheidender Bedeutung. Im Labor sind sie bisher nur äußerst schwer zu kultivieren. Nun ist es einem Team von Max-Planck-Forschenden aus Berlin gelungen, Gehirnor ... mehr

    Die Stummschaltung im Genom aufheben

    Erblich bedingte Krankheiten, aber auch Krebs und Herz-Kreislauf-Erkrankungen könnten mit einem Phänomen in Zusammenhang stehen, das in der Wissenschaft als genomische Prägung bezeichnet wird. Dabei ist entweder nur das mütterlich vererbte oder das väterlich vererbte Gen aktiv. Ein Forschun ... mehr

    Enzym schaltet virusähnliche Sequenzen stumm

    Oft lässt sich die Biologie nicht eindeutig kategorisieren. Auch ein Enzym, dem Forschende bisher eine klare Aufgabe zugedacht hatten, wächst mit einer neuen Publikation über sich hinaus. Es erhält nicht nur den epigenetischen Zustand des Genoms aufrecht, sondern kann virusartige Erbgutabsc ... mehr

Mehr über Max-Planck-Gesellschaft

  • News

    Zurück in die Zukunft der Photosynthese

    Das zentrale Enzym der Photosynthese, Rubisco, ist das häufigste der Erde. Aber wie entwickelte sich Rubisco, und wie passte es sich den Veränderungen im Laufe der Erdgeschichte an? Durch Rekonstruktion von Milliarden Jahre alten Enzymen gelang es Forschern des Max-Planck-Instituts für terr ... mehr

    Lichtkraft im Mini-Reaktor

    Synthetische – also künstlich hergestellte Zellen – können bestimmte Funktionen biologischer Zellen nachahmen. Diese könnten in Zukunft neue medizinische Möglichkeiten erlauben. Im Labor können solche Zellen als „Mini-Reaktoren“ bereits heute bei chemischen Prozessen helfen, die auf einem M ... mehr

    Junge Gene passen sich schneller an als Alte

    Eine neue Studie des Max-Planck-Instituts für Evolutionsbiologie in Plön und der University of Sussex in Großbritannien zeigt, dass das Alter eines Gens bestimmt, wie schnell es sich anpasst. Diese Erkenntnisse demonstrieren, wie die Evolution der Gene als "adaptiver Spaziergang" durch die ... mehr

q&more – die Networking-Plattform für exzellente Qualität in Labor und Prozess

q&more verfolgt den Anspruch, aktuelle Forschung und innovative Lösungen sichtbar zu machen und den Wissensaustausch zu unterstützen. Im Fokus des breiten Themenspektrums stehen höchste Qualitätsansprüche in einem hochinnovativen Branchenumfeld. Als moderne Wissensplattform bietet q&more den Akteuren im Markt einzigartige Networking-Möglichkeiten. International renommierte Autoren repräsentieren den aktuellen Wissenstand. Die Originalbeiträge werden attraktiv in einem anspruchsvollen Umfeld präsentiert und deutsch und englisch publiziert. Die Inhalte zeigen neue Konzepte und unkonventionelle Lösungsansätze auf.

> mehr zu q&more

q&more wird unterstützt von: