13.06.2022 - Westfälische Wilhelms-Universität Münster

Mehr Daten in der Chemie

Berichte über negative Ergebnisse würden die Planung von chemischen Synthesen verbessern

Unzählige chemische Experimente sind in Datenbanken zugänglich. Dennoch sind diese Daten nicht gut genug, um mithilfe von künstlicher Intelligenz (KI) und maschinellem Lernen bei neuen Synthesen Produktausbeuten vorherzusagen, hat ein Forschungsteam herausgefunden. Wie das Team in der Zeitschrift Angewandte Chemie berichtet, liegt die schlechte Datenqualität vor allem auch an der Neigung der Wissenschaftler:innen, fehlgeschlagene Experimente nicht zu veröffentlichen.

Bei der Vorhersage von Molekülstrukturen und Materialeigenschaften leisten maschinelle Lernwerkzeuge bereits sehr viel. Geht es aber konkret um die Produktausbeute bei einer Synthese, liefern KI-basierte Modelle nur ungenaue Vorhersagen, stellten Forschende um Frank Glorius von der Westfälischen Wilhelms-Universität Münster fest.

Den Grund für das Scheitern identifizierten die Forschenden in der Qualität der Daten, auf die die KI zurückgreift. „Die Vorhersage von Reaktionsausbeuten, also der Reaktivität, ist viel herausfordernder als die Vorhersage von molekularen Eigenschaften. Ausgangsstoffe, Hilfsstoffe, Mengen, Bedingungen, Ausführung des Experiments – sie alle bestimmen die Ausbeute, was bedeutet, dass dieses Problem sehr datenintensiv wird,“ erklärt Frank Glorius, Korrespondenzautor der Studie. Trotz der riesigen Menge an verfügbarer Literatur reichten die Daten also nicht aus, um Ausbeuten korrekt vorherzusagen.

Das Problem liege dabei häufig nicht an zu wenig berichteten Experimenten, sondern an einer Datenschieflage. Drei mögliche Ursachen identifizierten die Forschenden: Zum einen unterliegen die Ergebnisse von chemischen Synthesen grundsätzlich experimentellen Fehlern. Zweitens treffen Wissenschaftler:innen bei ihrer Reaktionsplanung mehr oder weniger bewusst eine Vorauswahl, die auf persönlicher Erfahrung und Vertrauen in etablierte Verfahren beruht. Und drittens melden sie fehlgeschlagene Reaktionen weniger häufig als erfolgreiche – vermeintlich führen nur Reaktionen mit einem positiven Ergebnis zu einem wissenschaftlichen Fortschritt.

Um herauszufinden, welcher der drei Faktoren den größten Einfluss hat, veränderten Glorius und sein Team den Datensatz für vier gängige (und daher datenreiche) organische Reaktionen. So erhöhten sie künstlich den experimentellen Fehler, reduzierten die Daten auf eine noch kleinere Vorauswahl, oder sie nahmen aus dem Datensatz negative Ergebnisse heraus. Am wenigsten Einfluss auf das Modell hatte der experimentelle Fehler, sehr groß war dagegen der Einfluss der negativen Ergebnisse, heißt es in der Studie.

Wissenschaftler:innen sollten also unbedingt ermutigt werden, fehlgeschlagene Ergebnisse ebenfalls zu berichten, schreibt das Team. Damit verbessere sich die Datenlage, und KI-basierte maschinelle Lernmodelle können die Arbeit beschleunigen und effizienter machen. „Maschinelles Lernen wird die Effizienz in der (molekularen) Chemie dramatisch verbessern. Chemiker:innen kommen mit weniger Reaktionen aus, um ein bestimmtes Ziel zu erreichen wie zum Beispiel optimale Ausbeuten. Dadurch werden chemische Prozesse – und die Welt – nachhaltiger,“ bekräftigt Glorius.

Fakten, Hintergründe, Dossiers

Mehr über WWU Münster

  • News

    Forscher zeigen: Chirale Oxid-Katalysatoren richten Elektronenspin aus

    Die Kontrolle des Eigendrehimpulses (Spins) von Elektronen eröffnet künftige Anwendungsszenarien in der spinbasierten Elektronik (Spintronik), beispielsweise zur Informationsverarbeitung. Außerdem bietet sie neue Möglichkeiten, die Selektivität und Effizienz von chemischen Reaktionen zu kon ... mehr

    Auf dem Weg zu zellartigen Materialien

    Molekulare Maschinen steuern eine Vielzahl grundlegender Prozesse in der Natur. Eingebettet in eine zelluläre Umgebung, spielen sie eine zentrale Rolle beim intra- und interzellulären Transport von Molekülen sowie bei der Muskelkontraktion von Menschen und Tieren. Für die Funktion des gesam ... mehr

    Biochemiker nutzen neues Werkzeug, um mRNA mit Licht zu kontrollieren

    Die DNA (Desoxyribonukleinsäure) ist ein langes Kettenmolekül, das sich aus vielen einzelnen Bausteinen zusammensetzt und die Grundlage des Lebens auf der Erde bildet. Die Funktion der DNA ist die Speicherung aller Erbinformationen. Die Umsetzung dieser genetischen Informationen in Proteine ... mehr

  • q&more Artikel

    Löwenzahn als neue Rohstoffquelle für Naturkautschuk

    Mehr als 12.500 Pflanzen produzieren Latex, einen farblosen bis weißen Milchsaft, der unter anderem Naturkautschuk enthält. mehr

  • Autoren

    Prof. Dr. Dirk Prüfer

    Dirk Prüfer, Jahrgang 1963, studierte Biologie an der Universität zu Köln und promovierte am Max-Planck-Institut für Pflanzenzüchtung. Seine Habilitation legte er im Jahr 2004 an der Justus-Liebig-Universität Gießen ab. Seit 2004 ist er Professor für molekulare Pflanzenbiotechnologie am Ins ... mehr

    Prof. Dr. Joachim Jose

    Joachim Jose, geb. 1961, studierte Biologie an der Universität Saarbrücken, wo er promovierte. Die Habilitation erfolgte am Institut für Pharma­zeutische und Medizinische Chemie der Universität des Saarlandes. Von 2004 bis 2011 war Professor für Bioanalytik (C3) an der Heinrich-Heine-Univer ... mehr

Mehr über Angewandte Chemie

q&more – die Networking-Plattform für exzellente Qualität in Labor und Prozess

q&more verfolgt den Anspruch, aktuelle Forschung und innovative Lösungen sichtbar zu machen und den Wissensaustausch zu unterstützen. Im Fokus des breiten Themenspektrums stehen höchste Qualitätsansprüche in einem hochinnovativen Branchenumfeld. Als moderne Wissensplattform bietet q&more den Akteuren im Markt einzigartige Networking-Möglichkeiten. International renommierte Autoren repräsentieren den aktuellen Wissenstand. Die Originalbeiträge werden attraktiv in einem anspruchsvollen Umfeld präsentiert und deutsch und englisch publiziert. Die Inhalte zeigen neue Konzepte und unkonventionelle Lösungsansätze auf.

> mehr zu q&more

q&more wird unterstützt von: