q&more
Meine Merkliste
my.chemie.de  
Login  

News

Neue Software verarbeitet riesige Mengen an Einzelzelldaten

Umfängliche Analyse großer Genexpressionsdatensätze

Helmholtz Zentrum München

Visualisierung von Genexpressionsmustern muriner Gehirnzellen mit Scanpy.

13.02.2018: Wissenschaftler des Helmholtz Zentrums München haben ein neues Programm entwickelt, das große Datensätze beherrschbar machen soll. Die Software mit dem Namen Scanpy ist beispielsweise ein Kandidat für die Auswertung des Human Cell Atlas Projekts.

„Es geht um die Analyse von Genexpressionsdaten zahlreicher einzelner Zellen“, erklärt Erstautor Alex Wolf vom Institute of Computational Biology (ICB) des Helmholtz Zentrums München. Er hat Scanpy entwickelt, gemeinsam mit seinem Kollegen Philipp Angerer in der Machine Learning Gruppe von Institutsdirektor Prof. Dr. Dr. Fabian Theis, der neben seiner Position am Helmholtz Zentrum auch Professor für Mathematische Modelle biologischer Systeme an der TU München ist. „Die neue technische Möglichkeiten generieren um Größenordnungen mehr Daten mit dementsprechend höherer Information“, schildert Theis. „Allerdings war die historisch gewachsene Software-Infrastruktur zur Genexpressionsanalyse nicht auf die neuen Herausforderungen ausgelegt.“ Entsprechend groß sei hier der Bedarf nach neuen Analysemethoden.

Im Rennen für den Human Cell Atlas

Auch ein großes internationales Forschungsvorhaben könnte Theis zufolge von der Software profitieren. Unter dem Namen ‚Human Cell Atlas‘ tragen zahlreiche internationale Wissenschaftler eine Referenzdatenbank zusammen, in der die Genaktivität aller menschlichen Zelltypen erfasst ist. „Für dieses Projekt oder auch bei der immer häufiger werdenden Zusammenlegung von bestehenden Datensätzen ist es wichtig, eine skalierbare Software zu haben“, so Theis. Entsprechend sei Scanpy aktuell in der Auswahl für die Analysesoftware des Human Cell Atlas.

„Mit Scanpy publizieren wir die erste Software, die eine umfängliche Analyse großer Genexpressionsdatensätze mit einem breiten Spektrum aus Methoden des maschinellen Lernens und Statistik erlaubt“, beschreibt Alex Wolf den Fortschritt. „Bereits jetzt wird die Software in diversen Gruppen weltweit eingesetzt, insbesondere auch am Broad Institute von Harvard und dem Massachusetts Institute of Technology.“

Technologisch beschreitet die Anwendung neue Wege: Während entsprechende Biostatistik-Software traditionell in der Programmiersprache R geschrieben wurde, basiert Scanpy auf der Sprache Python, die die Machine Learning Community dominiert. Neu ist zudem, dass Graph-basierte Algorithmen das Herz von Scanpy bilden. Anstatt Zellen wie bisher üblich als Punkte im Koordinatensystem des Genexpressionsraums zu betrachten, verwenden die Algorithmen ein graphartiges Koordinatensystem. Das heißt, anstatt eine Zelle mit dem Expressionswert einiger Tausend Gene zu charakterisieren, wird sie einfach durch die Angabe ihrer nächsten Nachbarn charakterisiert – vergleichbar mit Verbindungen in sozialen Netzwerken. Wenn es zum Beispiel um die Identifikation von Zelltypen geht, verwendet Scanpy also die gleichen Algorithmen wie Facebook zur Identifikation von Communities.

Originalveröffentlichung:
Wolf, A. et al.; "Scanpy: large-scale single-cell gene expression data analysis"; Genome Biology; 2018

Fakten, Hintergründe, Dossiers

  • Datenanalyse
  • Genexpressionsanalyse
  • Analysesoftware
  • Biostatistik

Mehr über Helmholtz Zentrum München

  • News

    Wie ein Enzym die Abschrift unserer Gene reguliert

    Ein Wissenschaftlerteam des Helmholtz Zentrums München hat gemeinsamen mit Kollegen der Ludwig-Maximilians-Universität München und einer Forschergruppe der Universität Montpellier, Frankreich, die Strukturen der RNA Polymerase II identifiziert, die für die Termination der Transkription (das ... mehr

    Selen schützt Nervenzellen im Gehirn

    200 Jahre nach der Entdeckung des Spurenelements Selen zeigen Forschende am Helmholtz Zentrum München zum ersten Mal, warum dieses chemische Element essenziell für das Überleben von Säugetieren ist. Als Bestandteil des Enzyms GPX4 schützt Selen bestimmte Nervenzellen im Laufe der Entwicklun ... mehr

    Warum manche Zellen alles können

    Eine neue Studie beschreibt eine Gruppe von embryonalen Stammzellen, die sich zu totipotenten Alleskönnern umprogrammieren lassen. Die Autoren vom Münchner Helmholtz Zentrum und der Ludwig-Maximilians-Universität (LMU) konnten zudem den Mechanismus aufklären, wie es dazu kommt. Der Begriff ... mehr

  • q&more Artikel

    Herausforderung

    In nahezu allen Bereichen der Umwelt­analytik, aber auch in der Produktqualitätskontrolle, Life-Sciences, biomedizinischen oder pharmazeutischen Forschung hat sich in der Vergangenheit die Zahl der Analysen ständig erhöht. Analytische Untersuchungen dienen dem Schutz der Gesundheit von Mens ... mehr

  • Autoren

    Prof. Dr. Bernhard Michalke

    Bernhard Michalke ist Leiter der Forschungsgruppe „Element- und Elementspeziesanalytik“ und der „Zentralen Anorganischen Analytik“ am Helmholtz Zentrum München – Deutsches Forschungszentrum für Gesundheit und Umwelt. Prof. Michalke studierte Biologie an der Technischen Universität München u ... mehr

q&more – die Networking-Platform für exzellente Qualität in Labor und Prozess

q&more verfolgt den Anspruch, aktuelle Forschung und innovative Lösungen sichtbar zu machen und den Wissensaustausch zu unterstützen. Im Fokus des breiten Themenspektrums stehen höchste Qualitätsansprüche in einem hochinnovativen Branchenumfeld. Als moderne Wissensplattform bietet q&more den Akteuren im Markt einzigartige Networking-Möglichkeiten. International renommierte Autoren repräsentieren den aktuellen Wissenstand. Die Originalbeiträge werden attraktiv in einem anspruchsvollen Umfeld präsentiert und deutsch und englisch publiziert. Die Inhalte zeigen neue Konzepte und unkonventionelle Lösungsansätze auf.

> mehr zu q&more

q&more wird unterstützt von:



Ihr Bowser ist nicht aktuell. Microsoft Internet Explorer 6.0 unterstützt einige Funktionen auf Chemie.DE nicht.