TK: Bitte erklären Sie für Ihren Arbeitsbereich wie Gesundheitsforschung mit Big Data funktioniert?

Prof. Peters: Versteht man Big Data im Sinne von sehr großen Datenmengen, die spezielle Methoden der Datenanalyse erfordern, dann kommen wir damit bei unseren großen Bevölkerungsstudien in Berührung. Zum Beispiel der KORA-Studie, die seit Mitte der 80er Jahre in Augsburg durchgeführt und der NAKO Gesundheitsstudie, für die bis 2019 deutschlandweit 205.000 Probanden rekrutiert wurden, die regelmäßig zu wissenschaftlichen Fragestellungen wie Herzkreislauferkrankungen, Depressionen und neurologische Krankheiten untersucht werden.

Prof. Dr. Annette Peters

Prof. Dr. Annette Peters, Direktorin des Instituts für Epidemiologie am Helmholtz Zentrum München Das Bild ist noch nicht vollständig geladen. Falls Sie dieses Bild drucken möchten, brechen Sie den Prozess ab und warten Sie, bis das Bild komplett geladen ist. Starten Sie dann den Druckprozess erneut.
Direktorin des Instituts für Epidemiologie am Helmholtz Zentrum München 

Daneben hat Big Data aber noch einen zweiten Aspekt, nämlich die Vernetzung von verschiedenen Datentypen aus einer Vielzahl von Quellen. Auch wir vernetzen die Daten, die wir selbst erheben, mit zusätzlichen Informationen, z. B. aus Krebsregistern. Aber hier bewegen wir uns mit unseren Studien in einem genau festgelegten und streng regulierten Rahmen. Unsere Studienteilnehmerinnen und -teilnehmer sind über die Nutzung ihrer Daten umfassend aufgeklärt und haben der Nutzung, und auch explizit der Vernetzung von bestimmten zusätzlichen Informationen, zugestimmt. Sie haben auch jederzeit die Möglichkeit, ihre Zustimmung zu widerrufen.

TK: Über welche Kanäle erhalten Sie Patientendaten?

Prof. Peters: In unseren eigenen Erhebungen nutzen wir neben den klassischen Methoden wie Untersuchungen und Befragungen auch tragbare Messgeräte, beispielsweise zur Messung der körperlichen Aktivität oder der Schadstoffbelastung. Außerdem verknüpfen wir die Wohnadressen mit Informationen aus offiziellen Statistiken zum Wohnumfeld und entwickeln Modelle, um zum Beispiel die Lärm- oder Feinstaubbelastung in Stadtvierteln abzuschätzen. Diese Daten vernetzen wir mit  den Informationen aus unseren Erhebungen.

Ein weiteres Beispiel ist die Vernetzung unserer Studieninformationen mit zusätzlichen Informationen der Studienteilnehmerinnen und -teilnehmer aus den Patientenregistern und den gesetzlichen Kranken- und Rentenversicherungen. Damit können neuauftretende Krankheiten identifiziert sowie die Versorgungssituation und die Konsequenzen für das Arbeitsleben untersucht werden. 

TK: Und was bringt das Zusammenführen dieser Daten ganz konkret?

Prof. Peters: In der Umweltforschung hat dies beispielsweise dazu geführt, dass wir heute eine Diskussion über Luftqualität und Grenzwerte haben. Wenn man einfach nur die Luftqualität gemessen hätte, würde man sagen, natürlich ist die Luft besser als vor 20 Jahren. Aber in Zusammenhang mit den Gesundheitsdaten wird klar: Die Luft muss noch besser werden, weil Herzinfarkte an Tagen mit hoher Schadstoffbelastung oder an Orten mit hoher Schadstoffbelastung häufiger auftreten.

Ein weiteres Bespiel sind bildgebende Verfahren wie die Kernspintomographie, die wir bei unseren Studienteilnehmerinnen und -teilnehmern durchführen und mit ihren anderen Studiendaten verknüpfen. Über die Kernspintomographie können subklinische Vorstufen von Erkrankungen bestimmt werden. Wichtig ist dabei aus unserer Sicht, auch zu untersuchen, welche möglichen Veränderungen in den Bildern später nicht zur Krankheit führen werden.

TK: Was meinen Sie damit?

Prof. Peters: Wenn ein Patient oder eine Patientin aufgrund eines Verdachtes ein erhöhtes Risiko hat, an Krebs zu erkranken, hat dies entscheidenden Einfluss auf seine weitere medizinische Versorgung und natürlich seinen Alltag. Wenn man allerdings feststellen kann, dass bestimmte Veränderungen an den Organen nie zu einem Tumor führen werden, verändert das doch entscheidend die Lebensqualität und natürlich auch die Behandlung. Es muss nämlich nicht behandelt werden und das spart letztendlich auch Kosten.

TK: Welche Daten kann man heute leider noch nicht erheben, obwohl sie auch für Ihre Arbeit interessant wären?

Prof. Peters: Durch die vielen verschiedenen Player im deutschen Gesundheitssystem werden Gesundheitsinformationen in unterschiedlicher Weise erhoben und in diversen Formaten gespeichert. Einige Daten liegen nicht digital vor, sondern nur in Krankenakten. Durch diese Heterogenität können wir einige Daten gar nicht nutzen, weil der Aufwand, sie zusammenzuführen und auszuwerten, personell nicht zu leisten ist. Eine konforme Erhebung von Gesundheitsdaten und standardisierte Austauschformate würden unsere Arbeit enorm erleichtern. Diese Einschränkungen sind im Rahmen der COVID-19-Pandemie deutlich zu Tage getreten.

TK: Wie beispielsweise über eine elektronische Patientenakte?

Prof. Peters: Genau. Eine einheitliche elektronische Krankenakte würde es ermöglichen, dass wir neu-auftretende Krankheiten eindeutiger klassifizieren könnten. Zum Beispiel gibt es beim Herzinfarkt verschiedene Subtypen und bei Krebserkrankungen verschiedene Schweregrade, die in der Medizin unterschiedlich behandelt werden. Damit ein Expertengremium einen Fall genau bestimmen kann, benötigt es verschiedene Gesundheitsdaten, die nicht nur bei einem Arzt oder einer Ärztin liegen.

TK: Sie sprechen also von allgemeinen medizinischen Untersuchungsergebnissen.

Prof. Peters: Einerseits ja. Aber natürlich sind auch Daten zum Lebensstil relevant. Und Informationen, die momentan noch fast ausschließlich im Forschungsbereich genutzt werden. Zum Beispiel OMICS-Technologien. Der Begriff "OMICS" fasst Methoden zusammen, mit denen simultan eine sehr große Zahl von Molekülen eines zellulären Systems, zum Beispiel die Genexpression, Proteine oder Metabolite, gemessen werden können. So entstehen große und komplexe Datenmengen, die klar dem Bereich Big Data zugeordnet werden.

TK: Genexpression - das klingt so als würde man den Menschen in Zukunft komplett durchleuchten?

Prof. Peters: Natürlich muss der Umgang mit genetischen Daten aus ethischer Sicht diskutiert werden. Aber aus wissenschaftlicher Sicht und vorausgesetzt die Daten werden für einen konkreten Patientennutzen verwendet, machen neue Analysemethoden durchaus Sinn. Die Auswertung von OMICS-Daten ermöglicht uns eine ganz neue Bandbreite von medizinischen Erkenntnissen. Zum Beispiel können wir zeigen, welche Auswirkungen Übergewicht auf das Erbgut hat. Außerdem nutzen wir OMICS-Daten, um neue diagnostische Verfahren zu entwickeln, mit denen zum Beispiel Vorstufen des Typ 2 Diabetes Mellitus schneller und einfacher als bisher diagnostiziert werden kann. In Zukunft könnte die Zahl der Diabetes-Erkrankungen so deutlich reduziert werden.

TK: Wann wird Datensammeln zur Farce?

Prof. Peters: Größere Datenmenge allein verbessern nicht automatisch die Ergebnisse, wichtig ist auch die Qualität der Daten. Wenn automatisierte Algorithmen viele "überflüssige" Informationen einbeziehen, kann es auch sehr leicht zu Fehlschlüssen kommen. Statistische signifikante Zusammenhänge bedeuten ja noch lange keine Kausalität oder klinische Relevanz. Daher ist es wichtig, dass der Arzt die Auswertungen der künstlichen Intelligenz beurteilt und die letzte Entscheidung hat. Mal abgesehen davon, dass kein Algorithmus, und sei er noch so gut, die Vorteile einer zwischenmenschlichen Interaktion ersetzen kann.

TK: Dr. Baas, unser Vorstandsvorsitzender, sagte einmal in einem Vortrag, dass er davon ausgeht, dass Ärztinnen und Ärzte in Zukunft keine Diagnosen mehr stellen dürfen, ohne nicht auch im Hintergrund künstliche Intelligenz zu nutzen. Was meinen Sie dazu?

Prof. Peters: Natürlich ist es eine wünschenswerte Vorstellung, dass Ärztinnen und Ärzte in ihrer Arbeit durch Big Data unterstützt werden. Digitalisierung kann zu einer höheren Standardisierung und mehr Fairness in der Behandlung führen. Eine bessere Vernetzung der Ärztinnen und Ärzte kann Fehlentscheidungen, wie zum Beispiel kontraindizierte Untersuchungen oder Medikamentengaben verhindern. Aber bis dahin ist es noch ein weiter Weg.

TK: Von welchen Datenmengen sprechen wir eigentlich in Zukunft?

Prof. Peters: Das werden riesige Datenmengen sein, die aus sehr unterschiedlichen Quellen hervorgehen und sehr verschiedenen Datenformaten bestehen werden. Vermutlich wird man leicht in den petabyte Bereich also mehr als 1000 terabyte vordringen. Die größte Herausforderung wird sein, Algorithmen zu entwickeln, die mit diesen Mengen und der Unterschiedlichkeit der Informationen umgehen können. Außerdem brauchen wir Methoden, die korrekte Ergebnisse liefern, auch wenn die Informationen nicht ganz vollständig sind. 

Insgesamt wird der Schlüssel zum Erfolg von Big Data sein, diese Datenmengen in sinnvollen Formaten und Aggregationen vorzuhalten. Und nicht zuletzt werden die Zugänge und der Datenschutz eine große Herausforderung sein.

TK: Inwiefern spielen IT-Sicherheitsvorkehrungen bei Ihnen aus Gründen der hohen Sensibilität der Daten eine Rolle?

Prof. Peters: Der Schutz der Daten der Studienteilnehmerinnen und -teilnehmer hat für uns eine sehr hohe Bedeutung. Wir speichern die Daten ausschließlich in einer sicheren Umgebung. Die Informationen, anhand derer Studienteilnehmerinnen und -teilnehmer identifiziert werden können, also beispielweise Name, Anschrift oder Geburtsdatum, werden von einer Treuhandstelle verwaltet und streng getrennt von den Untersuchungsdaten gespeichert. Die Untersuchungsdaten werden nur pseudonymisiert gespeichert und ausgewertet. So stellen wir sicher, dass aus den medizinischen Daten kein Rückschluss auf eine einzelne Person möglich ist.

Wir achten bereits bei der Planung einer Studie drauf, dass die Daten in Übereinstimmung mit den deutschen Datenschutzgesetzen durchgeführt werden. Hier werden von den Datenschutzbeauftragten des Bundes und der Länder beraten und begleitet.

Falls eine Wissenschaftlerin oder ein Wissenschaftler die Daten für eine Auswertung nutzen will, muss er zunächst einen Antrag stellen. Jeder Antrag wird durch ein wissenschaftliches Gremium geprüft. Die Nutzung der Daten kann dabei für ganz unterschiedliche Zwecke vorgesehen sein. Das reicht von den Grundlagen für vorsorgende Maßnahmen bis zur Entwicklung neuer Produkte und Dienstleistungen für die Gesundheitsversorgung. 

TK: Weltweit haben Firmen ein hohes Interesse an Nutzer-Daten. Müssen wir in Deutschland mehr unternehmen, dass Daten nur für echte wissenschaftliche Auswertungen genutzt werden und nicht in "falsche" Hände geraten?

Prof. Peters: Aus unserer Sicht, ja. Bedenklich ist insbesondere, dass Gesundheitsdaten zwar geschützt sind, aber andere Daten zu Konsumverhalten, Internetnutzung und Freizeitverhalten in großem Maße gespeichert werden, und wir als Verbraucherinnen und Verbraucher wenig Kontrolle darüber haben.

TK: Gäbe es aus Ihrer Sicht eine Lösung?

Prof. Peters: Es gibt Diskussionen, dass Patientinnen und Patienten ihre Krankendaten auf einem Art Konto sammeln und als alleinige Besitzerinnen und Besitzer verwalten sollten. Der Patient oder die Patientin kann seine bzw. ihre Daten zur Behandlung und zur Forschung freigeben. Für die Nutzung der Daten könnten dann Gebühren erhoben werden. Aus unserer Sicht sind dies überlegenswerte Ansätze. Dies würde die Rechte der Patientinnen und Patienten stärken und ermöglichen, die Daten kontrolliert der Allgemeinheit und der Forschung zur Verfügung zu stellen. Man könnte sich hier ganz neue Formate und Geschäftsmodelle vorstellen, die den Patientinnen und Patienten und der Allgemeinheit zu Gute kämen.