© Apheris

01 Oktober 2025

„Die Daten werden nie übertragen. Das gesamte Training läuft in der IT-Umgebung des jeweiligen Unternehmens.“

Robin Röhm ist CEO und Mitbegründer von Apheris, einem Unternehmen, das KI-Anwendungen für die Arzneimittelforschung auf Unternehmensebene anbietet. Diese Anwendungen laufen direkt in den IT-Systemen der Pharmaunternehmen, sodass sensible Daten niemals deren Kontrolle verlassen. Das Herzstück bildet die föderierte Computing-Plattform von Apheris, die es ermöglicht, KI-Modelle anhand proprietärer Datensätze mehrerer Organisationen zu trainieren, ohne dass die Daten jemals weitergegeben werden. Dies ermöglicht eine Zusammenarbeit bei Modellen und Benchmarks, die leistungsfähiger ist als alles, was ein einzelnes Unternehmen alleine erreichen könnte.

Eines der bekanntesten Beispiele ist das AI Structural Biology (AISB) Network, eine Zusammenarbeit führender Pharmaunternehmen, die auf der Plattform von Apheris basiert. Innerhalb dieses Netzwerks verbessert die Federated OpenFold3 Initiative OpenFold3, ein Open-Source-Strukturvorhersagesystem, das vom AlQuraishi Lab an der Columbia University entwickelt wurde. Durch das Training mit einer der vielfältigsten Sammlungen von Protein-Ligand-Daten – Informationen darüber, wie Proteine mit arzneimittelähnlichen Molekülen interagieren – zielt die Initiative darauf ab, das Modell bei der Vorhersage dieser Interaktionen genauer zu machen.

Anfang Herbst schlossen sich Astex, Bristol Myers Squibb und Takeda den Gründungsmitgliedern AbbVie und Johnson & Johnson an und schufen damit eine der ehrgeizigsten unternehmensübergreifenden KI-Initiativen im Bereich der Biowissenschaften. Wir sprachen mit Robin Röhm über die Bedeutung dieser Zusammenarbeit, die weiterreichenden Auswirkungen des föderierten Lernens und die sich wandelnde Rolle Berlins im globalen KI-Ökosystem.

 

Hallo Robin, das AISB-Netzwerk bringt globale Pharmaunternehmen zusammen, um gemeinsam KI-Modelle auf der Grundlage proprietärer Protein-Ligand-Daten zu trainieren. Bislang blieben solche wertvollen Informationen immer innerhalb der einzelnen Unternehmen, sodass ein unternehmensübergreifendes Modelltraining unmöglich war. Was hat diese Zusammenarbeit jetzt möglich gemacht und warum ist föderiertes Lernen der entscheidende Faktor?

Zwei Dinge haben sich geändert. Erstens ist das föderierte Computing ausgereift. Anstatt dass Daten über Grenzen hinweg übertragen werden, geht das Modell zu den Daten und gibt nur datenschutzkonforme Aktualisierungen zurück. Dadurch wird sichergestellt, dass sensible Informationen niemals die Unternehmensumgebung verlassen, während fortschrittliche Sicherheitsvorkehrungen wie Angriffstests und Computational Governance sowohl die Daten als auch das geistige Eigentum des Modells schützen. Zweitens hat sich der Bereich der KI selbst weiterentwickelt. Algorithmen sind heute leistungsstark und weit verbreitet, aber die öffentlich zugänglichen Datensätze, mit denen sie trainiert werden können, reichen für die industrielle Arzneimittelforschung nicht aus. Es wurde deutlich, dass kein einzelnes Pharmaunternehmen über die Datenmenge oder -vielfalt verfügt, die für die Erstellung hochpräziser Modelle erforderlich ist. Federated Learning löst beide Probleme auf einmal: Es erschließt die kollektive Stärke verteilter, proprietärer Datensätze und stellt gleichzeitig sicher, dass jeder Teilnehmer die volle Kontrolle über seine Vermögenswerte behält.

 

Einer der größten Durchbrüche der letzten Jahre war AlphaFold von DeepMind, das öffentliche Daten nutzte, um die 3D-Strukturen fast aller bekannten Proteine vorherzusagen. Allerdings erfasst AlphaFold nicht, wie Proteine mit kleinen Molekülen interagieren – ein wichtiger Schritt in der Arzneimittelforschung. Wie baut die Federated OpenFold3 Initiative auf diesem Meilenstein auf und welche neuen wissenschaftlichen Bereiche will sie abdecken?

AlphaFold2 war ein wissenschaftlicher Durchbruch, weil es vorhersagen konnte, wie sich Proteine zu 3D-Formen falten, ein Problem, das Forscher seit Jahrzehnten beschäftigte. Bei der Arzneimittelentwicklung ist die eigentliche Frage jedoch, wie diese Proteine mit kleinen Molekülen, Antikörpern oder Antigenen interagieren. AlphaFold3 begann, sich damit zu befassen, indem es Protein-Ligand-Wechselwirkungen modellierte, wurde jedoch nie für die offene industrielle Nutzung freigegeben. OpenFold3 hat dies geändert, indem es das Setup in einem offenen Format nachgebildet hat und der Community damit erstmals Zugang zu dieser Funktion ermöglicht hat. Wir schätzen uns sehr glücklich, mit dem OpenFold Consortium und dem AlQuraishi Lab an der Columbia University, den Entwicklern von OpenFold3, zusammenarbeiten zu dürfen. Ein zentrales Problem bleibt jedoch bestehen: der Mangel an geeigneten Trainingsdaten. Die wichtigste Trainingsdatenquelle für OpenFold3 und ähnliche Modelle ist die Protein Data Bank (PDB), ein globales Archiv von 3D-Proteinstrukturen. Die PDB umfasst etwa 200.000 Einträge, aber nur etwa 10 % davon sind Protein-Ligand-Komplexe, wobei es sich meist um natürliche und nicht um arzneimittelähnliche Moleküle handelt. Wenn nur arzneimittelähnliche Moleküle ausgewählt werden, sind nur 2 % der gesamten PDB relevante Trainingsdaten. Bei der Federated OpenFold3 Initiative geht es in erster Linie darum, das Datenproblem zu beheben. Wir beginnen mit dem Open-Source-Modell OpenFold3 und optimieren es dann anhand proprietärer Datensätze von fünf großen Pharmaunternehmen, ohne dass die Daten jemals deren Systeme verlassen. Auf diese Weise bringen wir etwa fünfmal mehr arzneimittelähnliche Protein-Ligand-Strukturen ein, als in der öffentlichen Protein Data Bank vorhanden sind. Damit haben wir zum ersten Mal einen glaubwürdigen Weg gefunden, diese Modelle so genau zu machen, dass sie für die reale Arzneimittelentwicklung eingesetzt werden können.

 

Die Vorstellung, dass sensible Daten gemeinsam genutzt werden können, ohne jemals das System eines Unternehmens zu verlassen, klingt für viele paradox. Welche technischen Sicherheitsvorkehrungen und Governance-Prinzipien gewährleisten, dass das geistige Eigentum im AISB-Netzwerk geschützt bleibt?

Auf den ersten Blick klingt das tatsächlich widersprüchlich – aber der Schlüssel liegt darin, dass die Daten niemals verschoben werden. Das gesamte Training findet innerhalb der IT-Umgebung jedes Unternehmens unter dessen Kontrolle statt. Zurückgeteilt werden lediglich Modellaktualisierungen, und selbst diese werden so verarbeitet, dass niemand die Originaldaten zurückentwickeln kann. Wir haben auch ein spezielles Team, das Datenschutzangriffe durchführt, um potenzielle Risiken wie Datenrekonstruktion oder Reverse Engineering zu identifizieren, bevor sie jemals zu einem Problem werden können. Alles wird protokolliert, getestet und ist überprüfbar. Darüber hinaus investieren wir ebenso viel Arbeit in die Governance wie in die Technologie. Die Rechte an geistigem Eigentum sind von Anfang an klar definiert, und Apheris fungiert als Koordinator der Zusammenarbeit, sodass die Unternehmen nicht Dutzende von bilateralen Vereinbarungen aushandeln müssen. Insgesamt bedeutet dies, dass Pharmaunternehmen ihre wertvollsten Datensätze vertrauensvoll zur Verfügung stellen können: Sie erhalten leistungsfähigere Modelle, ohne jemals Kompromisse in Bezug auf Eigentumsrechte oder Compliance eingehen zu müssen.

 

Apheris liefert die technologische Grundlage für diese Initiative. Was war die größte Herausforderung beim Aufbau einer Plattform, der einige der weltweit größten Pharmaunternehmen vertrauen – und was sagt dies über die Fähigkeit Berlins aus, global relevante Deep-Tech-Unternehmen hervorzubringen?

Um das Vertrauen der Pharmaunternehmen zu gewinnen, mussten wir weit über technische Exzellenz hinausgehen. Schließlich gehören Daten zu den strategisch wichtigsten und wertvollsten Vermögenswerten der Branche. Wir mussten beweisen, dass föderiertes Lernen nicht nur wissenschaftlich wertvoll, sondern auch sicher, konform und überprüfbar ist. Im AISB-Netzwerk arbeiten Wettbewerber Seite an Seite, müssen sich aber nicht gegenseitig vertrauen. Die Technologie- und Governance-Rahmenbedingungen gewährleisten, dass Daten und geistiges Eigentum vollständig geschützt bleiben, wobei das Training lokal stattfindet und nur datenschutzkonforme Updates weitergegeben werden. Vor allem aber haben wir uns das Vertrauen durch jahrelange Zusammenarbeit mit anspruchsvollen Pharmakunden erarbeitet, die uns gelehrt haben, was nötig ist, um die Anforderungen in den Bereichen Informationssicherheit, Recht und Compliance zu erfüllen. Diese Kombination aus Technologie, Compliance und langfristiger Partnerschaft hat globale Pharmaunternehmen davon überzeugt, dem AISB-Netzwerk beizutreten. Und AISB ist nur der Anfang: Wir wenden denselben Ansatz nun auch im ADMET-Netzwerk und in einem kürzlich mit Ginkgo Datapoints angekündigten Konsortium zur Antikörperentwicklungsfähigkeit an. Obwohl Apheris über Talente in ganz Europa verfügt, spielt Berlin nach wie vor eine wichtige Rolle. Hier wurde unser Unternehmen gegründet, hier trifft sich unser Team persönlich, und hier zeigt das breitere Ökosystem, dass die Stadt nicht nur Kreativität und Talente zu bieten hat, sondern auch Technologie auf Unternehmensniveau, die globale Standards setzt.

 

Berlin wird oft als ein Ort beschrieben, an dem KI und Biowissenschaften zunehmend zusammenwachsen. Was macht die Stadt aus Ihrer Sicht attraktiv als Standort für internationale Initiativen wie AISB – und was muss noch verbessert werden, damit Berlin seine Position weltweit stärken kann?

Das AISB-Netzwerk selbst ist nicht an einen einzigen Standort gebunden. Es bringt acht globale Pharmaunternehmen zusammen, und Apheris ist remote-first. Dennoch spielt Berlin eine wichtige Rolle. Die Stadt zieht internationale Talente an, bietet eine starke akademische Basis und verfügt über eine lebendige Start-up-Szene, die den Austausch zwischen den Disziplinen fördert. Für uns ist es auch der Ort, an dem sich unser Team persönlich trifft, was die Energie und den Ehrgeiz der Stadt unterstreicht. Was Berlin noch verbessern muss, sind die Skalierungsbedingungen. Im Vergleich zu den USA ist der Zugang zu Kapital in der Spätphase eingeschränkter, die regulatorischen Hürden sind höher und es kann schwierig sein, schnell spezialisierte Talente zu gewinnen. Wenn Berlin diese Bereiche stärkt, kann es sich fest als globaler Knotenpunkt etablieren, an dem KI und Biowissenschaften zusammenlaufen.

 

Wo sehen Sie neben der Strukturbiologie den größten Einfluss von föderierten Datennetzwerken – im Gesundheitswesen, im Bereich der öffentlichen Gesundheit oder sogar in Bereichen wie Mobilität und Stadtintelligenz?

Verbundene Netzwerke sind am leistungsfähigsten, wenn wertvolle Daten auf viele Akteure verteilt sind, aber aufgrund von Vorschriften oder IP-Bedenken nicht geteilt werden können. Das macht sie besonders relevant in stark regulierten Branchen wie dem Gesundheitswesen, der Pharmaindustrie oder dem Finanzwesen. In der Praxis sind die Pharmaindustrie und das Gesundheitswesen am weitesten fortgeschritten. Der Grund dafür ist, dass Erfolg mehr als nur die Infrastruktur erfordert. Man muss die Daten verstehen, sie für die gemeinsame Nutzung vorbereiten, die richtigen Modelle entwerfen und sicherstellen, dass diese Modelle anschließend auch nutzbar sind. Deshalb konzentrieren wir uns bewusst auf einige wenige Anwendungen und lösen diese von Anfang bis Ende. In der Arzneimittelforschung gehen wir bereits über die Strukturbiologie hinaus und beschäftigen uns mit der Vorhersage von ADMET-Eigenschaften und, zusammen mit Ginkgo Datapoints, mit der Entwickelbarkeit von Antikörpern. Wir haben auch Kunden wie Roche, die auf unserer Plattform Real-World-Evidence-Netzwerke aufbauen. Über das Gesundheitswesen hinaus könnten auch Bereiche wie das öffentliche Gesundheitswesen oder die Fertigung davon profitieren, obwohl die Einführung dort noch in den Anfängen steckt.

 

Europa legt Wert auf vertrauenswürdige KI und digitale Souveränität. Wie können Berliner Initiativen wie Apheris und das AISB-Netzwerk dazu beitragen, globale Standards für sichere, kollaborative KI zu gestalten?

Mit dem Fortschritt der KI sind Daten zum wertvollsten Gut geworden. Sie sind der Treibstoff, der darüber entscheidet, ob sich Modelle verbessern. Ihr Schutz ist von grundlegender Bedeutung, und Europa hat vertrauenswürdige KI und digitale Souveränität in den Mittelpunkt seiner Strategie gestellt. Das setzt sehr hohe Maßstäbe für den Umgang mit sensiblen Daten. Es kann den Zugang erschweren, aber wenn unter diesen Bedingungen Kooperationen zustande kommen, sind sie sicher und weltweit glaubwürdig. Mit unseren Netzwerken zur Arzneimittelforschung zeigen wir, dass sogar Konkurrenten gemeinsam an gemeinsamen KI-Modellen arbeiten können, ohne jemals ihre Rohdaten auszutauschen – ein Blaupause dafür, wie sichere, kollaborative KI funktionieren sollte. Solche Beweise helfen dabei, Maßstäbe dafür zu setzen, wie sichere, kollaborative KI weltweit aussehen sollte. Gleichzeitig muss Europa ein Gleichgewicht wahren. Schutz ist wichtig, aber wenn die Vorschriften das Wachstum von KI- und Technologieunternehmen zu sehr behindern, wird die Innovation woanders stattfinden. Europa hat die Chance zu zeigen, dass beides möglich ist.

 

Vielen Dank für das Gespräch.