Statt sich bei der Suche nach „Berliner“ durch unzählige Dokumente wühlen zu müssen, liefert Google die passende Information: Der Algorithmus weiß genau, ob wir den Bewohner der Bundeshauptstadt meinen oder uns für ein Pfannkuchenrezept interessieren. Die KI von Netflix kennt unseren Filmgeschmack besser als der Partner und Facebook macht uns ungefragt auf das Konzert unserer Lieblingsband aufmerksam. Was den Alltag erleichtert, hat einen hohen Preis: „Die meisten Silicon-Valley-Unternehmen wie Google, Netflix oder Facebook erreichen die Convenience nicht durch ein nettes Design, sondern mit Hilfe der Daten ihrer Nutzer“, weiß Leif-Nissen Lundbæk, CEO und Mitgründer des Berliner Tech-Unternehmens „Xayn“ zu berichten.
Aufenthaltsort, Zahlungsdaten, Kontakte und Nutzungsstatistiken – Daten wie diese werden von den Technologie-Anbietern gesammelt und mit den Usern verknüpft. Das hinterlässt bei vielen ein mulmiges Gefühl: 92 Prozent sorgen sich laut 2019 Cyber Security Insights Report um ihre digitale Privatsphäre. Die Angst, dass die Daten gehackt, an Dritte verkauft und für andere als die ursprünglichen Zwecke verwendet werden, ist berechtigt. Das haben Beispiele wie der Cambridge-Analytica-Skandal gezeigt. Dennoch nehmen 64 Prozent diese Risiken für eine bessere User Experience in Kauf.
Xayn CEO Leif-Nissen Lundbæk © Xayn
Datenschutz oder User Experience?
Für Leif-Nissen Lundbæk kommt dies nicht überraschend: „Privatsphäre sollte kein Unterscheidungsmerkmal sein, ist es aber. Ich vergleiche es häufig mit Nachhaltigkeit.“ Der Kunde würde ein Produkt bevorzugen, das seine Daten schützt – vorausgesetzt, er müsse nicht mehr dafür bezahlen oder Qualitätsabstriche machen. Genau das sei derzeit der Fall. „Häufig muss man sich zwischen User Experience und Datenschutz entscheiden“, beschreibt der Wahl-Berliner das Dilemma. So sammele die amerikanische Suchmaschine Duckduck.go keine Daten ihrer Nutzer, liefere allerdings schlechtere Suchergebnisse. Der User bezahlt den Schutz seiner Privatsphäre mit seiner Zeit, weil er länger braucht, um das Richtige zu finden. Lundbæk möchte sich damit nicht zufriedengeben: „Wir können diesen Trade Off zwischen Datennutzung und User Experience mit einer Technologie lösen, die beides vereinbart“, meint er, „(eine Technologie,) die genauso bequem ist wie Google, aber auch die Privatsphäre der User maximal schützt.“
Suchmaschine Xayn: „Eine Websuche, wie sie sein sollte“.
Dass Datenschutz und Nutzungserlebnis kein Widerspruch sind, davon können sich Internetuser seit Ende 2020 selbst ein Bild machen: Das Unternehmen Xayn, das Lundbæk 2017 mit Felix Hahmann und Professor Michael Huth gegründet hat, brachte „eine Websuche, wie sie sein sollte“ auf den Markt. Die kostenfreie gleichnamige Suchmaschine, die via Android und iOS zur Verfügung steht, gibt den Usern die Entscheidungsfreiheit, die KI zu aktivieren und personalisierte Suchergebnisse zu bekommen. Zusätzlich können sie ihre Inhalte mit einem Klick kuratieren: Wischen sie nach rechts, bestätigen sie die Suchergebnisse. Wischen sie nach links, lehnen sie sie ab. Damit beeinflussen die User, was sie künftig angezeigt bekommen und können außerdem präferierte Webinhalte in Collections sammeln, speichern und sortieren. Die Nutzer haben nicht nur volle Kontrolle über die Algorithmen der KI und die angezeigten Inhalte. Alle Daten und die Interaktionshistorie bleiben in ihren Händen – oder vielmehr auf dem eigenen Gerät.
Die Grundlage dafür bildet eine KI-Infrastruktur, die das sogenannte föderierte oder dezentrale Maschine Learning mit der homomorphen Verschlüsselung verbindet. Entwickelt wurde sie bereits 2014 im Rahmen eines Forschungsprojekts der Universität Oxford und dem Imperial College London. Was vor vier Jahren in einem eigenen Framework mündete, ist mittlerweile unter dem Namen Xaynet als Open-Source-Projekt veröffentlicht. „Wenn man aus Daten lernen möchte, braucht man große Datenmengen“, erklärt der studierte Mathematiker und Software Engineer Lundbæk gegenüber Datenbusiness das Prinzip. „Normalerweise bringt man dafür immer die Daten zum Algorithmus. Wir haben das umgedreht: Wir bringen die Algorithmen zu den Daten und sammeln dann die Gesamtheit des Wissens, nicht die Daten selbst.“ Schon auf dem Smartphone werden die Verhaltensweisen der Nutzenden ausgewertet. Danach werden die generierten KI-Modelle verschlüsselt an einen Server übertragen und in ein globales KI-Modell aufgenommen, das zur Verbesserung und Korrektur wieder an die Endgeräte übertragen wird. „Damit können wir am Ende das globale Modell entschlüsseln, ohne dass wir jemals die lokale Analyse entschlüsseln können“, meint Lundbæk, der heute ein 28-köpfiges Team leitet. „Wir sehen vom Einzelnen nichts, sondern nur das Ergebnis der Gesamtheit aller lokalen User.“ Um sicherzustellen, dass nur der Benutzer die Kontrolle über sein KI-Modell hat, setzt Xayn zusätzlich auf weitere dezentrale Technologien. Das IOTA Tangle soll als „Vertrauensanker“ optional Integrität und Transparenz der Such-KI validieren.
Datenschutz: EU an vorderster Front der technologischen Innovation
Eingebauter Datenschutz und Wahrung der Privatsphäre, aber auch die geringeren Kosten der lokalen KI-Modelle – die Vorteile des föderierten Ansatzes klingen überzeugend. Noch überwiegen zwar zentrale Modelle, doch das Blatt wird sich wenden: Die Datenstrategie der EU geht davon aus, dass bis 2025 80 Prozent der globalen Datenmengen auf Endgeräten verarbeitet werden. Besonders europäischen Unternehmen „bleibt keine andere Wahl, als sich umzustellen“, bestätigt der Xayn-CEO. Schon heute sprechen in der EU die rechtlichen Rahmenbedingungen gegen das Business-Modell von Facebook und Co., Daten weiterzuverkaufen. Deshalb werde Datenschutz „schlichtweg überlebensnotwendig.“ Die strenge Datenschutz-Grundverordnung sei für Unternehmen kein Nachteil: „Universelle Werte wie Datenschutz sind unser Top Export in die Welt“, plädierte Lundbæk auf der DigitalShift-Konferenz 2019 in München. „Innovative Entwicklungen im Bereich AI, die diesen Werten gerecht werden, könnten die EU an die vorderste Front der technologischen Innovation bringen.”
Berliner Erfolgsgeschichte
Mit seiner dezentralen KI-Infrastruktur könnte Xayn von Berlin aus vorn mitmischen. „Wir denken, dass Deutschland als Privacy-Driver eine große Rolle spielt“, weshalb Lundbæk überzeugt ist, sich bei der Gründung des Start-ups im Jahr 2017 für den richtigen Standort entschieden zu haben. Da in Großbritannien der Brexit beschlossene Sache war, suchte man in „weiser Voraussicht eine zentraleuropäische Alternative“. Der Zufall wollte es, dass mit Felix Hahmann einer der Gründer beim Automobilkonzern Daimler in Berlin beschäftigt war und so die Wahl nicht schwer fiel. Bereut hat Lundbæk die Entscheidung nicht: „Aus Oxford, wo wir zunächst waren, gehen alle Entwickler weg – nach London oder in ihre Heimatländer“, erklärt er, „Wir hatten immer die Idee, dass wir alle Leute an einem Standort haben wollen, und Berlin hat den Vorteil, dass jeder hierherziehen möchte.“ Neben dem Zugang zu Talenten sprechen die offene Community, der gute Austausch und die Zusammenarbeit zwischen Unternehmen für die Bundeshauptstadt. „Außerdem schauen viele Investoren auf Berlin“, weiß Lundbæk. Davon profitierte auch Xayn, das zunächst von den Gründern in Eigenregie finanziert wurde. Zwei Finanzierungsrunden später sind der Wagniskapitalgeber Earlybird, Business Angel aus Asien und Dominik Schiener, Erfinder der Kryptowährung IOTA, am Unternehmen beteiligt.
Große kleine Suchmaschine
Die starke Investorenbasis ermöglichte es Xayn, Lösungen für Industriepartner wie Daimler oder Porsche zu erarbeiten und gleichzeitig ein Jahr lang an der Suchmaschine zu feilen. Die Strategie ist aufgegangen: „Wir haben nach einem Monat bereits um die 15.000 aktive Nutzer und ein relativ starkes tägliches Wachstum“, freut sich der CEO. „Unter den kleinen Suchmaschinen sind wir also aus dem Stand heraus eine relative Größe geworden.“ Noch fürs 1. Quartal werden die 100.000 Nutzer vor allem auf dem europäischen Markt angepeilt. Zur App-Version soll vermutlich in der ersten Hälfte 2021 eine Browser-Variante hinzukommen. Darüber hinaus werden die Suchergebnisse mit weiteren Quellen wie der Produktsuche angereichert. „Zusätzlich möchten wir die Suchmaschine für Unternehmen bereitstellen, weil sie Probleme haben, zu relevanten Ergebnissen zu gelangen“, berichtet Lundbæk. Beamte verbringen sage und schreibe 37 Prozent ihrer Zeit mit der Internetsuche, ergab eine interne Studie einer deutschen Großstadt. Hier soll die KI helfen, effizienter zu werden. Tests mit Premium Features für Endkunden seien ebenfalls geplant: „Dadurch, dass die KI am Gerät agiert, ist es ein Leichtes, Quellen hinzuzufügen“, meint der CEO, „so kann man beispielsweise auch in der Cloud suchen.“
Von Federated Learning zu Federated Analytics
80 Prozent der Aktivitäten von Xayn seien auf die Suchmaschine fokussiert, verrät der Berliner Unternehmer. Darüber hinaus wird die Infrastruktur laufend weiterentwickelt: „Die Frage, wie die User das Produkt nutzen, ist ein entscheidender Bereich“, erklärt er, „jedes andere Unternehmen verwendet Google Analytics oder andere Tracker. Das Problem ist, dass man dabei alles sieht, was der Nutzer macht – nur nicht die Suchanfragen. Gleichzeitig hat es den Nachteil, dass das Produkt nicht auf unsere Szenarien optimiert werden kann. Wir sehen nicht, ob es Probleme gibt oder wie es genutzt wird.“ Deshalb ist das Team dabei, lokale und datenschutzkonforme Analyseansätze zu entwickeln. „Wir erweitern Federated Learning zu Federated Analytics“, bringt es Lundbæk auf den Punkt, und fügt hinzu: „Das kann auch für andere interessant sein.“
Das Xayn-Team hofft mit der Weiterentwicklung der Technologie aber nicht nur seine Suchmaschine auszubauen. „Wir wollen zeigen, dass man so etwas umsetzen kann“, erklärt der Experte. Dass sie sich im ersten Schritt für eine Suchmaschine entschieden haben, liegt an der Expertise der Gründer. Zudem sei der Suchbereich einer der größten Märkte; schließlich laufen „30 Prozent des Internet Traffics über Suchmaschinen“, argumentiert Lundbæk. „Doch ich sehe weitere Bereiche, die gebaut werden können – nicht nur von uns.“ Über die Open-Source-Plattform XayNet haben andere Start-ups und Unternehmen die Möglichkeit, ähnliche Produkte zu bauen. „Der Video-Search bei YouTube könnte eine Privatsphäre-wahrende Alternative bieten“, bringt er ein Beispiel, „auch für Streaming Dienste ist es vorstellbar. Sie brauchen die Daten nicht für Werbung und sind App-basiert, sodass die KI einfach am Gerät oder im Browser trainiert werden kann. Da könnte die bestehende Empfehlungs-KI Stück für Stück auf diese Technologie umschwenken.“ Es wäre eine neue Art von unbeschwertem Filmvergnügen – frei von Sorge um unsere Daten.