„Menschen lieben es zu suchen, weil es für uns der einzige Weg ist, mit einer unglaublichen Datenmenge zu interagieren.“Diese Beobachtung von Dr. Han Xiao, CEO und Mitgründer des Berliner Startups Jina AI, ist mit Zahlen belegbar; Um das Jahr 2000 wurden etwa 3.5 Millionen Google-Suchen pro Tag verzeichnet. Heute ist diese Anzahl auf 5 Milliarden angestiegen. Die Milliarden an Tinder-Profilen, Amazon-Produkten und Spotify-Playlists, die Millionen von Menschen täglich auf ihren Telefonen, ihren Computern oder mit Hilfe virtueller Assistenten aufspüren, sind dabei noch nicht mitgezählt. Ein Ende des Wachstums ist nicht in Sicht.
Angetrieben von Künstlicher Intelligenz
„Wenn von der Suche die Rede ist, beziehen sich Menschen meist auf die gute, alte Text-Suche: zum Beispiel einen Satz mit bestimmten Worten zu finden“, ergänzt Xiao, der Jina AI Anfang 2020 gemeinsam mit Nan Wang und Bing He gegründet hat. In Zeiten von Instagram, TikTok, YouTube, Twitch oder Clubhouse geht eine Reihe an wichtigen Informationen verloren, die in unstrukturierten Daten wie Bildern, Videos, Live-Streams oder Audio-Inhalten enthalten sind. „Heutzutage gibt es einen wachsenden Bedarf, nach multi- oder cross-medialem Content zu suchen“, weiß der Wahl-Berliner, der zuvor unter anderem als Engineering Lead bei Tencent’s AI Lab für Chinas berühmte App „WeChat“ zuständig war, „deshalb brauchen wir die neuronale Suche – ein völlig neues Suchparadigma, das von Künstlicher Intelligenz angetrieben wird.“ Statt wie bei herkömmlichen Suchtechniken einer Maschine Regeln beizubringen, um durchsuchte Daten zu „verstehen“ und die besten Ergebnisse zu liefern, werde dabei ein neuronales Netzwerk mit existierenden Szenarien gefüttert. Dieses entwickele die Fähigkeit, entsprechende Resultate zu finden – egal, ob in Form von Tumblr GIFs, als Sätze von Wikipedia oder Bilder von Pokémon. „Das System lernt die Regeln von selbst und wird mit der Zeit immer besser“, so Xiao. Zwar müssen sich „Entwickler für diese Regeln mit der neuronalen Suche nicht den Kopf zerbrechen“, die Herausforderungen seien aber dennoch signifikant höher als bei der Text-Suche. „Man braucht fortgeschrittene Kenntnisse in Software Engineering und KI“, meint er und fügt hinzu: „um ehrlich zu sein, nicht jeder kann so eine Technologie von der Pike auf bauen.“ Das ist auch nicht notwendig. Mit dem Open-Source Framework Jina, das seit Mai 2020 auf dem Markt ist, können „selbst Entwickler, die sich mit Maschinellem Lernen nicht auskennen, schnell eine Suchmaschine erstellen.“ So baute ein 3D-Videospiel-Entwickler mit Hilfe des Frameworks eine Applikation, die es den Entwicklern erlaubte, im Right-Click-Menü ihres Editors automatisch bestimmte Teile zum Spiel hinzuzufügen. In einem anderen Fall half es einem europäischen Legal-Tech Startup, seinem Chatbot in unzähligen PDF-Dokumenten schneller die Antworten auf Nutzerfragen zu finden.
Dr. Han Xiao, Co-Founder Jina AI © Jina AI
Neben dem Kernprodukt Jina bietet das Startup für Entwickler den Marktplatz Jina Hub und hat kürzlich mit DocArray und Finetuner zwei weitere Open-Source-Projekte veröffentlicht, um seinen Benutzern ein umfassenderes Erlebnis beim Aufbau einer neuronalen Suche zu bieten. Es soll nur der Anfang sein: Im November 2021 hat das mittlerweile 45-köpfige Team, von dem die Hälfte am Standort Berlin arbeitet, bei einer Series A-Investitionsrunde 30 Millionen US-Dollar zugesichert bekommen. „Die Gewinner-Formel enthält mehrere Faktoren: ein solides Gründungsteam, ein Ingenieurs-Team von Weltklasse, einen vielversprechenden und wachsenden Markt – und jede Menge Kaffee“, meint Xiao mit einem Schmunzeln. Eine Formel, die ihm in diesem Jahr auch in Nordamerika zum Erfolg verhelfen soll. Sind bisher die Kunden von Jina auf Europa und Asien verteilt, möchte das Unternehmen, das Forbes zu den 30 bemerkenswertesten Startups im Bereich KI zählt, in Zukunft nämlich auch in den USA Fuß fassen: „Die Entwickler-Community ist dort viel größer und stärker als anderswo. Wenn wir dort auftreten, kann das unsere Software-Anwendung verbessern“, nennt er Gründe dafür, ein US-Büro zu planen, „zweitens ist ein SaaS-abonnierbares Modell dort von Unternehmen und Individuen sehr gut akzeptiert. Wenn wir in der Monetarisierung schnell wachsen möchten, ist das definitiv der Markt für uns.“
„Mächtigste Anwendung von Natural Language Processing (NLP)“
Seine „Position auch außerhalb Europas ausbauen“, das möchte Milos Rusic, CEO und Co-Gründer des Startups Deepset, in den nächsten Jahren ebenfalls. Es handelt sich dabei um ein weiteres Berliner Unternehmen, das – wie Jina AI – die „mächtigste Anwendung von NLP – Neural Search“ adressiert, heißt es auf der Website. Ursprünglich baute das Gründer-Team, das neben Rusic aus Malte Pietsch und Timo Möller besteht, kundenindividuell NLP-Lösungen. Doch bald war klar, dass „für skalierbare und breite Adoption von NLP ein Framework notwendig ist“, wie der CEO betont, „dieses Framework muss einfach und flexibel sein, um Entwicklern, die an Produkten arbeiten, zu helfen, individuelle NLP-Lösungen zu bauen. Die logische Konsequenz war die Veröffentlichung unseres Open-Source-Frameworks Haystack, das genau das ermöglicht.“
Inzwischen haben mehr als 500.000 Nutzer die Software heruntergeladen und über 1000 Organisationen benutzen die komplementären Tools für Haystack. Dazu zählen große internationale Unternehmen wie Infineon und Alcatel Lucent genauso wie zahlreiche Startups. „Die Anwendungsfälle sind sehr vielseitig – am verbreitetsten ist die Nutzung für Suche und Question Answering. Die meisten Anwendungsfälle zielen darauf ab Endnutzern einen schnelleren Zugang zu relevanten Informationen in großen Datenmengen zu ermöglichen“, so Rusic, der an der TU München und der UC Berkeley studiert hat. „Das kann in einer Bank sein, die schnell einen Überblick über alle Risiken in einem Markt bekommen möchte, in einem Pharmaunternehmen, das an einem neuen Medikament forscht und bestehende relevante Erkenntnisse vollumfänglich erfassen will, aber auch ein Customer Support-Center, das auf spezifische Kundenfragen schnell die richtige Antwort geben möchte.“ Damit das Q&A auch auf Deutsch stattfinden kann, hat Deepset Mitte 2021 einen deutschen Question Answering- und Passage Retrieval-Datensatz entwickelt. „Der Datensatz soll Forschern helfen weitere Experimente durchzuführen, neue Modellarchitekturen zu trainieren und dadurch die Performanz von NLP auf deutscher Sprache weiter verbessern“, meint der Co-Gründer.
Das Team von Deepset um Gründer Milos Rusic © Deepset
Open-Source-Suchmaschine für neuronale Daten
Während Jina und Haystack Frameworks für Neural Search liefern, fokussiert sich das Deeptech-Startup Qdrant auf die „grundlegende Technologie, die Neuronale Suche an sich ermöglicht“, erklärt Andre Zayarni die Intention des jüngsten Berliner Startups in diesem Umfeld. „Unsere Engine kann man standalone benutzen, um hoch skalierbare Anwendungen zu erstellen oder zusammen mit Frameworks wie Jina oder Haystack.“ Zwar wurde das Unternehmen bereits im Oktober 2021 gegründet, Zayarni und sein Partner Andrei Vasnetsov begannen aber erst im Januar 2022 Vollzeit für das Startup zu arbeiten. Zur gleichen Zeit erhielt das Jungunternehmen zwei Millionen Euro im Rahmen einer Pre-Seedfinanzierung, um angewandte KI-Lösungen zu verbessern und metrisches Lernen praktikabel zu machen. „Qdrant Engine wird gemeinsam mit Neural Network Encoder verwendet – einer speziellen Art von neuronalen Netzwerken (NN), die sogenannte Vektoren statt den üblichen Klassifikations-Wahrscheinlichkeiten herausgibt“, beschreibt CTO Vasnetsov, der vor zwei Jahren aus Moskau nach Deutschland kam, das Prinzip, „dank moderner Entwicklungen gibt es eine Vielzahl an fertigen neuronalen Netzwerken für fast alle Arten von unstrukturierten Daten – von Text über Audio bis Video. Qdrant konsumiert den Output dieser NNs, um den Nutzer mit einem produktionsreifen Service das Suchen von unstrukturierten Daten mit anderen unstrukturierten Daten zu ermöglichen.“
Schon im letzten Jahr war die Qdrant Engine auf Open Source-Plattformen zugänglich. „Wir haben bisher eine ziemlich gute Traction auf GitHub, und noch wichtiger ist für uns das positive Feedback aus der Entwickler-Community“, freut sich CEO Zayarni, der seine Karriere 2007 beim ehemals größten sozialen Netzwerk Deutschlands, StudiVZ, in Berlin begann und in den letzten fünf Jahren als CTPO von MoBerries, einer KI-gesteuerten Job-Matching-Plattform, arbeitete. „Unsere Technologie wird bereits in der Produktion benutzt, was uns am meisten motiviert.“ Noch in diesem Jahr möchte das Gründer-Duo, das gerade sein Team zusammenstellt, die erste Unternehmens-Version ihrer neuronalen Suchmaschine auf den Markt bringen. „Außerdem arbeiten wir an einem anderen Open-Source-Projekt, das metrisches Lernen noch weiter pushen wird“, so Andre Zayarni, „wir planen die Veröffentlichung der ersten Version noch in diesem Jahr. Darüber hinaus bauen wir unsere Entwickler-Community um unsere Technologie auf und aus. Zusätzlich suchen wir nach Partnern, mit denen wir gemeinsam Lösungen entwickeln können.“ Mit dem Team von Jina sind die Qdrant-Gründer bereits in Kontakt und kooperieren laut eigener Aussagen an Themen, wo es Überschneidungen gibt. Auch Deepset und Jina AI haben bereits zusammengearbeitet.
Andrei Vasnetsov und Andre Zayarni, Gründer von Qdrant © Qdrant
Open Source: Zukunft der Software-Entwicklung
Dass solche Kollaborationen möglich sind, liege unter anderem am offenen Berliner KI-Ökosystem, ist Milos Rusic von Deepset überzeugt: „Die größeren Tech-Firmen in Berlin unterstützen Open Source, lassen ihre Mitarbeiter zu Projekten beitragen und setzen die Technologien selber ein“, meint der CEO und ergänzt: „Wir haben hier viele Open-Source-Firmen, mit denen wir in regelregelmäßigem Austausch stehen.“ Dass dazu alle drei Pionier-Unternehmen im Bereich der neuronalen Suche zählen, ist kein Zufall: „Jeder nutzt Open-Source-Technologien, und du kannst sie heutzutage kaum vermeiden“, betont Andre Zayarni von Qdrant, „Open-Source-Software frisst die Unternehmens-Software, und es ist die Zukunft. Wir nutzen sie aber nicht nur, sondern kreieren sie auch: Unsere Kern-Technologie ist open-sourced. Der signifikante Vorteil ist, dass es Vertrauen schafft, weil es offen, frei zugänglich ist, und die Community ist in die Entwicklung involviert.“ Es sind Vorteile, die auch Han Xiao von Jina kennt.
Dennoch gibt es für ihn vor allem einen Grund, warum eine „Open-Source-Infrastruktur der einzige Weg ist, eine erfolgreiche Software zu bauen, und es ist der einzige Weg, Jina AI zu einem erfolgreichen Software-Unternehmen zu machen: Geschwindigkeit.“ Schließlich habe eine Infastruktur-Software wie Jina von Natur aus weniger Endnutzer, als etwa eine Spiele-Software. Deshalb seien Feedback-Schleifen zu lang und zu selten, sodass sich die Software nicht verbessern könne. Hier kommen Jina die inzwischen 3000 Entwickler in der Community und die 203 externen Kontributoren gelegen, die zur ständigen Weiterentwicklung und somit Verbesserung der Software beitragen. „Wir glauben, dass Open Source und die Community das Beste aus Haystack machen: Wir bekommen Feedback, diskutieren aktiv Verbesserungen und die Community trägt selber direkt zur Weiterentwicklung und technischen Implementierung bei“, kann das Milos Rusic von Deepset nur bestätigen, „dadurch stellen wir eine transparente und kontinuierliche Weiterentwicklung sicher, die sich in der hohen Qualität niederschlägt.“ Geht es nach Qdrant-CEO Zayarni sind die bisherigen Open-Source-Projekte nur der Anfang: „Zugegeben, Deutschland und Europa sind nicht die Führer im Bereich der Open-Source-Technologien, aber das ändert sich“, steht für ihn fest, „das Open-Source-KI-Ökosystem in Berlin wächst rasant. Wir sehen sicherlich viele weitere spannende Projekte in diesem Bereich.“