Ob Big oder Smart – Daten sind in aller Munde. Meist handelt es sich dabei noch um interne Daten. Doch spätestens 2020 sollten Unternehmen auch externen Daten einkaufen und genauso smart einsetzen. Die Intelligence Plattform des Startups „Datarade“ möchte genau das ermöglichen und gleichzeitig für mehr Transparenz im globalen Datenmarkt sorgen. #KI_Berlin hat mit Mitgründer und CEO Thani Shamsi gesprochen.
Wenn man über Big Data and Business Intelligence spricht, geht es meistens um interne Daten. Dan Woods, Forbes Contributer meint, dass die Welt unter einem „Data not invented here syndrome” leidet. Werden externe Daten nicht ausreichend genutzt?
Der Erwerb und die Nutzung von externen Daten haben eine lange Geschichte: Mit der Erfindung des Stock Ticker Tapes wurden von 1870 bis 1970 Aktienkurse über Telegrafen digital übertragen und gekauft, bis die Technologie von Computern abgelöst wurde. Seit Jahrzehnten nutzen Banken und Versicherungen Konsumenten- und Unternehmensdaten, um die Kreditwürdigkeit einzuschätzen oder Versicherungsbeiträge zu berechnen. Auch im Marketing werden seit jeher Adress- und Verhaltensdaten gehandelt und für personalisierte Werbung eingesetzt, was in den letzten Jahren bekannterweise viele Kontroversen ausgelöst hat. Das „Data not invented here“-Syndrom ist dennoch real: Einerseits legen Unternehmen mehr Vertrauen in die Qualität ihrer internen Daten, andererseits müssen sie dafür nicht zahlen. Sprich, externe Daten liegen außerhalb der eigenen Kontrolle und sind ein Kostenfaktor, können aber ein starker Wettbewerbsvorteil sein.
Wie kommt das?
Das Nutzungspotenzial von externen Daten ist bei Weitem noch nicht ausgeschöpft: Die Fülle an und Reichhaltigkeit von verfügbaren externen Daten explodiert und übersteigt bei Weitem das verfügbare Volumen an internen Daten. Durch die Nutzung von Big Data-Technologien wie Hadoop, Spark, Kafka, oder in-memory Datenbanksystemen wie SAP HANA sind Unternehmen heute erst in der Lage mit riesigen Datenmengen umzugehen und mit Machine/Deep Learning „intelligente“ Voraussagen für ihr Geschäft zu treffen. Diese neuen Fähigkeiten befeuern den Hunger auf Daten, der nicht mehr ausschließlich mit internen Daten zu stillen ist.
Auf welche externen Daten ist der Appetit besonders groß?
Ich schätze, dass global mit dem Handel von Daten um die 60 bis 70 Milliarden US Dollar pro Jahr umgesetzt werden. Davon entfallen zirka 30 Milliarden US Dollar auf unternehmensbezogene Daten von Platzhirschen wie „Thomson Reuters“, „Bloomberg“ oder „Dun & Bradstreet“, rund 20 Milliarden US Dollar auf personenbezogene Daten für Marketingzwecke und der Rest auf weitere Datentypen, wie zum Beispiel Abverkaufdaten aus Kassensystemen, die vor allem im Bereich Fast Moving Consumer Goods/Consumer Packaged Goods (FMCG/CPG) genutzt werden. Viele KI-Startups fragen uns heute nach vielen weiteren Datentypen, wie etwa annotierte Bilddaten, um ihre Algorithmen zu trainieren. In Zukunft werden meiner Meinung nach maschinenbezogene Daten, sprich IoT/Sensor-Daten, die größten Umsatztreiber für den Datenhandel darstellen.
Geliefert werden diese Daten von professionellen Datenanbietern?
Richtig, der Bärenanteil an externen Daten stammt von Unternehmen, deren Kerngeschäft das Aggregieren und Vertreiben von Daten ist. Aber auch Unternehmen, deren primärer Geschäftszweck nicht der Handel mit Daten ist, sind immer häufiger bereit, ihre internen Daten mit nicht-konkurrierenden Firmen zu teilen und zu monetisieren. Das erhöht die Anzahl an verfügbaren Datenanbietern massiv: Wenn wir heute von Zehntausenden von Datenanbietern ausgehen, werden wir in der Zukunft wahrscheinlich mit mehreren Millionen Datenanbietern rechnen müssen. Schon heute gleicht das Finden von passenden externen Daten der sprichwörtlichen Suche nach der Nadel im Heuhaufen.
Hier kommt Datarade ins Spiel?
Korrekt! Wir helfen Unternehmen zwei Komplexitäten in den Griff zu bekommen. Da ist einerseits die externe Komplexität: Der Datenmarkt ist extrem unübersichtlich und intransparent, oft fehlt das notwendige Vertrauen zwischen Datenkäufern und -verkäufern. Wo finde ich passende externe Daten? Sind die Daten qualitativ hochwertig? Zahle ich einen fairen Preis für die Daten? Was ist das Datenschutz-Risiko, Stichwort DSGVO? Auf der anderen Seite existiert die interne Komplexität: In globalen Unternehmen werden heute durch Abteilungen und Länder hinweg Daten eingekauft, ohne dass ein standardisierter Prozess dafür existiert. Das führt oft dazu, dass Unternehmen viele Monate mit der Suche nach externen Daten verschwenden, oder auch sehr häufig mehrere Abteilungen dieselben Daten kaufen. Mit Datarade geben wir diesen Unternehmen ein mächtiges Software-System in die Hand, mit dem sie das externe „Datenuniversum“ leicht durchschauen, ihre gesamte externe Datenbeschaffung zentralisieren und unter Kontrolle bringen können. So können passende Datenanbieter innerhalb weniger Sekunden identifiziert werden, was sonst Monate an Experten-Recherche benötigt. Wir wurden schon häufiger als das „Tinder für Daten“ bezeichnet (lacht)…
Mit einem Wisch zu den richtigen Daten?
Fast. Viele unserer Kunden haben noch keine zentral verantwortlichen Manager für die Beschaffung von externen Daten und das Management von Datenanbieter-Beziehungen. Daher bieten wir zusätzlich zu unserem Software-System sogenannte „Managed-Services“ und Management-Beratung zur externen Datenstrategie. Kunden, die schon weiter sind, können unser System im Self-Service-Modell nutzen. Aus unseren Gesprächen mit Chief Data Officers (CDOs) haben wir herausgefunden, dass das zentrale Management von externen Daten ein an Bedeutung wachsendes Mandat für CDOs ist. Wir bestreiten diesen Weg gemeinsam mit unseren Kunden, da wir unser System in enger Zusammenarbeit mit ihnen entwickeln.
Ein Aspekt im Hinblick auf Daten ist der Schutz vor Missbrauch. Wie gehen Sie damit um?
Datenschutz ist sowohl für die Datenanbieter als auch Datenkäufer auf unserer Plattform ein extrem wichtiges Thema. Spätestens mit dem Inkrafttreten der DSGVO sind sich Unternehmen über die Risiken einer nicht-konformen Nutzung von personenbezogenen Daten bewusst: Es können Bußgelder bis zur Höhe von 20 Millionen Euro oder vier Prozent des globalen, jährlichen Umsatzes verhängt werden, je nachdem was höher ausfällt.
Obwohl es keine 100-prozentige Sicherheit zum Thema Datenschutz gibt, können wir Datenkäufern zumindest dabei helfen Datenanbieter zu identifizieren, die sich ernsthaft mit Datenschutz beschäftigen und Mechanismen anbieten um Datenschutz-Konformität zu wahren.
Klingt nach großen Plänen für ein so junges Unternehmen. Was ist Ihr Erfolgsrezept?
Wir drei Mitgründer ergänzen uns sehr gut bei unseren Fähigkeiten und haben schon einiges über die letzten Jahre gesehen: Wir haben in verschiedenen großen Unternehmen wie Siemens, IBM, T-Systems, oder Daimler, aber auch Startups gearbeitet und Teams aufgebaut. Auch in der Datenindustrie bringen wir langjährige Erfahrungen mit. Im Aufbau von Datarade achten wir auf drei Dinge: Erstens wollen wir Spaß bei der Arbeit haben und persönlich wachsen. Zweitens sind wir extrem umsetzungsorientiert und experimentieren viel, um schnell zu lernen. Drittens legen wir sehr viel Wert auf Mitarbeiter-Recruiting – je stärker unser Team, desto höher unser Erfolgspotenzial. Und zu guter Letzt werden wir durch ein starkes Netzwerk von Investoren, Advisors und Mentoren wie das Hasso-Plattner-Institut (HPI) und der SAP.io Foundry und Techstars Accelerator unterstützt.
Alle drei Partner befinden sich in Berlin. Was macht diesen Standort so attraktiv?
Für uns ist Berlin Heimat, wir sind hier geboren und aufgewachsen, haben unser Netzwerk hier. Kämen wir aber aus einer anderen Stadt, wäre unser erster Impuls vermutlich gewesen, mit Datarade nach Berlin zu gehen. Attraktiv ist der unglaubliche Zugang zu Talenten. Damit meine ich nicht nur diejenigen, die aus Berlin kommen, sondern auch internationales Talent, für das Berlin ein attraktiver und beliebter Lebensstandort ist. Wenn wir zum Beispiel Programmierer suchen, bekommen wir zu 80 Prozent Bewerbungen aus Nordafrika, Europa, den USA, England... der ganzen Welt. Unsere Immigrationsgesetze ermöglichen auch dieses Talent an Bord zu holen. Dazu kommt die Nähe zu den vielen Universitäten und Hochschulen, unser CTO kommt etwa vom Hasso-Plattner-Institut. Außerdem hat Berlin die aktivste Venture-Capital-Szene in Deutschland, ein Softwareunternehmen zu bauen ist kapitalintensiv. Viele Tech-Startups sind hier angesiedelt, man stützt sich gegenseitig, tauscht Kontakte aus, das Persönliche ist durch Nichts zu ersetzen. Das hat schon San Francisco groß gemacht. Diese selbsterfüllende Prophezeiung gilt auch für Berlin: Wenn ich ein Tech-Unternehmen gründe, dann muss ich hierher, um erfolgreich zu sein. Das Netzwerk wird durch jede/n neue/n Gründer/in stärker.
Apropos Erfolg: Wie soll Datarade 2020 aussehen?
Natürlich wollen wir weiterhin wachsen und ein starkes Team, Produkt und Geschäft aufbauen. Für große Unternehmen und Datenkäufer wollen wir DAS zentrale „Gateway“ für das Universum von externen Daten sein, mit dem man nicht nur Datenanbieter finden und evaluieren, sondern auch konstant externe Datenflüsse auf Kosten, Nutzen, Qualität und Datenschutz prüfen kann.
Vielen Dank für das Interview.