„Daten sind das neue Öl“ – das Zitat aus dem „Economist“ von 2017 fasst hervorragend zusammen, um was es bei der Digitalisierung geht: Daten aller Art werden im Internet der Dinge (Internet of Things, IoT) und seiner professionellen Version, dem Industrial IoT oder IIoT erhoben, verteilt, veredelt und für die unterschiedlichsten Zwecke genutzt. Daten ermöglichen neue Geschäftsmodelle und neue Dienstleistungen. Doch wem gehören die Daten, wer verdient daran, wer darf sie nutzen? Eine dreiteilige Serie informiert zum Nutzen aggregierter Daten, zur Gleichberechtigung von Datennutzer und -lieferant und zur Datensparsamkeit im IoT.
Wie Datensammlung und -auswertung aus dem Ruder laufen können, zeigt eine recht bekannte Anekdote: Im Zusammenhang mit IoT und Big Data werden immer wieder Konzepte bemüht, bei denen alle IoT-Zustandsdaten erst einmal in einen gigantischen Data Lake gespeist werden, in dem wiederum eine KI nach Erkenntnissen fischt, die der Betreiber ursprünglich gar nicht gesucht hat. Belegt wird die Sinnhaftigkeit dieses Konzepts gerne mit der Anekdote, dass eine KI bei Walmart auf Basis der gesammelten Einkaufsdaten plötzlich vorhersagen konnte, dass Frauen schwanger sind, bevor diese es selbst wussten.
Eine kurze Recherche fördert einen Forbes-Artikel von 2012 zutage, in dem die Geschichte richtiggestellt wird: Zunächst geht es nicht um Walmart, sondern um die zweitgrößte Drogeriekette der USA, Target. Dann war es keine KI, sondern der bei Target angestellte Statistiker Andrew Pole, der genau nach Anzeichen suchte, schwangere Kunden zu erkennen, um diese mit entsprechenden Gutscheinen in die Filialen zu locken. Und er fand tatsächlich heraus, dass Schwangere sehr früh auf geruchsarme Körperpflege umsteigen und später Nahrungsergänzungsmittel kaufen – zu relativ gut bestimmbaren Zeitpunkten der Schwangerschaft. So ließ sich aus den Daten nicht nur die Schwangerschaft an sich, sondern sogar ein relativ genauer wahrscheinlicher Geburtszeitraum extrahieren.
Als Target diese Erkenntnis anwandte und personalisierte Couponhefte versandte, gab es sehr schnell Fälle, in denen das Drogerieunternehmen mehr wusste als seine Kunden. Nahe Minneapolis stürmte der Vater eines Teenagers in eine Target-Filiale und stauchte den Filialleiter zusammen, wie dieser dazukomme, seiner Tochter Coupons für Babykleidung zuzusenden. Es stellte sich schnell heraus, dass der Teenager tatsächlich schwanger war und dies dem Vater verschwiegen hatte. Das Konzept war ein völliger Misserfolg, weil die Kunden nicht gerade positiv darauf reagierten, dass Target von der Schwangerschaft wusste. Schließlich mischte Target thematisch unabhängige Rabatte in die personalisierten Couponhefte hinein und die Kunden nahmen die Angebote an – weil sie nicht mehr merkten, wie gläsern sie tatsächlich waren.
Die beiden Versionen der Geschichte lassen sich gut auf IoT und die industrielle Anwendung übertragen.
- Erstens macht es wenig Sinn, in großen Datenmengen nach Mustern zu suchen, wenn man nicht weiß, nach was man sucht. Mit einer gut definierten Anforderung lassen sich tatsächlich Erkenntnisse aus solche einem Data Lake gewinnen – beispielsweise bestimmte Vibrationsmuster, die ein erstes Anzeichen für einen Lagerschaden sind.
- Zweitens sollte man mit den gewonnenen Daten sorgsam umgehen. Industrieunternehmen haben sicher mindestens genau so viel Angst vor Datenverlusten wie Väter vor Teenagerschwangerschaften. Datensparsamkeit und Transparenz sind entscheidend für ein nachhaltig gutes Verhältnis zum Kunden.
- Drittens sollten – wie bei jedem Geschäftsabschluss – beide Seiten etwas gewinnen. Ein erfolgreiches datenbasiertes Geschäftsmodell sorgt nicht nur dafür, dass der Hersteller Erkenntnisse gewinnt, sondern auch dafür, dass der Kunde von der IoT-Anwendung profitiert – sei es durch mehr Effizienz oder Uptime oder auch durch mehr Transparenz in der Nutzung der Maschinen.