„Daten sind das neue Öl“ – das Zitat aus dem „Economist“ von 2017 fasst hervorragend zusammen, um was es bei der Digitalisierung geht: Daten aller Art werden im Internet der Dinge (Internet of Things, IoT) und seiner professionellen Version, dem Industrial IoT oder IIoT erhoben, verteilt, veredelt und für die unterschiedlichsten Zwecke genutzt. Daten ermöglichen neue Geschäftsmodelle und neue Dienstleistungen. Doch wem gehören die Daten, wer verdient daran, wer darf sie nutzen? Eine dreiteilige Serie informiert zum Nutzen aggregierter Daten, zur Gleichberechtigung von Datennutzer und -lieferant und zur Datensparsamkeit im IoT.
Das Internet der Dinge ist unvorstellbar groß. Die Zahl der Geräte, die mit dem Internet verbunden sind, steigt sprunghaft an, ebenso die von ihnen erzeugten und verschickten Daten. Das Statistische Bundesamt in Wiesbaden verzeichnete im Jahr 2014 den gesamten Datenverkehr im Internet mit 40 Mio. Terabyte, 2019 waren es schon 140 Mio. TByte. Im Jahr 2022 sollen es schon 270 Mio. TByte sein. Ein großer Teil dieser Steigerung geht auf das Konto der Kommunikation zwischen Geräten, also des Internets der Dinge.
Vom GPS-Signal zur Rentabilität eines Verkehrsunternehmens
Dieses Internet der Dinge verteilt sich auf eine Vielzahl von Geräten und Einsatzszenarien. Ein Beispiel aus dem öffentlichen Bereich ist die Stauerkennung von Google. Jedes Android-Gerät sendet ständig Standortdaten an Google. Legt das Unternehmen diese Standorte und ihre Bewegung über eine Karte, erkennt man nicht nur, welche Geräte und deren Besitzer aktuell in einem Fahrzeug mitfahren, sondern auch, wie schnell die Fahrzeuge sich fortbewegen.
Damit lässt sich nahezu in Echtzeit der Verkehrsstatus jeder Straße der Erde berechnen und in Google Maps abrufbar machen – übrigens reicht hier eine anonyme Datenerfassung völlig aus, Google muss nicht wissen, wer auf der Straße unterwegs ist, sondern benötigt lediglich eine genügende Menge an Geräten, um für einen Streckenabschnitt valide Daten zu erzeugen.
Die Daten lassen sich jedoch noch tiefer auswerten und durch Verknüpfung mit anderen Daten anreichern. Aus der Geschwindigkeit, dem Bewegungsmuster und weiteren Informationen wie den Positionen der Haltestellen und dem Fahrplan sollte sich recht sicher erkennen lassen, ob ein Gerät in einer Straßenbahn unterwegs ist oder im Auto daneben.
Google könnte so beispielsweise Auslastungsprofile der Verkehrsbetrieb erzeugen, bei negativer Betrachtung ließe sich so einerseits die Rentabilität jeder ÖPNV-Verbindung berechnen und an Konkurrenten des Anbieters verkaufen. In Pandemiezeiten ließe sich andererseits eine App programmieren, die auf Basis der Auslastung berechnet, wann man eine weniger volle Straßenbahn benutzen kann, um das Infektionsrisiko zu minimieren. Oder eine App, die die Verspätung jedes ÖPNV-Fahrzeugs genau erfasst und anzeigt.
An dem Beispiel lassen sich mehrere wichtige Merkmale von Daten zeigen:
- Daten sind einzeln oft wenig hilfreich, erst die Kumulierung von Datenpunkten bringt den Wert: Ein einzelnes Smartphone auf einer Straße erlaubt kaum eine Aussage, viel Smartphones lassen sehr präzise Schätzungen zu.
- Daten werden durch Verknüpfung wertvoller: Mit dem Fahrplan verknüpft, lassen sich den Bewegungsspuren weitere Eigenschaften zuordnen, beispielsweise „sitzt in der Straßenbahn“, was wiederum weitere Rückschlüsse ermöglicht. Je mehr zusätzliche Eigenschaften solch ein Datensatz bekommt, desto wertvoller ist er – beispielsweise um das Leben des Besitzers minutiös nachzuverfolgen.
- „Fast-Echtzeit“ ist oft ein Wert an sich – veraltete Staudaten nutzen nichts mehr für die Verkehrsleitung, lassen sich aber natürlich in anderen Zusammenhängen nutzen.
- Die Erhebung, Verknüpfung und Nutzung von Daten ist erst einmal neutral – was der Nutzer der Daten aus den Erkenntnissen macht, kann moralisch oder aus Datenschutzgesichtsgründen fragwürdig sein. Datensicherheit ist darum extrem wichtig.
Serie Daten sind Gold wert Teil 2: Datenerhebung muss allen nutzen – Datenlieferant und Datennutzer.