Ist von IoT die Rede, geht es zumeist um Vernetzung, um die Smartness von Dingen und um das Potenzial, auf der Basis von Daten bessere Entscheidungen zu treffen. Doch wie genau dieses moderne Datenmanagement und die entsprechend zugrunde liegende Infrastruktur auszusehen haben, ist noch weitgehend offen. Nachfolgend wird das Datenmanagement in zehn entscheidenden Dimensionen beleuchtet, damit die smarte Welt von morgen entstehen kann.
Quelle: Pete Linforth auf Pixabay
1. Dimension: Datenstruktur
Metadaten – strukturierte Beschreibungen von Informationsressourcen – werden in IoT-Umgebungen angesichts von deren hochkomplexen und verteilten Architekturen immer schwieriger zu sammeln und darzustellen sein. Metadaten können in den «Dingen» selbst gehalten werden, was einen vollständig zentralisierten Ansatz für das Metadatenmanagement unpraktisch oder unnötig macht. Darüber hinaus wird die Erfassung von Metadaten über neue Datentypen (Sensor-, Geräte- und Maschinendaten) zu einer Herausforderung.
Unternehmen stehen vor der Aufgabe, zu erkennen, wie sie diese neuen Datentypen im IoT-Umfeld auf bestehende IT-Systeme abbilden können. Eine Lösung sind Datenkataloge, die die Metadaten über die in IoT-Szenarien üblichen Datenbestände hinweg verwalten, indem sie es den Geschäftsanwendern ermöglichen, Metadaten zu inventarisieren, zu dokumentieren, zu analysieren und gemeinsam zu nutzen sowie ein gemeinsames Metadaten-Repository zu erstellen.
2. Dimension: Datenspeicherung
Mit den von IoT-Lösungen erzeugten Datenmengen können bestehende Speicheransätze schnell überfordert werden. Darüber hinaus gibt es mit den für die meisten IoT-Lösungen erforderlichen hochverteilten Architekturen viele Orte, an denen Daten generiert, und viele Plattformen, auf denen Daten verarbeitet werden (einschliesslich Edge-Geräte, Gateways, Cloud und traditionelle Unternehmensumgebungen).
Neben dem, dass eine stärker verteilte Datenarchitektur unterstützt werden muss, sind auch proaktivere Ansätze anzuwenden, um zu bestimmen, welche Daten wo und wann gespeichert werden sollen. Die Art der IoT-Lösungsarchitektur (thing-centric, mobile-centric, gateway-centric, Cloud-centric oder Enterprise-centric) wird die Wahl der Speicherorte beeinflussen.
3. Dimension: Datenpersistenz
Das IoT katapultiert den Bedarf nach alternativen Formaten und Strukturen für die Datenpersistenz auf eine neue Ebene. Bei Lösungen für die Schwerindustrie beispielsweise, bei denen Tausende von Sensormesswerten pro Sekunde erfasst werden müssen, oder bei verbraucherbezogenen Lösungen, bei denen Millionen von Menschen beim Gebrauch der «smarten Dinge» ständig Daten generieren, besteht mit traditionellen Persistenzansätzen die Gefahr von Performance-Engpässen und Latenzen. Neuere Persistenzmechanismen (wie Hadoop- und NoSQL-DBMSs) oder spezialisierte Datenspeicher, die Raum- und Zeitseriendaten unterstützen, können erforderlich sein, um das Tempo und Volumen der IoT-Daten zu bewältigen.
4. Dimension: Dateneingabe
Die steigende Nachfrage nach der Erfassung von Datenstreams aus der Vernetzung der Dinge fordern die aktuellen Integrationsmöglichkeiten der meisten Organisationen heraus. Sowohl der «always-on»-Modus einiger IoT-Datenquellen (z. B. Sensoren an 24/7 laufenden Fertigungsanlagen) und die unvorhersehbare Verfügbarkeit anderer. (z. B. die periodisch angeschlossenen Sensoren an verschiedenen Endgeräten) erzeugen unterschiedliche Paradigmen.
Traditionelle Datenintegrationstools und Architekturen mit mengen- und chargenorientierten physischen Datenflüssen sind nicht geeignet hierfür. IoT-Daten sind nach ihren Eigenschaften – ob Streaming, ereignisorientiert oder gelegentlich – zu klassifizieren und die Infrastruktur für die Datenintegration entsprechend aufzurüsten.
5. Dimension: Datenintegration und Datentransformation
Das Repertoire der Datenintegration muss um Echtzeit-Daten und um Fähigkeiten zur Ereignisverarbeitung, zur Analyse der aufgenommenen IoT-Datenströme und zur Filterung nach Ereignissen und Interessenmustern erweitert werden. Der tatsächliche Wert der IoT-Daten wird realisiert, wenn sie mit anderen Daten kombiniert werden, um einen umfassenderen analytischen Einblick zu ermöglichen, eine Handlung zu bewirken oder den Wert anderer Informationsbestände zu erhöhen. Um dieses Ziel zu erreichen, müssen neue Integrationsanforderungen spezifiziert werden.
6. Dimension: Datenbewegungen
IoT-Lösungen basieren auf einem nahtlosen, schnellen und zuverlässigen Informationsfluss über alle erweiterten Komponenten einer IoT-Architektur hinweg. Unternehmen, die an IoT-Initiativen arbeiten, müssen festlegen, wie sich die Daten vom «Ding» zum Gateway, zur Cloud, zur Unternehmensanwendung und darüber hinaus bewegen. Dies erfordert die Unterstützung mehrerer Kommunikationsprotokolle und -formate und die Anpassung an neue Schnittstellentypen und APIs.
7. Dimension: Datenqualität
Daten werden im IoT zwar durch Dinge erzeugt, darunter sind aber auch solche Dinge, die an kritischen Infrastrukturen oder sogar am Menschen funktionieren wie etwa Smart Healthcare Devices. Es muss sichergestellt sein, dass die Daten in ihrem Kontext vertrauenswürdig sind. Hierfür müssen die Qualitätsstufen, die für bestimmte Bereiche erforderlich sind, identifiziert und die Arten von potenziellen Datenqualitätsfehlern identifiziert sowie ein Regelwerk an Qualitätskontrollen aufgesetzt werden.
8. Dimension: Data Privacy und Datensicherheit
Verbraucherorientierte IoT-Lösungen (z. B. vernetzte Häuser und Fahrzeuge) sammeln und verarbeiten oft Daten über Verhalten, Lebensstil, Standort, Gesundheit und andere persönliche Eigenschaften ihrer Eigner und Nutzer. Der Datenschutz und die Sicherheit solcher Daten müssen bei IoT-Lösungen an erster Stelle stehen. Tracking, Verschlüsselung und Zugriffskontrollen auf sensible Daten müssen in die Datenmanagement-Infrastruktur an allen Stellen integriert werden, an denen IoT-Daten erzeugt, gespeichert, verarbeitet und bereitgestellt werden. Doch auch im industriellen Kontext müssen die IoT-Datenrisiken nach einer Reihe von Kriterien unter Einbezug von rechtlichen, Governance- und Risikomanagement-Richtlinien bewertet werden.
9. Dimension: Skalierung
Das IoT bringt ein enormes Wachstum an Datenmengen hervor, die verwaltet werden müssen. Vielen aktuellen Datenmanagement-Infrastrukturen fehlt die Verarbeitungskapazität und die Flexibilität für die erforderliche Skalierung. Ohne Cloud Computing ist IoT undenkbar. Das gesamte Informationsmanagement muss sich einheitlich über alle Plattformen der geplanten IoT-Lösung erstrecken und «mitwachsen» können.
10. Dimension: Datenverarbeitung
Viele IoT-Geräte werden leistungsfähig genug sein, um selbst anspruchsvolle Berechnungen mit den von ihnen erzeugten Daten durchzuführen und Daten lokal zu verarbeiten, um autonomes Verhalten zu gewährleisten. Die Datenmanagementinfrastruktur muss in der Lage sein, eine zuverlässige Verteilung und Konsistenz der Geschäftsregeln sicherzustellen, die auf alle Daten auf allen Plattformen und Geräten angewandt werden. Die Ausübung dieser Regeln muss zudem permanent überwacht werden.
Die Vielzahl an Dimensionen, mit denen das Datenmanagement im Zeitalter von IoT konfrontiert ist, machen deutlich, dass bestehende Infrastrukturen nur bedingt zukunftsfähig sind. Vielen Unternehmen, die sich bereits als «IT-getrieben» wahrnehmen, ist noch nicht ganz bewusst, was im Zuge der Datenexplosion auf sie zukommt. Daten zu erheben, zu klassifizieren, zu bewerten und Mehrwert aus ihnen zu ziehen, geht Hand in Hand mit dem Aufbau einer entsprechenden Datenmanagement-Infrastruktur.
Inspiration, Wissen, Praxistipps
Mit klarem Fokus auf Digital Business erscheint das topsoft Fachmagazin vierteljährlich. Fachartikel, Hintergrundberichte, Marktübersichten, Fallstudien und Praxistipps bieten Ihnen einen echten Mehrwert bei der Kreierung, Planung und Umsetzung digitaler Konzepte.