3 Maßnahmen für eine verbesserte Datenqualität
Ihre Analysen sind nur so gut wie ihre Daten – steigern Sie die Qualität Ihrer Unternehmensdaten!
Mein letzter Artikel auf dem Daten-Blog beschrieb unternehmensinterne und
externe Anforderungen an Datenqualität
sowie Methoden zur Datenqualitätsmessung.Zur Weiterführung des Themas stellt dieser Beitrag Maßnahmen vor, mit denen Sie die Qualität Ihrer Unternehmensdaten steigern können.
Dr. Tobias Brockmann
Die drei wichtigsten Maßnahmen für nachhaltig verbesserte Datenqualität:
- Datenbereinigung
- Systemintegration
- Regelmäßige Datenqualitätsprüfungen
Verbesserung der Datenqualität durch Datenqualitätsmanagement
Eine reine Messung der Datenqualität ist sinnvoll, um einen ersten Überblick zu erhalten. Dies bewirkt aber noch keine Verbesserung der Datenqualität. Daher erfolgt im Anschluss an eine Datenqualitätsmessung die Behebung der Datenfehler, die Identifikation und Bekämpfung der Fehlerursachen sowie die Schaffung von organisatorischen Maßnahmen (Aufbau und Umsetzung einer Data Governance).
Dazu ist eine Kombination aus präventiven Maßnahmen, wie bspw. die Einführung von Prüfregeln zur Vermeidung von Datenqualitätsproblemen unmittelbar bei der Datenanlage oder -änderung, und reaktiven Maßnahmen, wie z. B. die Duplikatsbereinigung und Korrektur von Fehlern nötig.
In dem dazugehörigen Datenqualitätsmanagement (Data Governance) werden diese Maßnahmen konsolidiert und verankert.
Ziel ist die Ermittlung einer optimalen Kombination aus präventiven sowie reaktiven Maßnahmen, um frühzeitig Datenprobleme zu erkennen und dadurch Risiken und Kosten zu vermeiden. Wobei das langfristige Ziel einer jeden Organisation die nachhaltige Umsetzung eines präventiven Konzeptes zur Sicherung der Datenqualität ist.
1. Datenbereinigung
Reaktiver Ansatz: Datenbereinigungen sind häufig der erste Ansatz zur Wiederherstellung einer korrekten Datenbasis als Grundlage für eine Verbesserung der Datenqualität. Die Duplikatserkennung und -beseitigung spielt dabei eine entscheidende Rolle, ebenso wie der Aufbau von Prüfregeln zur Messung der Datenqualität sowie der Erfolgskontrolle nach der Bereinigung. Spezielle Softwaretools überprüfen den kompletten Datensatz und finden
Einträge, die dasselbe Geschäftsobjekt betreffen, jedoch abweichende Informationen enthalten. In einem Prozess, der sich Datenharmonisierung nennt, werden diese zu einem übergreifenden aussagekräftigen Datensatz – dem Golden Record – zusammengeführt.
Weitere typische Korrekturen sind Plausibilitätsverletzungen (z. B. muss das Nettogewicht immer kleiner sein als das Bruttogewicht eines Artikels), Füllgrade und Grenzwerte wie Minund Max-Werte (z. B. müssen Postleitzahlen aus genau fünf Ziffern bestehen, die eine Zahl zwischen 01067 und 99998 ergibt). Zusätzlich bietet es sich an, bei der Datenbereinigung direkt Formatanpassungen zur Vereinheitlichung der Datenstruktur vorzunehmen. Typische Formatanpassungen sind zum Beispiel die Nutzung von Standards für Datumsformate (z. B.TT.MM.JJJJ), Adressen (z. B. Hausnummern in eigenem Feld) oder Telefonnummern (z. B. Ländervorwahl-Ortsvorwahl-Rufnummer).
Die nachhaltige Wirkung der Datenbereinigung ist allerdings begrenzt. Im Laufe der Zeit erfährt Ihr Stammdatensatz neue Qualitätseinbußen durch die fortwährende Neuanlage und Aktualisierung von Daten durch unterschiedliche Fachabteilungen und Nutzer. Nutzen Sie also die Erkenntnisse Ihres Datenbereinigungsprozesses zur Dokumentation typischer Datenqualitätsprobleme in Ihrem Unternehmen. Auf deren Grundlage sollten Sie ein strukturiert abgelegtes Qualitätsregelwerk erstellen, das Sie für weiterführende qualitätssichernde Maßnahmen (Erfolgskontrolle) und zum Aufbau von präventiven Ansätzen (Data Governance) nutzen können.
2. Systemintegration
In den meisten Unternehmen werden die Daten, je nach Datentyp (Kundendaten, Materialdaten, Produktdaten, Debitorendaten, Kreditorendaten, u.v.m.) in mehreren Systemen (z. B. ERP-, CRM-, PIM-Systeme oder individuell aufgesetzte Datenbanken) parallel verwaltet. Wenn Sie das genutzte Datenmodell verändern, kann dies bereits positive Auswirkungen auf die Datenqualität haben. So vereinfacht zum Beispiel die Trennung von Einheit & Wert und die Normierung auf eine Größe, wie Kilogramm (kg) die spätere systemübergreifende Analyse der Datenqualität und den Aufbau von unternehmensweit gültigen Kennzahlen zur Datenqualität im Reporting.
Zusätzlich ist es ratsam, Ihre Systeme dahingehend zu optimieren, dass die Benutzung noch einfacher und intuitiver wird, indem Sie bspw. die Bezeichnung der Datenfelder anpassen, um die Verständlichkeit für alle involvierten Nutzer zu steigern. Legen Sie außerdem ein besonderes Augenmerk auf die verwendeten Schnittstellenprogramme, da die Weitergabe von Daten über die Systemgrenzen hinweg eine häufige Fehlerquelle darstellt.
Zur weiteren Verbesserung Ihrer Datenqualität ist es sinnvoll, einen zentralen Hub zu schaffen, der mit allen relevanten Systemen verbunden ist. Dort laufen alle Daten in einem Single Point of Truth zusammen. Ein hinterlegtes Datenqualitätsregelwerk kann bereits während der Eingabe automatisiert überprüfen, ob die neu hinzugefügte und bearbeitete Werte gültig sind oder ob in diesem Moment ein Duplikat erzeugt wird.
3. Regelmäßige Datenqualitätsprüfungen
Um konstant hohe Datenqualität zu gewährleisten, müssen neben der Datenbereinigung unbedingt auch Data Governance Prozesse konzipiert und umgesetzt werden. Die führt häufig auch dazu, dass Prozesse angepasst werden und dass das unternehmensweite Daten- und Qualitätsmanagement angepasst werden muss. Nur wenn die relevanten Geschäftsprozesse durch Data Governance Prozesse unterstützt werden, oder zumindest regelmäßige Datenqualit.tsprüfungen in den Geschäftsprozessen umfasst sind, können identifizierte Datenqualitätsfehler langfristig beseitigt werden.
Ein Beispiel dafür ist die Verteilung von Verantwortlichkeiten für die Datenanlage, -pflege und Qualitätssicherung. Die Datenverantwortlichen benötigen Entscheidungskompetenzen – ihre Ernennung ist also eine organisatorische Frage. Sie werden durch die fachliche Expertise der Datenstewards unterstützt. Alle Mitarbeiter, die Rollen im Datenmanagement übernehmen, müssen entsprechend geschult werden. In der Praxis hat sich diese präventive Maßnahme als äußerst zielführend erwiesen, da sie den Mitarbeitern neben technischen Hilfestellungen durch die oben genannten Systemoptimierungen bei ihrer täglichen Arbeit enorm unterstützt.
Ebenso kann in den unternehmensweiten Prozessen die regelmäßige Datenqualitätsprüfung etabliert werden. Eine permanente Überwachung lässt sich durch wiederholte Messungen der Datenqualität realisieren. Diese ermöglichen einen Überblick über die Entwicklung und aktuellen Stand der Datenqualität des Unternehmens.
Data Governance sichert langfristig höchste Datenqualität in Ihren Systemen
Um Ihre Daten über deren gesamten Lebenszyklus hinweg qualitativ zu sichern, ist die Einführung einer Data Governance notwendig. Richtlinien legen fest, welche Standards im Unternehmen Anwendungen finden und welche Zuständigkeitsbereiche die Aufgaben im Datenmanagement übernehmen. In diesem Sinne ist Data Governance das Rahmenwerk für Ihr Datenqualitätsmanagement. Sie profitieren davon, die unternehmensweite Ressource „Daten“ zielführend in Ihren Wertschöpfungsprozessen einzusetzen und fortlaufend die Datenqualität in Ihrem Unternehmen zu stärken.
Weiterführende Informationen unter:
www.innoscale.de
Quelle:
Hildebrand, Knut (Hrsg.): Daten- und Informationsqualität: Auf dem Weg zur Information
Excellence. Wiesbaden: Vieweg + Teubner. 1. Aufl. 2008.
Aufmacherbild / Quelle / Lizenz
Photo by Fitore F on Unsplash