Data Quality Solutions

Ihre Entscheidungen sind nur so gut wie die zugrundeliegenden Daten. Durch die Verdichtung von Analyse-Daten können sich Fehler sogar noch potenzieren. Entsprechend wichtig ist eine sorgfältige Aufbereitung Ihrer Stamm- und Bewegungsdaten.

Die grundlegenden Anforderungen von Datenqualität werden für den Fall von BI-Lösungen durch den ETL-Prozess beschrieben, lassen sich aber ebenso losgelöst von einer Data Warehouse-Lösung für einen einzelnen DQ-Prozess verwenden. Wir zeigen Ihnen wichtige Ansätze für die Beurteilung und Steigerung der Datenqualität.

Transformation

Die Transformation beschreibt den Brückenschlag zwischen unterschiedlichen Datenquellen und -zielen. Zeitgleich findet ein Mapping zwischen Datenquelle und Ziel statt. Beide Prozesse fallen je nach Herkunft der Daten sehr unterschiedlich aus. In relationalen Datenbanken findet vornehmlich eine Transformation und Mapping verschiedener Sichten statt. Bei semi- und unstrukturierten Daten werden hingegen überwiegende Strukturen transformiert und gemappt.
Unsere Experten kennen sich mit den Datenbanken aller großen Hersteller aus und helfen Ihnen auch bei schwierigen, funktionsbasierten Transformationen. Des Weiteren kennen wir uns auch in semi- uns unstrukturierten Datenbeständen bestens aus: seien es unsaubere EDI-Daten Ihrer Zulieferer oder die Integration von komplexen Vertragsdokumenten - wir beherrschen auch exotische Daten.

Integation

Bei der Integration wird ein gemeinsames Datenschema erstellt. Hierbei sind viele Besonderheiten der Ursprungs- und Zieldaten zu berücksichtigen, wie Datenequivalenzen, überlappende Attribute und unterschiedliche Kodierungen. Auch müssen Bestandsdaten und Bewegungsdaten klar voneinander abgrenzbar sein. Ebenso gilts es, Schlüsselattribute eindeutig zu identifizieren bzw. neu zu erstellen.
Hierbei gibt es viel zu beachten, was nur durch eine langjährige Erfahrung mit ETL-Prozessen möglich ist.

Cleanup

Bei der Bereinigung von Daten dreht sich alles um das Auffinden und Beheben syntaktischer Fehler und unvollständigen Datenbeständen. Um diesen Prozess zu Automatisieren findet ein Matching mit anderen Datenbeständen statt, sowie die Definition von Default-Werten und gemeinsamen Integritätsregeln.
Hierbei gilt: die Bereinigung ist nur so stark, wie die zugrundeliegenden Algorithmen, die zudem individuell für jeden Kunden/Einsatzzweck angepasst bzw. verfeinert werden müssen. Wir bieten Ihnen ein breites Portfolio von Cleanup-Lösungen um eine bestmögliche Bereinigung Ihrer Daten gewährleisten zu können.

Updating

Um die Daten letztendlich in die Zieldatenbank zu laden, bedarf es geeigneter Strategien, um den operativen Betrieb möglichst nicht zu beeinflussen. Hierzu bedarf es geeigneter Lade-Strategien, wie beispielsweise parallele und inkrementelle Lade-Vorgänge. Ebenso müssen Vorbereitungen für die nahtlose Indexierung und Sortierung Ihrer Daten getroffen werden, um später eine effiziente Analyse oder Weiterverarbeitung gewährleisten zu können.
Auch hier zählt vor allem Knowhow: jede Ziel-Datenstruktur und -Datenbank ist für Load-Operationen anders zu behandeln. Ein umfangreiches Wissen in diesem Bereich ist daher ein Muss für unsere Berater.

Indexierung und Meta-Daten

Mit dem Ladevorgang in die Zieldatenbank ist noch nicht Schluss. Nach dem erfolgreichen Import muss dafür gesorgt werden, dass auch die Weiterverarbeitung nahtlos funktioniert. Ebenso muss sichergestellt werden, dass zukünftige Load-Operationen die Datenqualität nicht negativ beeinflussen. Hierzu werden Meta-Daten geschrieben, die die Herkunft der Daten belegen und die angewendeten Transformations- Integrations-, und Cleanup-Prozesse beschreiben. Ebenso werden Informationen bezüglich Aktualität und Gültigkeit der Daten gespeichert.
Neben der Generierung der Meta-Daten wird die letztendliche Indexierung der Daten angestoßen, die für eine schnelle und konsistente Wiederauffindbarkeit der Daten sorgt.
In dieser Phase ist es besonders wichtig, die vorher definierten betriebswirtschaftlichen Ziele der IT-Strategie mit einem geeigneten DV-Konzept umzusetzen. Keinesfalls dürfen die aufwändig extrahierten Quelldaten losgelöst von den beabsichtigten Analyse-Zwecken gespeichert werden. Hierzu bedarf es folglich auch eines großen Wissens über die Analyse-Möglichkeiten im Bereich der Business Intelligence.

 

Die hier formulierten Aspekte der Datenqualität beschreiben allgemein die Herausforderungen, die potenziell entstehen können. Natürlich kann eine solche Beratung niemals losgelöst von den beabsichtigten Einsatzzweck und der Branche erfolgen. Wir bieten Ihnen daher maßgeschneiderte Lösungen für Ihre Unternehmung - Sprechen Sie uns an!

Kontakt

woman-with-phone

Haben Sie Fragen zu unseren Lösungen? Interessieren Sie sich für ein spezielles Thema?
Unsere Berater nehmen gerne mit Ihnen Kontakt auf.
 
Aktuelle Seite: Home Themen Data Quality Solutions

Share on: