Was ist Data Transformation?
Die Data Transformation – zu Deutsch: Datenumwandlung – beschreibt den Prozess, bei dem Daten von einem Format oder einer Struktur in ein anderes überführt werden.
In ihrer einfachsten Form geht es dabei um technische Anpassungen wie etwa die Änderung des Datentyps. Beispielsweise kann ein numerischer Wert wie „1“ in ein „Ja“ und eine „0“ in ein „Nein“ übersetzt werden. Auch einfache Zeichenbegrenzungen gehören dazu: So kann etwa nur ein Teil eines Textfelds übernommen werden – beispielsweise die ersten zehn Zeichen.
Neben technischen Konvertierungen umfasst Data Transformation auch die Anwendung einfacher Formeln. Eine häufig genutzte Rechenoperation ist zum Beispiel die Ermittlung der Gewinnmarge aus „Verkaufspreis – Deckungsbeitrag“.
Komplexere Transformationen gehen einen Schritt weiter. So können durch sogenanntes „Mapping“ Daten, die im Ursprungssystem keinen Zusammenhang haben, sinnvoll verknüpft werden. Ein Beispiel: Die geografische Position eines Kunden kann einer bestimmten Region zugeordnet werden – eine wichtige Grundlage für zielgerichtete Analysen.
Ein weiterer zentraler Aspekt ist die Datenintegration. Dabei werden Informationen aus verschiedenen Quellsystemen wie Buchhaltung oder Auftragsbearbeitung zusammengeführt. Ziel ist es, diese konsistent und gemeinsam nutzbar zu machen.
Nicht alle Daten werden dabei übernommen: Mithilfe von Filterregeln lassen sich irrelevante Informationen – wie bereits abgeschlossene Aufträge – gezielt ausschließen.
Ebenso bedeutend ist die Aggregation. Hier werden Daten verdichtet, um die Datenmenge zu reduzieren und die gewünschte Granularität zu erzielen. So lassen sich etwa einzelne Buchungspositionen zu Hauptbuchungen zusammenfassen.
Das Gegenstück dazu ist die Verteilung. Sie sorgt dafür, dass verdichtete Daten – wie etwa Planzahlen – auf detailliertere Einheiten wie Monate oder Produkte aufgesplittet werden.
Auch statistische und relative Auswertungen basieren auf Data Transformation. So lassen sich etwa Kennzahlen wie der Anteil zufriedener Kunden berechnen.
Ein besonders praxisrelevantes Feld ist die KPI-Berechnung (Key Performance Indicators). Hierbei werden aus Rohdaten aussagekräftige Leistungskennzahlen generiert – inklusive Soll-Ist-Vergleichen und Zustandsindikationen.
Nicht zuletzt ermöglicht die Datenumwandlung auch strukturelle Veränderungen. So können Daten beim Übergang ins Zielsystem in eine neue Struktur überführt werden – je nach Anforderung sogar in die umgekehrte Richtung.
Data Transformation ist aus einem professionellen Datenmanagement nicht mehr wegzudenken. Denn: Nur wer seine Daten versteht, kann fundierte Entscheidungen treffen.