Data-Warehouse
 

Martina Pantelic
pantelic@hbi-stuttgart.de


Einleitung

Durch ein Data-Warehouse sollen die bislang im Unternehmen brachliegenden Unmengen von Daten und Informationen in bare Münze umgewandelt werden, indem man die Daten in diesem zentralen Datenlager sammelt, ordnet, strukturiert, die wichtigen Informationen herauszufiltern versucht und diese zu unternehmens-relevantem Wissen anreichert, so daß sie eine Wissensgrundlage bilden, auf der sich gesicherte strategische Entscheidungen fällen lassen.

Die ersten Management-Informationssysteme

Schon vor etwa drei Jahrzehnten gab es die erste Generation von Management-Informationssystemen (MIS) bzw. Führungsinformationssystemen (FIS) oder Führungs-Unterstützungssysteme (FÜS), die die Führungskräfte bei ihrer Alltagsarbeit sowie wichtigen Entscheidungen unterstützen sollten. Weitgehend aus technischen Gründen, denn nur EDV-Experten waren in der Lage die Tools wirklich auszunutzen, gelang ihnen kein Durchbruch.

Den zweiten Versuch starteten Nischenanbieter, nachdem mit dem Einzug der PCs neuer Schwung in die Fachabteilungen der Firmen kam, mit „Decision Support System“ (DSS) und „Executive Information System“ bzw. „Enterprise Informations System“ (EIS), die entscheidungsunterstützende Systeme nicht nur für die Chef-Etagen, sondern auch für die Fachabteilungen darstellten. Mit ihnen wurden schon teilweise recht komplexe Frage-stellungen – „In welcher Region haben wir mit dem Produkt A den höchsten Deckungsbeitrag erzielt?“ – per Knopfdruck beantwortet. Der Begriff „Business Intelligence“ wurde ansatzweise Wirklichkeit. Damit sind Methoden gemeint, die durch Nutzung von Daten und Datenbanken die Entscheidungsfindung verbessern sollen. Auch ohne spezifische Kenntnisse in der Datenverarbeitung konnte der Benutzer betriebswirtschaftliche Analysen durchführen. Da diese Systeme aber für das alte PC-Betriebssystem MS-DOS entwickelt wurden und es den kleinen Anbietern an der nötigen Finanzkraft fehlte sie an das neue Windows-System anzupassen, schafften auch diese nicht den Durchbruch.
 

Das Data-Warehouse

Mitte der 90er Jahren kam es nun zur dritten Generation von Management-Informationssystemen, die speziell für die Problematik der Entscheidungs-unter-stützung entwickelt wurden. Durch immer stärker werdenden Wettbewerbsdruck und sich öffnende Märkte im Rahmen der Globalisierung fanden solche Systeme immer mehr Akzeptanz. Immer mehr Verantwortungen verlagerten sich auf untere Hierarchieebenen, durch Fusionen und Zukäufe veränderte sich die Zahl der operativen Systeme schlagartig und es mußten in immer kürzeren Zeiträumen Entscheidungen getroffen werden.

Hilfe versprach das Data-Warehouse. In diesem zentralen Datenlager werden Daten:

  • gesammelt
  • geordnet
  • strukturiert
  • man versucht wichtige Informationen herauszufiltern und 
  • sie zu unternehmensrelevantem Wissen anzureichern, so daß sie eine Wissensgrundlage bilden, auf der sich gesicherte strategische Entscheidungen fällen lassen.
Davor müssen aber zwei Probleme überwunden werden:
1. Erstens gibt es in einem Unter-nehmen viele kleine Datenbanken an verschiedenen Orten und 
2. Zweitens liegen diese in unterschiedlichen Formaten, sei es als Access-Datenbank, Word- oder Excel-Datei oder gar als Zettelkasten auf dem Schreibtisch, vor. 

So gilt es zunächst die Datenquellen zusammenzufassen, die Daten in die für die Datenanalyse geeignete Form zu bringen und dem Anwender verfügbar zu machen. 

Und auch dabei hilft einem das Data-Warehouse, indem es regelmäßig Einträge sammelt, ordnet und verdichtet und sie mit beschreibenden Zusatzinformationen , sog. Metadaten, versieht.

Data-Warehouses kann man nicht als schlüsselfertige Standardlösung kaufen, da die Größe und das Konzept von der Unternehmensstruktur und den Anforderungen der Benutzer abhängig ist.

Wer aber braucht nun ein Data-Warehouse?

Nicht jedes Großunternehmen braucht ein Data-Warehouse und nicht jedes Unternehmen, das ein Data-Warehouse aufbaut, muß ein Großunternehmen sein. Uwe Hanning, Leiter des Instituts für Managementinformationssysteme, macht es an folgenden Faktoren fest:

Zahl der Kunden in Kombination mit der Zahl der Transaktionen

Ein Telekommunikationsunternehmen hat ein riesiges Datenvolumen: viele Kunden, viele Telefonate; eine Versicherung dagegen hat zwar einen riesigen Kundenstamm, aber wenig Transaktionen (normalerweise wird nur einmal jährlich die Prämie abgebucht).

Werkzeuge zur Analyse des strukturierten Datenbestandes

Bei den Werkzeugen zur Analyse des strukturierten Datenbestandes stößt man vor allem auf folgende Begriffe: OLAP (Online Analytical Processing) und DataMining.

OLAP gibt Anwort auf gezielte Fragen, indem Daten in einem multidimensionalen Würfel zusammengefaßt und dann in Berichten mit Tabellen und Grafiken angezeigt werden. Der Benutzer kann sich die Kriterien, die für ihn interessant sind, z.B. Zeit, Gebiet, Produkt etc., in dem Datenwürfel kombinieren und sich, wie in diesem Beispiel, z.B. das gewinnträchtigste Produkt ermitteln lassen.
DataMining-Tools hingegen schürfen nach unbekannten Zusammenhängen innerhalb der Unternehmensdaten und geben keine Anwort auf gezielte Fragen. Das bekannteste Beispiel ist wohl die Supermarktkette, die dadurch entdeckte, daß am frühen Abend häufig Bier und Windeln gemeinsam im Einkaufskorb landen, da sich junge Väter für ihren Einsatz für ihre Familie mit ein paar Flaschen Bier belohnen. Deshalb wurden zukünftig die Windeln neben dem Bier aufgestellt.
 
Einschub: Data-Mining
Damit bezeichnet man die Anwendung geeigneter Verfahren zur Wissensentdeckung in großen Datenbeständen und es bildet zugleich den Kern eines Prozesses, der in der Literatur als „Knowledge Discovery in Databases“ (KDD) beschrieben wird.

Die Größe der Datenbanken bewegt sich momentan so im Terabereich, was für den Menschen unüberschaubar ist und somit das Bedürfnis nach automatischen Auswertungsmechanismen wächst -> WED = WissenensEntdeckung in Datenbanken, womit ein Prozeß der Identifizierung gültiger, neuer, möglicherweise nützlicher und schließlich verständlicher Muster in Daten gemeint ist. 

Der Prozeß besteht aus 9 Phasen, die wiederum in Teilaufgaben zerfallen. Die Phasen und Teilaufgaben werden mehrfach in wechselnder Reihenfolge durchlaufen:

1. Anforderungs- und Machbarkeitsanalyse 
2. Analyse des Anwendungsgebietes
3. Datenzugriff
4. Datenvorbereitung
5. Exploration
6. Anwendung von Modellierungs- und Entdeckungstechniken
7. Interpretation und Bewertung
8. Umsetzung
9. Dokumentation und Erfahrungen
Ziele des Data Mining
  • Segmentierung 
    z.B. Kunden mit ähnlichem Kaufverhalten oder aber um einfach die Datenmenge handhabbar zu halten, die einfacher zu analysieren sind, z.B. hochwertige Warenkörbe etc
  • Klassifikation
    z.B. bei der Bank: „gute“ Kunden / „schlechte“ Kunden
  • Konzeptbeschreibung
  • Prognose
  • Datenbeschreibung und –zusammenfassung
  • Erkennung von Abweichungen
  • Abhängigkeitsanalyse

Ein aktives Data-Warehouse

Die Zukunft soll so aussehen, daß Daten und Ergebnisse aktiv an die Mitarbeiter verteilt werden, die damit Entscheidungen fällen; das reine Reporting darf nicht Hauptaufgabe des Data-Warehouse sein! „Agents“ sollen den Datenpool nach den gewünschten, vom Benutzer definierten Kriterien, durchstöbern und leiten das Gefundene an das gewünschte Medium – Drucker, E-Mail, Handy etc. – weiter. 

Uwe Hanning sieht das Data-Warehouse der Zukunft als zentrale Sammel- und Verteilerstelle für Informationen:

  • Im Internet durchforstet ein „Agent“ Nachrichten und Fachartikel nach vom Benutzer bestimmten Kriterien. 
  • Der Benutzer bewertet die gelesenen Artikel und entscheidet für wen die Nachricht noch interessant sein könnte. Er leitet den Artikel, eventuell mit eigenen Anmerkungen versehen, an seine(n) Kollegen weiter. 
Dadurch baut sich eine immer breitere Wissensbasis auf. Schließlich geht es darum, das im Unternehmen vor-handene Wissen zu erfassen, allen zugänglich zu machen, es aber auch anzureichern und all das so automatisch wie möglich. Dazu ist eine Plattform notwendig, auf der die Daten gehalten werden – das Data-Warehouse.

Daten – Information – Wissen – Aktion

Man sagt, die Data-Warehouse-Wertschöpfungskette besteht aus vier Elementen:
Daten – Information – Wissen – Aktion.
Es ist sehr schwierig von der einen auf die jeweils andere Ebene zu gelangen, besonders schwierig wird der Schritt verstanden, aus Information Wissen zu gewinnen. Wolfgang Martin, Vice President der Meta Group, sagt: „Wissen heißt, daß Informationen von Menschen aufgenommen und verstanden werden ... Aber erst die Anwendung des gewonnen Wissens, die Umsetzung in Aktion, rechtfertigt letztlich erst die hohen Kosten und die Anstrengung für den Aufbau eines Data-Warehouse.“

Beispiel: Das Data-Warehouse bei TUI

„Tufis“, das für „TUI-Führungs- und Informationssystem“ steht, heißt das Data-Warehouse bei TUI. Dort lagert das gesamte Datankapital von TUI (Informationen über 18 000 Unterkunfts-objekte, 1,4 Mio Flüge pro Jahr sowie 36 Mrd Kombinationen aus Flügen und Unterkünften, Hotelkontingente, Zielgebietsinformationen, Preise, Auslastungen etc.). Auf jede Frage kann Tufis Antwort geben, so daß man sich bei der Produktplanung nicht mehr nur auf das Wissen und das Gefühl eine Planers verlassen muß, sondern statt dessen verläßt man sich nun auf harte Daten, die einem Tufis liefert. 
Dank Tufis konnte man in der Produkt-planung einen echten Qualitätssprung verbuchen. Denn ein Jahr vor Saisonbeginn werden dort alle relevanten Daten zur Analyse gesammelt, um die Angebote optimal der aktuellen Nachfrage anzupassen. Früher hatte man dafür mit einem „Bettenbuch“ gearbeitet.

In den 70er Jahren begann man die Karteikästen und Bettenbücher durch operative Systeme abzulösen. Dabei handelte es sich jedoch um Insellösungen, die mit unterschiedlichen Begriffen, Definitionen und Abfragemechanismen arbeiteten. Die Kenntnis aller Dateninhalte und deren Interpretation war auf wenige Köpfe beschränkt. Damals galt der gesamte Aufwand des IT-Bereichs der Beantwortung von Informationsfragen. Dennoch war das richtig ent-scheiden auf der Basis guter Information ein Ideal, das sich kaum einlösen lies. 

In den letzten fünf Jahren entstand nun das Data-Warehouse. Während dieser Zeit ist es stetig organisch gewachsen und hat sich enorm weiterentwickelt. Anfangs stand die Vision, eine konzernweit einheitliche und integrierte Informationswelt zu schaffen. Alle Beteiligten (egal ob Einkäufer, Produktplaner oder Zielgebietsagentur) sollten ohne Systemgrenzen die Informationen bekommen, die sie brauchen. Dabei stellte sich als höchste Hürde heraus, daß es für Manager nur schwer vorstellbar war, Unternehmenswissen zu teilen. Nachdem dem Projekt zugestimmt worden war, wurde eine Bedarfsanalyse aller Fachbereiche durchgeführt, um herauszufinden, welches die wirtschaftlich relevanten Daten waren, wo die Interessen lagen etc.. Anschließend wurde daraus ein Bauplan mit eindeutigen Systemdefinitionen, der es den Entwicklern ermöglichte, das System zu erstellen.

Heute ist nun, sobald der Kunde im Flieger sitzt, das gesamte von ihm gekaufte Produkt in seiner Gesamtheit bereits abruf- und darstellbar, in Form von Daten, die in Tufis gespeichert sind. 

Unter anderem gehen die Daten auch in das augeklügelte Prognosesystem ein und werden damit zu neuen Informationen. Da die Eckdaten für Erfolg oder Mißerfolg nicht nur von TUI selbst, sondern auch von äußeren kaum einflußbaren Faktoren (Unwetter, Erdbeben, Großereignisse etc.) gesetzt werden, wurde ein Prognosesystem integriert, das sich nicht nur auf die Daten der hauseigenen operativen Systeme verläßt, sondern auch externe Informationen nutzt, z.B. Änderung der Nachfrage nach Drei-Sterne-Hotels relativ zur Gesamtnachfrage. Ebenso wurde Tufis um eine „Ampelfunktion“ erweitert: grün heißt Buchungsverlauf wie geplant, gelb heißt Vorsicht! und bei rot ist Alarm angesagt. So liegt die Planungsaktualität bei TUI bei derzeit 60 Tagen, was noch laut zuständiger Abteilung noch zu verbessern ist. 

Alles in allem ist das Data-Warhouse, das mit der Menge und Qualität der Daten sowie der intelligenter Verknüpfung steht und fällt, bei TUI nicht mehr wegzudenken!

Literatur
  • LiteraturBelow, Christine von: Das Data Warehouse – Ordnung im Datenlager. In: Spezialreport Wissensmanagement: Wie deutsche Firmen ihr Wissen profitabel machen. Hrsg.: C.H. Antoni, T. Sommerlatte. Düsseldorf: Symposium Publishing 1999, S. 103 - 108
  • Markowski, Roland: Alles im Blick: Vom Management- und Executive-Informations-system zum Data-Warehouse. Computerwoche Spezial, 1999, Nr. 2 („Produktivkraft Wissen“), S. 26 - 27
  • Diestel, Michael: Vom Data-Warehouse in die Sonne, schöne Ferien mit Tufis. Sonder--ausgabe 25 Jahre Computerwoche vom 12. November 1999, München,       S. 108 - 110
© Martina Pantelic