Große Datenmengen schnell und flexibel auswerten
DAPI (Verein Deutsches Arzneiprüfungsinstitut e.V.) sondiert mit Data Warehouse Datenschätze
Der Verein Deutsches Arzneiprüfungsinstitut e.V. (DAPI) ist ein gemeinnütziger, eingetragener Verein, der mittels Datenanalysen und statistischen Methoden einen Beitrag zur Arzneimittelversorgung in Deutschland leistet. Ziel seiner Arbeit ist es, Fehlentwicklungen in der Arzneimittelversorgung – sei es Unter-, Über- oder auch Fehlversorgung – aufzudecken und Lösungsvorschläge zu erarbeiten. Dies geschieht mit Hilfe von Berichten, Analysen und Studien, die sich mit der pharmakoökonomischen und pharmakoepidemiologischen Prüfung und Bewertung von Arzneimitteln sowie allgemeinen Fragen der Arzneimittelversorgung beschäftigen. Zu den Fragestellungen, die an den Verein herangetragen werden, zählen auch Analysen und Auswertungen zu aktuellen gesundheitspolitischen Fragestellungen. Ebenso unterstützt das DAPI wissenschaftliche Studien in Form von Kooperationen mit führenden Universitäten, zum Beispiel in Frankfurt und Utrecht. Finanziell getragen wird der Verein von 31 der insgesamt 34 bundesdeutschen Apothekerkammern und -verbänden auf Landesebene sowie etwa 1.000 Einzelmit-gliedern, hauptsächlich Apothekeninhabern.
Seine Daten erhält das DAPI bundesweit von kooperierenden Apothekenrechenzentren, die GKVVerordnungsdaten im ambulanten Bereich monatlich zur Verfügung stellen. Mit seinen gegenwärtigen Datenlieferungsverträgen deckt das DAPI schon mehr als 80 Prozent aller niedergelassenen Apotheken in Deutschland ab. „Diese breite Datenbasis ermöglicht es uns, valide Aussagen für Deutschland und alle Bundesländer zu treffen. Jedoch sind wir bestrebt, dies noch auszuweiten, um eine hundertprozentige Abdeckung zu erreichen“, so Diplom-Mathematikerin Alexandra Franzmann, Referentin für Statistik beim DAPI.
„Aus datenschutzrechtlichen Gründen bekommen wir selbstredend nur anonymisierte Informationen. Der Patient erhält eine stets gleiche Nummer, aus der weder Geburtsdatum, Geschlecht noch Adresse hervorgehen. Bei den Apotheken ist uns nur das Bundesland und beim verordnenden Arzt Fachrichtung und Bundesland bekannt. Aus diesen Informationen können wir zum Beispiel erschließen, was pro Patient verordnet wurde und können so Therapieprofile über die Zeit beobachten“
Inflexibilität behindert Auswertungen
Anfangs hat eines der Rechenzentren, von dem Daten geliefert werden, sämtliche Daten gesammelt und in Form von Berichten aufbereitet. Diese waren monatlich und quartalsweise nach bestimmten Kriterien, wie Bundesland, Absatz/Umsatz nach Arzneimitteln, Kassenarten, aber auch nach Arzneimittelgruppen und Klassifizierung aufgeschlüsselt. „Mit der Zeit erwiesen sich diese Berichte jedoch als deutlich zu inflexibel. Es gab Fragestellungen, die mit den vorgefertigten Berichten einfach nicht exakt beantwortet werden konnten. Zudem hatten die Berichte stets einen gewissen Zeitverzug“, so Franzmann. Ein weiterer problematischer Punkt war die Bereitstellung in Form von Excel-Dateien auf CD, die nicht überall optimal genutzt werden konnten – sei es, weil das Programm in einer Organisation gar nicht vorhanden war oder weil die Anwendung zu komplex war.
„Vor allen Dingen störte uns die Inflexibilität, also, dass wir nicht selber auf unsere Daten zugreifen konnten. Wir wussten ja, dass wir über viel mehr Daten verfügen als wir in den Berichten bekamen. Wir hatten sozusagen einen Datenschatz, aber wir saßen auf der Schatztruhe und der Schlüssel dazu gehörte uns nicht“, bringt es Franzmann auf den Punkt.
Daher fiel der Entschluss, ein eigenes Data Warehouse aufzubauen, um selbstständig, zeitnah und flexibel Analysen erstellen zu können. Als Ergebnis einer Ausschreibung wurde das Beratungsunternehmen DATA MART mit Sitz in Hamburg und Neu-Isenburg mit ins Boot geholt. „Das Unternehmen überzeugte durch sein Know-how hinsichtlich der Implementierung eines Data Warehouses in Kombination mit dem bei uns gefragten fachlichen Hintergrund“, kommentiert Prof. Dr. Martin Schulz, Geschäftsführer Pharmazie des DAPI.
Schnell und flexibel, auch bei riesigen Datenmengen
Das Data Warehouse ist seit Anfang 2008 produktiv im Einsatz. „Wir sind hier fünf Analysten und mit der Leistung hoch zufrieden. Das Warehouse arbeitet mit einer Schnelligkeit, die unsere Erwartungen in vollem Umfang erfüllt. Wir haben nun die gewünschte Flexibilität und können uns alles so zusammenstellen, wie wir das benötigen. Mittelfristig denken wir bereits über eine Aktualisierung und Erweiterung nach, da sich schon zeigt, dass die Kapazitäten anhand der riesigen Datenmengen, die jeden Monat auflaufen, an die Grenzen geraten“, so Franzmann. Die Datenbank umfasst mittlerweile über 5 Mrd. anonymisierte Verordnungen und wächst jährlich um etwa 500 bis 600 Mio. Einträge. Pro Monat werden etwa 50 bis 55 Mio. Arzneimittelpackungen verordnet, deren Informationen eingespeist und verwaltet werden wollen.
Überzeugende Technologie von Oracle
Von der technischen Seite her entschied man sich beim Aufbau des Data Warehouse für eine Lösung von Oracle. Die Basis bildet eine Datenbank dieses Anbieters. Mit dem OWB (Oracle Warehouse Builder) wurden sowohl Daten- als auch Prozessmodell graphisch aufgebaut und während der Entwicklung bis hin zur Visualisierung des kompletten Datenflusses dokumentiert. Die Oracle Workflow-Komponente verknüpft Logiken und steuert den Datenfluss. Die Funktionalität des Partition Exchange Loading bot dabei die Möglichkeit, die Verarbeitung der großen Ladevolumina automatisiert und weitgehend frei von Datenbankadministrator-Aufgaben zu verwirklichen. Der Datenzugriff selbst erfolgt über den kostenfreien SQL Developer von Oracle. „Da wir als Verein mit unserem Budget sehr sorgfältig umgehen müssen, sind wir hier vom Ausgaben-Nutzen-Verhältnis her bestens bedient“, so Franzmann. Der SQL Developer wird für Analysten für spontane Abfragen und Ad-hoc-Analysen eingesetzt, während Oracle Reports das Werkzeug für die Erstellung der Standardberichte ist.
Hervorzuheben ist die Artikeldimension mit acht Hierarchien, wie Rezeptpflichtigkeit, ATC-Code etc. Die Hierarchien werden bei der Verdichtung bis in die Data Marts hinein verwendet, so dass die Fakten mundgerecht und komplett vorverdichtet sind. Die Monate können unabhängig voneinander geladen werden, da die Kumulierung erst im letzten Schritt von Oracle Reports während der Generierung des Berichtes vorgenommen wird. Zusätzliche Stammdaten wie Gruppierungen der Ärzte oder Regionen werden in separaten Tabellen innerhalb eines maßgeschneiderten Pflegemoduls auf Basis von Application Express gepflegt. Alle Daten durchlaufen zur Qualitätssicherung, Automatisierung und Vermeidung von Fehlern stets dieselben Schritte.
Für die Datenhaltung und -sicherung wurde eine Architektur mit Produktionsserver und identischem Fallbackserver aufgebaut. Die nächtliche Synchronisation läuft automatisch – ebenfalls wartungsfrei. Eine Besonderheit ist auch die Datenbereinigung. Dabei werden die Daten nur einmal gelesen und dann innerhalb eines SQLStatements mehrfach auf unterschiedliche Fehler untersucht. Die Fehler werden jeweils klassifiziert und die guten Daten jeweils in die Zieltabellen durchgeladen und die schlechten in Fehlertabellen abgelegt, die dann gesondert dokumentiert werden.
Das Data Warehouse ist funktional skalierbar und bietet somit Potential für weitere Standard-Berichte oder auch Langzeitstudien. Zudem ist es gut gerüstet für neue Anforderungen, die aufgrund von Gesetzesänderungen und Erweiterungen der Anforderungen, z.B. mit der Patientenkarte, aller Voraussicht nach auf das Institut zukommen werden.
Zufriedene Nutzer
Neben den Ad-hoc-Abfragen stellt das DAPI seinen Mitgliedern heute monatlich standardisierte Auswertungen zur Verfügung. Hierzu wurde auf der Website des Vereins (www.dapi.de) ein geschützter Bereich eingerichtet, in dem die Berichte über – eine Voll-textsuche recherchierbar – als PDF zum Herunterladen bereitgestellt werden. Dieser Medienwechsel von Excel zu PDF hat bei den Mitgliedern für sehr große Zufriedenheit gesorgt. Die Standardberichte werden nun wesentlich häufiger genutzt, da die PDFs ganz einfach betrachtet und ausgedruckt werden können.
„Wir sind auch deswegen sehr zufrieden, weil wir jetzt nicht mehr nur Analysen auf Monatsbasis als schnellstmöglichem Zeitraum, sondern tagesgenaue Analysen erstellen können. Den Erfolg kann man auch an den Zahlen ablesen. Die kurzfristigen Anfragen haben sich seit der Einführung des Data Warehouse massiv vermehrt und wir werden von unseren Mitgliederorganisationen intensiv genutzt. Auch externe Anfragen, die dem Satzungszweck entsprechen – z.B. von den Medien zu gesundheitspolitischen Fragen – können wir jetzt besser und deutlich schneller bearbeiten. Dies erforderte auch, neue Mitarbeiter einzustellen. Insgesamt sind das wirklich ganz große Vorteile und wir können uns heute nicht mehr vorstellen, ohne das Data Warehouse mit unseren Daten zu arbeiten“, so das Resümee von Franzmann.