Data Warehouse in der Cloud – geht das überhaupt?

Als ich anlässlich einer Diskussion auf der DOAG Konferenz im November 2011, also vor gut anderthalb Jahren, auf meine Einschätzung zum Thema Cloud und Data Warehouse angesprochen wurde, war meine Antwort: „Ich kann mir in absehbarer Zeit nicht vorstellen, dass Data Warehouse Lösungen in einer Cloud betrieben werden.“

Einige der wichtigsten Gründe, die mich damals zu dieser Aussage bewogen haben, waren:

  • Die Integration aller Daten eines Unternehmens in einem Enterprise Data Warehouse stellt eine kritische Menge an Informationen dar. Im Prinzip sollten alle relevanten Daten in einem solchen Data Warehouse vorliegen. Damit stellt es den Datenpool dar, der am intensivsten gegen unberechtigten Zugriff geschützt werden muss. Zum Stand der damaligen Diskussion konnte ich mir nicht vorstellen, dass ein Data Warehouse außerhalb der Unternehmens-IT oder des bevorzugten Outsourcers lokalisiert sein könnte.
  • Die schiere Größe, in der Regel mehrere Terrabyte, und die täglich zu ladenden Datenmengen, die bei einer externen Lösung über die Netze zu transportieren sind, machten nach meinem dafürhalten eine Cloud für ein Data Warehouse unpraktikabel.
  • Regulatorische Vorgaben durch den Gesetzgeber machten und machen es in manchen Branchen unmöglich, Daten außerhalb des Unternehmens, des Landes oder der Europäischen Union zu speichern und zu verarbeiten. Bei den meisten Cloud Anbietern handelte es sich um US-amerikanische oder indische Unternehmen, die ihre Cloud Center in der USA oder Indien betreiben. Dies hätte bedeutet, dass die Daten das Hoheitsgebiet der EU verlassen und dann ggf. nicht mehr unter EU Recht fallen. Die USA könnten z.B. bei der Gefahr von Geldwäsche oder Terrorismus, die in ihrem Land gespeicherten Daten, beschlagnahmen bzw. auswerten.

Wie sehr hat sich das Thema Cloud seitdem geändert? Zurzeit erleben wir die ersten Cloud basierten Data Warehouse Lösungen! Woran liegt dass? Haben sich die Rahmenbedingungen so sehr geändert, oder werden die Risiken heute anders bewertet? Von beidem sicher etwas.

Die Cloud Technologie hat den Nutzerkreis von Data Warehouse Lösungen um den mittleren und kleinen Mittelstand erweitert. Diesem Kreis von Unternehmen waren bisher klassische Data Warehouse und BI-Lösungen zu aufwendig und zu teuer. Mittlerweile gibt es eine Reihe von Unternehmen, die entsprechende Lösung als Cloud basierte Services anbieten.

Diese sind aufgrund der guten Kosten/Nutzen Bilanz auch für kleinere Unternehmen attraktiv. Vor allem der Mietaspekt spielt hier eine große Rolle. BI-Aktivitäten können jederzeit an das laufende Geschäft zu überschaubaren und festen Kosten angepasst werden. Damit erhalten kleine Unternehmen Zugang zu modernen Data Warehouse Lösungen und können so ihre Wettbewerbsfähigkeit steigern. Der Schutzbedarf der Daten wird bei diesen Unternehmen in der Regel weniger kritisch gesehen.

Die Einführung der sogenannten „Private Cloud“ entkräftet hier das Argument der geringeren Datensicherheit und der Lokalisation der Daten an einem fremden Ort. Bei einer „Private Cloud“ handelt es sich um eine Cloud, die durch einen Cloud Anbieter, an einem vom Kunden definierten Ort, für diesen exklusiv betrieben wird. Dadurch erlangt der Kunde alle Vorteile, die eine Cloud mit sich bringt,

  • Kostenkontrolle
  • Kein eigenes Spezial Know How
  • Schnelle Teilhabe an innovativen Hard- und Software-Entwicklungen
  • etc.

behält aber die alleinige Hoheit über den Ort, an welchem seine Daten gespeichert werden. Es werden damit die regulatorischen Hindernisse beseitigt. Es muss nicht mehr befürchtet werden, dass die Daten im Ausland in „falsche Hände“ gelangen.

Dadurch, dass immer mehr Cloud basierte Applikationen von Unternehmen genutzt werden, fällt zunehmend das Argument bezüglich der zum Data Warehouse zu transportierenden großen Datenmengen weg. Wenn meine Daten in der Cloud erzeugt werden, dann kann ich sie auch beim gleichen Cloud Anbieter in mein Data Warehouse integrieren lassen, ohne sie aufwendig über externe Netze zu versenden. Ebenfalls entschärft der zunehmende Netzausbau die Situation, wobei es nach wie vor noch Regionen gibt, die eine so schlechte Anbindung haben, dass generell eine Cloud Nutzung nicht möglich ist.

Der aktuelle Megatrend „Big Data“ forciert den Betrieb von Cloud basierten Data Warehouse und BI-Lösungen. Die hierbei vorhandene Notwendigkeit extrem große Mengen an unstrukturierten Daten zu scannen und realtime in nutzbare Information zu verwandeln, führt zu einer Aufteilung der damit verbundenen Arbeit.

Es macht z.B. keinen Sinn, Terrabyte an Facebook-Daten erst ins eigene System zu übernehmen und dann zu verarbeiten. Vielmehr wird der Weg dahin gehen, dass der Anbieter bzw. der Erzeuger der Daten nach Kundenvorgaben diese Daten filtert und aufbereitet und nur die Ergebnisse weiterleitet. Darüber hinaus werden sich zunehmend Anbieter etablieren, die eine dezidierte, hoch spezialisierte Verarbeitung der „Big Data“ Daten in ihren Systemen als Service anbieten. Es wird in diesem Umfeld also zu einer verteilten Cloud kommen.

Als Fazit kann man festhalten, die Cloud hat mittlerweite die Domäne der Data Warehouse und BI-Lösungen erreicht. Allen anfänglichen Bedenken zum Trotz, haben sich praktikable Vorgehen entwickelt, die die Vorteile einer Cloud und die besonderen Datenschutz-Notwendigkeiten eines Data Warehouse in sich vereinen.

Es gibt heutzutage immer weniger Gründe auf einen Einsatz von Cloud Technologien in diesem Umfeld zu verzichten!

Das könnte Sie auch interessieren

Bleiben Sie informiert:

its-people hilft Ihnen...

Weitere Blogthemen: