09/11/2018

TDWI Schweiz 2018 – Von Small Data, Data Vaults und Cloud DWHs - Ein kurzer Rückblick

Data Analytics ist in der BI Welt angekommen – Big Data dagegen ist zumindest als Schlagwort out. Small Data scheint jetzt die Expertenmassen anzuziehen, auch wenn sich mir die Tragweite dieses Begriffs trotz Keynote und Wikipedia verschlossen bleibt.

Wenn das Data Analytics Thema in den letzten Schweizer TDWI Kongressen noch eher akademisch angegangen wurde, so hat es spätestens dieses Jahr seinen festen Platz erhalten. Doch Data Analytics steckt in der Schweiz weiterhin in den Kinderschuhen, das zeigen die Beiträge. Der amerikanische und asiatische Kontinent ist uns leider in der Umsetzung meilenweit voraus. Da nützt es auch wenig, wenn gesammelt gegen Google zum Thema «Persönlicher Datenschutz» in der Fragerunde geschossen wird.

Bemerkenswert ist: Konventionelles Data Warehousing erfährt eine Renaissance über die Themen Data Vault/DWH Automation. Ich, der in den letzten Jahren neben Big Data Technologien den Kimball Ansatz vertreten hat (da für KMU’s meistens ausreichend, agiler und einfacher umsetzbar), sehe zugegeben etwas verspätet den Data Vault Ansatz für DWH’s grösserer Firmen nutzbar. Der Data Vault Builder hilft hier, ein DWH agil aufzubauen, nur der Data Vault Layer wird persistent abgespeichert.

Aber auch das Thema DWH in der Cloud setzt sich durch: Eindrücklich ist, wie Scout 24 ganz Abstand vom herkömmlichen DWH nimmt, da hier die Strukturen immer komplexer und aufwändiger wurden. Neu wird ein reiner Cloud Ansatz gefahren. Daten werden in der AWS S3 (Blob Storage) abgespeichert und von Analysten über Hive Metastore zugänglich gemacht. Über den Data Catalogue (Alation) werden die Daten dann auch gefunden. Das ist ein einfacher Big Data Ansatz (ohne Hadoop) und hoch skalierbar. Die User sollen im Self Service Prinzip Ihr Ad Hoc Reporting ausführen. Damit das möglich ist, gibt es eine Gruppe von Data Engineers, Data Analysten und Data Scientists, die die Vorbereitungsaufgaben ausführen. Das bisherige relationale DWH soll wirklich abgestellt werden (kleine Einschränkung: reines finanzielles und Sales Reporting werden weiterhin separat geführt). Macht dieser Ansatz nicht mehr Sinn, als komplexe Big Data Strukturen aufzubauen, um dann über einen automatisierten kommerziellen Plattformansatz wiederum zu umsetzbaren Lösungen zu kommen?

Auf der SAP Seite wird über S/4Hana/SAP Analytics Cloud und die «embedded» Planing und BW Komponenten die analytische Welt einfacher, hurra! Solange die Legacy Systeme dann auch abgestellt werden können. Hierzu gab es in mehreren Vorträgen positiven Input.

Als Fazit der Konferenz besteht bei mir weiterhin das Gefühl, das Experten sich stark spezialisieren müssen, um die allgemeine Komplexitätszunahme in der Datenwelt zu verkraften.

Und zu einer Sache möchte ich noch etwas schreiben: Für Nicht-Experten wird die Begriffswelt in der Welt der Daten wirklich immer unübersichtlicher. Da brauchen wir nicht auch noch Small Data, Smart Data kann ich gerade noch akzeptieren. Denn schliesslich brauchen wir Daten nur, um darauf aufbauend die Welt smarter zu machen und smartere Entscheidungen zu treffen.

Die Entscheidung, an diese Konferenz gegangen zu sein, war für mich eine smarte Entscheidung, danke an das TDWI für die Datengrundlage zu diesem kurzen Rückblick.