Mit Cloud-Architektur zum "Master of Data"
Nachbericht "Modern Data Stack Conference EMEA 2021"
Von der Cloud-Revolution zur Datendemokratisierung
Autor: Tobias Knieper, Marketing Lead DACH, Fivetran
Die kürzlich veranstaltete "Modern Data Stack Conference EMEA" von Fivetran hatte live und on-demand mehr als 1.100Teilnehmer. Unternehmen und Experten aus dem Data-Analytics-Umfeld berichteten von den technischen Herausforderungen mit denen Data Engineers, Datenanalysten und Data Scientists konfrontiert sind sowie ihren Erfahrungen beim Einsatz eines Modern Data Stacks.
"Daten werden bald so einfach und zuverlässig zugänglich sein, wie Strom aus der Steckdose." Mit dieser Hypothese startete die virtuelle Live-Konferenz an der Datenexperten aus ganz Europa teilgenommen haben. Im Mittelpunkt der Diskussion stand, wie sich mit einem einheitlichen, Cloud-basierten Data Stack die Datenanalyse für jeden zugänglich machen lässt. Nathan Spohn, VicePresident EMEA bei Fivetran führte in seiner Keynote aus, wie die Cloud-Technologie, gemeinsam mit einer automatisierten Datenintegration und Cloud Data Warehouses, die Entwicklungen in der Datenanalyse vorantreibt.
Die automatisierte Datenintegration erlaubt es Unternehmen, Daten aus nahezu jeder Quelle mühelos zu zentralisieren. Cloud Data Warehouses bieten zudem kostengünstige Speicher und dynamisch skalierbare Rechenleistung. Moderne Business-Intelligence-Tools machen es einfach, Ergebnisse aus Analysen zu teilen und Geschäftsanwender unternehmensweit dazu zu befähigen, selbst Erkenntnisse aus Daten zu generieren. Gemeinsam mit drei führenden Experten im Datenbereich - Bob Muglia, Unternehmer und ehemaliger CEO von Snowflake, Alex Biller, VP of Platform bei Snowflake und Magnus Carlsson, Head of Innovation bei Capgemini - diskutierte Nathan Spohn über die Veränderungen und die Zukunft von Data Stacks.
Mit Cloud-Architektur zum "Master of Data"
Bob Muglia thematisierte den großen technologischen Fortschritt und betonte, wie sehr die begrenzten Skalierungsmöglichkeiten in der On-Premise-Welt Unternehmen behinderten: "Die Daten wurden in Silos abgelegt, weil der Prozess einfach nicht das unterstützte, was die Datenanalysten damit vor hatten."
Für Muglia gehören diese Kernkomponenten in einen modernen Data Stack:
• Data Warehouse oder andere Destination in der Cloud
• Automatisierte Data Pipeline zum einfachen Extrahieren aus unzähligen Datenquellen
• Tools zur Datentransformation
• Datenvisualisierungs- oder Business Intelligence-Tool
Angesichts der wachsenden Datenmengen ist für Alex Biller von Snowflake der Modern Data Stack mit zum wichtigsten Tool geworden. Vor der Einführung von Cloud Data Warehouses versuchten Unternehmen mit zusätzlichen Data Lakes und Data Marts gegen die hohen Kosten und fehlende Skalierung anzukämpfen. Cloud-basierte Datenanalyse bietet ein einfaches Back-to-Basic-Konzept. Biller empfiehlt Tools, die intuitiv zu bedienen und Teil eines eng integrierten Data Stacks sind: "Ein Modern Data Stack hat nur einen Code-Satz. Er ist einfach zu bedienen und funktioniert für sämtliche Datenquellen in einem Unternehmen. Die Daten sollen buchstäblich auf Knopfdruck synchronisiert werden können und in Minutenschnelle für Analysen zu Verfügung stehen."
Alle Keynote-Speaker sind der Überzeugung, dass der Modern Data Stack neue Geschäftsmodelle vorantreiben und weitere Marktchancen bieten wird. Magnus Carlsson von Capgemini erwartet zudem, dass deutlich mehr Unternehmen ihre Daten in Zukunft monetarisieren werden können.
Von der Legacy-Architektur zum Modern Data Stack
Im Fireside Chat diskutierten die Gastreferenten Jonas Rashedi, Bereichsleitung Data Intelligence und Technologies beider Parfümerie-Kette Douglas, gemeinsam mit Jonathan Rankin, Product Manager, Data Design und Data Tech bei Guardian News und Media sowie Pete Williams, Director of Data und Online beim Verlag Penguin Random House, über die Umstellung von Legacy-Architekturen zum Modern Data Stack – sowie über die Hürden und ihre Erfahrungen.
Jonathan Rankin gibt Datenteams diese drei wesentlichen Ratschläge:
1. Data Governance priorisieren
Ein großer Teil seiner Arbeit bei Guardian News and Media bestand darin, Daten zu nutzen, um den Umsatz von The Guardian, einer der angesehensten Zeitungen Großbritanniens, zu steigern. Dies beinhaltete verschiedene Produkte mit mehreren Datensätzen, manchmal in unterschiedlichen Clouds und Formaten. "Uns wurde ein Data Lake hinterlassen, den ich manchmal als Datensumpf bezeichne", soRankin. "Es gab sehr viele Daten – undokumentiert, keine Definitionen, keine Eigentümer. Wenn Mitarbeiter auf die Daten nicht zugreifen und verstehen können, verlieren sie an Wert. Hätte man vor fünf Jahren Data Governance ernst genommen, wäre alles viel einfacher gewesen."
2. Daten als Produkt betrachten
Rankin rät, Daten als Produkt zu betrachten, das von verschiedenen Abteilungen des Unternehmens genutzt werden kann. Dem stimmte auch Jonas Rashedi von Douglas zu: "Wir sollten es anderen Mitarbeitenden ermöglichen, die Daten für ihre Erkenntnisse zu nutzen, anstatt die zentrale Abteilung zu sein, die Daten sammelt und daraus Erkenntnisse für sie ableitet."
3. Buy-In des gesamten Unternehmens erhalten
Des Weiteren empfiehlt Rankin, so schnell wie möglich auch die Zustimmung der Entscheidungsträger zu Projekten einzuholen: "Nicht nur von den Endnutzer, sondern auch die Stakeholder im Unternehmen. Ziel ist es eine Vision zu vermitteln und alle im Unternehmen an Bord zu holen, weil das nicht immer ein schneller Prozess sein wird." Auch Pete Williams von Penguin betonte, wie wichtig es sei, die Geschäftsführung von der Bedeutung des Modern Data Stacks zu überzeugen. Sein Motto ist "Klein anfangen, schnell skalieren".
Data Literacy als Teil der Unternehmenskultur
Alle drei Gastreferenten des Fireside Chat betonten, wie wichtig es sei die Datenkompetenz unternehmensweit zu fördern. Jonathan Rankin argumentierte, dass von jedem neuen Teammitglied ein Grundverständnis an Datenkompetenz vorausgesetzt werden sollte: "Es geht nicht darum die SQL-Programmiersprache zu beherrschen, sondern darum die vorhandenen Daten, egal ob in einem Diagramm oder in einer Tabellenkalkulation, interpretieren zu können." Pete Williams ergänzte: "Jeder muss ein gewisses Maß an Datenkompetenz aufweisen, sonst bleiben die bereitgestellten Informationen ungenutzt."
Jonas Rashedi, der Douglas bei der Umstellung von einer Einzelhandelskette zu einem datengetriebenen digitalen Marktplatz vorangetrieben hat, befürwortet schrittweise Maßnahmen: "Als erstes muss man sich auf die Grundlagen, Data Governance und Data Literacy konzentrieren, danach auf die Mitarbeiter und die Unternehmenskultur. Eine regelmäßige Kommunikation in Form von wöchentlichen Meetings oder auch Workshops ist dabei essenziell. "Führungskräfte setzen ihre Datenteams manchmal unter Druck mit dem Einsatz neuer Technologien wie Machine Learning so schnell wie möglich große Resultate zu erzielen. Rashedi rät sich erst mitkünstlicher Intelligenz und Machine Learning zu befassen, wenn die Basis dafür geschaffen ist.
Den größten Vorteil eines Modern Data Stacks sehen alle drei Daten-Experten in der schnelleren Automatisierung und Skalierung. Wenn möglich solle man sich von On-Premise verabschieden und zügig in die Cloud umziehen. (Fivetran: ra)
eingetragen: 05.07.21
Newsletterlauf: 05.10.21
Fivetran: Kontakt und Steckbrief
Fivetran automatisiert alle Arten von Data Movement im Zusammenhang mit Cloud-Datenplattformen. Das gilt vor allem für die zeitaufwendigsten Teile des ELT-Prozesses (Extract, Load, Transform) - von der Extraktion von Daten über das Handling von Schema-Drifts bis hin zu Daten-Transformationen. Damit können sich Data Engineers auf wichtigere Projekte konzentrieren, ohne sich um die Data Pipelines kümmern zu müssen. Mit einer Up-Time von 99,9 Prozent und sich selbst reparierenden Pipelines ermöglicht Fivetran Hunderten von führenden Marken weltweit, darunter Autodesk, Lionsgate und Morgan Stanley, datengestützte Entscheidungen zu treffen und so ihr Unternehmenswachstum voranzutreiben. Fivetran hat seinen Hauptsitz in Oakland, Kalifornien, und verfügt über Niederlassungen auf der ganzen Welt.
Der deutschsprachige Markt wird aus dem Büro in München betreut. Zu den Kunden in Deutschland zählen DOUGLAS, Hermes, Lufthansa, Siemens, VW Financial Services und Westwing. Weitere Informationen unter www.fivetran.com.
Kontaktdaten
Fivetran
Luise-Ullrich-Straße 20
80636 München, Deutschland
E-Mail: hallo[at]fivetran.com
Webseite: https://fivetran.com/de
Dieses Boilerplate ist eine Anzeige der Firma Fivetran.
Sie zeichnet auch für den Inhalt verantwortlich.
Lesen Sie mehr:
Fivetran erweitert Partnerschaft mit Snowflake
Datenautobahn ohne Stau für die Logistik
Nutzung von KI- und Generative-KI-Technologien
Data Lake Management automatisiert und vereinfacht
Daten sind Basis für alle Formen der KI
Schlechte Datenpraktiken noch weit verbreitet
Datenbasierte Entscheidungen treffen
Datenaustausch im Unternehmen automatisieren
Reduzierte Latenzzeiten und Kosten
25 Jahre Erfahrung im SaaS-Umfeld
Fivetran sorgt für Business Insights
Kontrollierte, benutzerfreundliche Repositories
Aufbau einer soliden Data-Lake-Grundlage
Cloud Data Lake, Lakehouse oder Warehouse
Skalierbare Konnektoren und Destinationen
Fivetran als Launch-Partnerin
Prozess zur Datenintegration in BigQuery
Weniger Kosten für Neukundengewinnung
Inspirierende Führungspersönlichkeit
Anbindung an praktisch jede SaaS-Anwendung
Unterstützung von Amazon S3
Fivetran setzt Wachstum fort
Daten in Cloud- & On-Premise-Umgebungen
Fivetran: Führungsteam ausgebaut
Data Act könnte schon 2024 in Kraft treten
Mit Cloud-Architektur zum "Master of Data"
Vorteile automatisierter Datenintegration
Schwierigkeiten bei der Bereitstellung der Daten