Das Data Warehouse des IT-Systemhaus der BA

Das Data Warehouse (DWH) des IT-Systemhauses ist eines der innovativsten und größten Data-Warehouses in der deutschen IT-Landschaft. Gemeinsam stellen wir mit unserem DWH aktuelle Statistiken, Kennzahlen und interaktive Dashboards über den Arbeitsmarkt zur Verfügung.

IT-BAsics: Was ist ein Data Warehouse?

Data Warehouse (DWH)

Ein Data Warehouse ist eine zentrale Datenbank, die Daten aus mehreren Quellen in einem einheitlichen Datenspeicher zusammenführt. Im Gegensatz zu einer herkömmlichen Datenbank ermöglicht ein Data Warehouse die effiziente Analyse riesiger Datenmengen. Künstliche Intelligenz und Machine Learning bringen die Datenanalyse in neue Dimensionen in Bezug auf Automatisierung und Interaktion der verfügbaren Daten.

Big Data: Von Daten und Antworten

Wie hoch ist die Arbeitslosenquote in Deutschland?
Wie viele Beschäftigte gibt es?
In welchen Berufen arbeiten die Menschen und wie hoch ist deren Verdienst?

Fragen, die unsere Bürgerinnen und Bürger, Regierung, Unternehmen und Medien beschäftigen. Dabei sind der Komplexität und dem Detailierungsgrad dieser Fragen keine Grenzen gesetzt; exakte Genauigkeit und Aktualität sind stets vorausgesetzt.

Um diese Fragen zu beantworten benötigen wir Daten. Und diese Daten liegen bei uns im IT-Systemhaus in einem der größten Data Warehouses (DWH) der deutschen IT-Landschaft.

Unser Business Intelligence der Bundesagentur für Arbeit beinhaltet:

  • Mehr als 90 Terabyte
  • Mehr als 60.000 Datenbank-Tabellen
  • Mehr als 600 Milliarden Datensätze im DWH
  • Mehr als 1.200 Dimensionen im DWH

So arbeitet unser Data Warehouse

Täglich erhalten wir Datenlieferungen von den IT-Verfahren in den Agenturen und Jobcentern. Weitere Datenlieferanten sind die Träger unseres Sozialversicherungssystems, wie Kranken- oder Rentenversicherungen.

Diese meist unterschiedlich strukturierten, heterogene Rohdaten werden zunächst in einer Ladeschicht gesammelt. Über Transformationen werden die Daten in der DWH-Schicht strukturiert, verdichtet sowie Kennzahlen berechnet. So werden gemeldete Arbeitslose beispielsweise nach Berufsgruppen sortiert, auf Stadt-, Land- oder Bundesebene zusammengefasst und entsprechende Arbeitslosenquoten berechnet. Die Analyse der Daten erfolgt schließlich in der Auswerte- oder Präsentationsschicht über Reports und Dashboards.

Unser Team besteht aus

  • Entwicklern
  • Datenbank-Profis
  • Daten-Analysten
  • Data Scientists

Sie kümmern sich um die riesigen Datenströme und verarbeiten diese so, dass am Ende mehr daraus gewonnen werden kann: Themenorientierte, strukturierte Informationen. Vor allem aber auch AnalysenInterpretationen und Darstellungen hinsichtlich Mengen, Verteilungen und zeitlichen Entwicklungen.

Tatsächlicher Trend oder flache These

Mit diesem Vorgehen machen wir Trends sichtbar. Beispiele dafür sind u.a.

  • die jahreszeitenbezogenen Schwankungen der Arbeitslosenquote durch Saisonarbeit
  • die Entwicklung des Gender-Gaps - verringert sich dieser tatsächlich?

Dabei sind Zugriff und Verwendung der Daten klar reglementiert und folgen eindeutigen datenethischen Grundlagen.

Verwendung finden diese Daten in unterschiedlichen statistischen Einheiten und Forschungseinrichtungen. Zusätzlich betreiben wir einen Business Intelligence Self Service für Arbeitsagenturen und Jobcenter und ein Controlling-Portal für unsere internen Prozesse.

Statistik für Alle - Unsere Berichte zum deutschen Arbeitsmarkt

Du willst das Potenzial unseres Data Warehouses selbst erleben? In unserem Statistik-Portal findest du spannende Statistiken, Analysen und Berichte über den Arbeitsmarkt in Deutschland.

Zum Statistik-Portal

Weitere Themen des IT-Systemhaus der BA