Wie hoch ist die Arbeitslosenquote in Deutschland? Wie viele Beschäftigte gibt es? In welchen Berufen arbeiten die Menschen und wie hoch ist deren Verdienst?
Fragen, die unsere Bürgerinnen und Bürger, Regierung, Unternehmen und Medien beschäftigen. Dabei sind der Komplexität und dem Detailierungsgrad dieser Fragen keine Grenzen gesetzt; exakte Genauigkeit und Aktualität sind stets vorausgesetzt.
Um diese Fragen zu beantworten benötigen wir Daten. Und diese Daten liegen bei uns im IT-Systemhaus in einem der größten Data Warehouses (DWH) der deutschen IT-Landschaft.
Unser Business Intelligence der Bundesagentur für Arbeit beinhaltet:
Mehr als 90 Terabyte
Mehr als 60.000 Datenbank-Tabellen
Mehr als 600 Milliarden Datensätze im DWH
Mehr als 1.200 Dimensionen im DWH
Täglich erhalten wir Datenlieferungen aus unterschiedlichen Organisationen des Sozialversicherungssystems. Diese meist unterschiedlich strukturierten, heterogenen Rohdaten bereiten wir in unserer Ladeschicht auf, legen sie historisiert ab, berechnen aggregierte Kennzahlen und analysieren Daten mit modernen Machine Learning Methoden.
Unser Team besteht aus Entwicklern, Datenbank-Profis, Daten-Analysten und Data Scientists. Sie kümmern sich um die riesigen Datenströme und verarbeiten diese so, dass am Ende mehr daraus gewonnen werden kann: Themenorientierte, strukturierte Informationen; vor allem aber auch Analysen, Interpretationen und Darstellungen hinsichtlich Mengen, Verteilungen und zeitlichen Entwicklungen.
So mancher verborgene Zusammenhang oder Trend wird dadurch schnell sichtbar. In etwa die jahreszeitenbezogenen Schwankungen der Arbeitslosenquote durch Saisonarbeit. Oder die Entwicklung des Gender-Gaps; verringert sich dieser tatsächlich?
Dabei sind Zugriff und Verwendung der Daten klar reglementiert. Wir verwenden den Datenbestand pseudonymisiert und anonymisiert und folgen eindeutigen datenethischen Grundlagen.
Verwendung finden diese Daten in unterschiedlichen statistischen Einheiten und Forschungseinrichtungen. Zusätzlich betreiben wir einen Business Intelligence Self Service für Arbeitsagenturen und Jobcenter und ein Controlling-Portal für unsere internen Prozesse.
„Die steigende Fokussierung auf Daten bedeutet für mich, dass das Design leistungsstarker Datenplattformen und das Zusammenführen großer Datenströme immer mehr an Bedeutung gewinnen wird. Unserem Team macht es Spaß, aus einem Datenwust verwertbare Datenprodukte zu generieren, die am Monatsende korrekte Arbeitslosenzahlen ausweisen.“ – Claudia, Data Analystin