Die Gemeinsame Agrarpolitik (GAP) der Europäischen Union spielt eine zentrale Rolle bei der Gestaltung von agrarpolitischen Maßnahmen, die die Landwirtschaft, Umwelt und ländliche Gemeinschaften beeinflussen. Die Evaluierung dieser Maßnahmen ist von entscheidender Bedeutung, um ihre Effektivität, Nachhaltigkeit und potenzielle Anpassungen zu verstehen.
Die Evaluierung der GAP 23-27 stellt die beteiligten Evaluator:innen vor neue Herausforderungen. Sowohl gestiegene Erwartungen an die Evaluierung wie auch größere Datenmengen erfordern gezielte Lösungen und Werkzeuge um aktuelle Problemstellungen effizient lösen zu können.
Die datenbezogenen Herausforderungen umfassen die Integration heterogener Datenquellen aus verschiedenen agrarbezogenen Bereichen wie Umweltdaten, sozioökonomischen Indikatoren und mehr. Diese Daten sind häufig in unterschiedlichen Formaten, Strukturen und Qualitäten vorhanden. Als Vorbereitung müssen Methoden der Datenintegration, -bereinigung und -analyse erarbeitet werden, um die Qualität, Konsistenz und Analysefähigkeit dieser Daten sicherstellen zu können.
Im Rahmen des Datenpool Projekts hat sich in der BAB ein breitgefächertes Wissen in diesen Bereichen angesammelt. Dieses Wissen, das sich unter dem interdisziplinären Begriff der Data Science zusammenfassen lässt, soll nun genutzt werden um die Evaluierung der GAP 23-27 gesetzten Maßnahmen bei ihrer Arbeit zu unterstützen.
Zielsetzung
Erstellung und Gestaltung der Architektur des GAP 23-27 Datenpools, einschließlich Konzeption und Use-Cases der Auswertungs- und Zugriffssysteme. Ziel ist es, eine effiziente und zugängliche Struktur zu schaffen, die erforderlichen Daten für die Evaluierung der GAP-Maßnahmen bereitstellt und zugleich eine einfache Nutzung und Analyse durch autorisierte Nutzer ermöglicht.
Bereitstellung von technischer Fachexpertise und Unterstützung für die Abteilung II/1 sowie die Verantwortlichen für die GAP-Maßnahmen 23-27 im Bereich der Datenmodellierung und des Datenmanagements. Dies umfasst die Entwicklung und Verwaltung eines effektiven Datenmodells sowie die Implementierung bewährter Methoden für das Datenmanagement, um sicherzustellen, dass der GAP-Datenpool hochwertige und verlässliche Daten enthält.
Bereitstellung von technischer Beratung und Unterstützung für die Verantwortlichen der GAP-Interventionen in Bezug auf die Beschaffung von Daten, die nahtlose Übertragung von Lieferantendaten zu den relevanten Schnittstellen, effiziente Speicherung, Datenverarbeitung und reibungslose Bereitstellung für den GAP-Datenpool.
Erstellung von Methoden für Datensicherheit und -integrität, einschließlich Möglichkeiten zur umfassenden Dokumentation aller eingelagerten Daten im Rahmen der GAP-Maßnahmen 23-27.
Der Fokus liegt darauf, eine solide Datenbasis zu schaffen, die Evaluierung bestmöglich unterstützt und den Evaluierenden relevante, gut dokumentierte Informationen bereitstellt.
Stand des Projektes
Die Datenbankstrukturen für den GAP-Datenpool wurden konzipiert und umgesetzt. Zudem sind Systeme zur Synchronisation der Daten aus dem BAB-Datenpool sowie zur Transformation der Daten für den GAP-Datenpool bereits erfolgreich implementiert.
Systeme zur Datendokumentation stehen bereit.
Geplante Arbeiten für 2025:
- Die Zugriffsbeschränkungen auf Daten werden auf der Ebene von Benutzergruppen implementiert
- Die GAP-Datenbank wird in abgeschottete Verarbeitungssysteme, wie beispielsweise JupyterHub, integriert
- Zusätzlich sollen Daten weitgehend automatisiert in benutzerfreundlichen Formaten wie CSV, Parquet oder DuckDB… aus der Datenbank exportiert werden, um die Nutzung für technisch weniger versierte Personen zu erleichtern
- Der Zugriff auf exportierte Daten wird über Plattformen wie Nextcloud oder ähnlichen Systemen mit Zugriffssteuerung (ACL) bereitgestellt
Zeitplan
Projektbeginn: 01/2024
Projektdauer: GAP-Strategieplan 2023-2027 begleitendes Langzeitprojekt