Warum und wie Sie Klimamodelldaten veröffentlichen sollten
- 1Technische Informationsbibliothek (TIB), Hannover, Deutschland (anette.ganske@tib.eu, angelina.kraft@tib.eu)
- 2Deutsches Klimarechenzentrum (DKRZ), Hamburg, Deutschland (kaiser@dkrz.de)
Bei Klimasimulationen werden große Mengen an Daten erzeugt. Aus diesem Grund können in der Regel nicht alle Ergebnisse einer Simulation eines Klimamodells von einer Forschungsgruppe alleine ausgewertet werden. Beim Coupled Model Intercomparison Projekt (CMIP) wird daher ein Fokus darauf gelegt, dass auch andere Forschungsgruppen die Daten auswerten können. Deshalb gibt es genaue Vorgaben, wie diese Daten zu beschreiben und zu formatieren sind. Zudem werden viele dieser Datensätze mit einem DOI (Digital Object Identifier) versehen. Dies alles erleichtert die Suche und Weiterverarbeitung der Daten.
Allerdings gibt es weitaus mehr als CMIP Daten, die für die Klimaforschung wichtig sind. Viele Ergebnisse von z.B. regionalen Klimamodellen oder Stadtklimamodellen werden nicht veröffentlicht, obwohl von den Datenerzeugern nur ein Bruchteil der Ergebnisse ausgewertet werden kann. Deshalb drängen viele Förderer auf eine Veröffentlichung der Daten in einem Repositorium. Aber auch in diesem Fall können sie oft nicht weiterverwendet werden. Die Gründe sind vielfältig:
- Unzureichende Metadaten
- Mangelnde Auffindbarkeit, z.B. durch Suchmaschinen
- Fehlende Rechte zur Weiterverarbeitung
- Fehlende Qualitätskontrolle
Das BMBF geförderte Projekt AtMoDat (https://www.ATMODAT.de) wurde 2019 gestartet, um die Veröffentlichung von Atmosphärischen Modelldaten zu stärken und zu verbessern. Eine Methode ist dabei die Einhaltung der FAIR-Prinzipien - Findable, Accessible, Interoperable, Reusable (siehe Wilkinson et al., 2016). Zudem sollten alle Daten mit einem DataCite DOI veröffentlicht werden, um die Auffindbarkeit und Zitierbarkeit zu verbessern. Eine Anleitung, wie man dabei vorgehen sollte, findet sich in dem Standard, der im AtMoDat-Projekt entwickelt wurde. Der ATMODAT-Standard ist leicht umzusetzen und beinhaltet genaue Vorgaben für die Metadaten des DOI, die Landing Page und die Header der netCDF-Dateien. Daten, die diesem Standard genügen und dessen Einhaltung vom jeweiligen Repositorium geprüft wurde, können mit dem Earth System Data Branding (EASYDAB) versehen werden. Durch dieses Branding kann eine angemessene Qualitätssicherung der Daten durch die Nutzer sehr leicht nachvollzogen werden. Im Vortrag werden der Standard und EASYDAB vorgestellt.
How to cite: Ganske, A., Kaiser, A., and Kraft, A.: Warum und wie Sie Klimamodelldaten veröffentlichen sollten, 12. Deutsche Klimatagung, online, 15 March–18 Mar 2021, DKT-12-7, https://doi.org/10.5194/dkt-12-7, 2020