FDM-Workshop 2021

Tag 1 (5. Mai 2021): FDM-Kompetenzen – Forschungsdaten an den Max-Planck-Instituten

13:30–13:40Dr. Yves Vincent Grossmann und Michael Franke (Max Planck Digital Library): Begrüßung und Einführung
13:40–14:10Prof. Dr. York Sure-Vetter (Nationale Forschungsdateninfrastruktur e.V.): Die Nationale Forschungsdateninfrastruktur (NFDI): Stand und Perspektiven
Video (MPG-IP-Range)
14:10–14:25Diskussion
14:25–14:30Pause
14:30–14:50Bettina Mann, Dr. Hatem Elliesie und Dr. Larissa Vetters (Max-Planck-Institut für ethnologische Forschung): Herausforderungen an FDM aus der Perspektive der qualitativen Sozialforschung
Nach einer kurzen Kontextbeschreibung durch die Forschungskoordinatorin des Instituts werden anhand zweier laufender Forschungsprojekte rechtliche, technische und fachwissenschaftliche Herausforderungen skizziert. Auf dieser Grundlage werden Ideen zu Vernetzungs-, Informations- und Schulungsbedarf formuliert.
Folien (MPG-IP-Range)
14:50–15:05Josefine Blunk (Max-Planck-Institut für Bildungsforschung): Nach dem Workshop ist vor dem Workshop – Erfahrungsbericht zur Durchführung einer FDM-bezogenen Veranstaltungsreihe am Max-Planck-Institut für Bildungsforschung
Um relevante FDM-Praktiken stärker in den Fokus der Wissenschaftler*innen zu rücken, hat die 2018 am MPIB gegründete AG Forschungsdatenmanagement 2019 eine Veranstaltungsreihe initiiert. Regelmäßig lädt sie nationale und internationale Expert*innen für Vorträge und Workshops ein. In diesem Kurzvortrag teilt das MPIB seine bisher gesammelten Erfahrungen, vom Akquirieren von geeigneten Redner*innen über Werbestrategien bis hin zur Durchführung und Nachbereitung von Veranstaltungen.
Folien (MPG-IP-Range)
15:05–15:35Diskussion
15:35–15:45Pause
15:45–16:00Irina Arndt (Max Planck Digital Library): SoLi für FDM-Projekte – Fördertopf und Proposals: Wie die Software-Grundversorgung hilfreich für FDM-Projekte sein kann
Seit 2018 gibt es die Software-Grundversorgung in der MPG und einen Fördertopf für Software-Entwicklungsprojekte. Erfahren Sie, wie Sie beide Optionen nutzen können, um Software rund ums Forschungsdatenmanagement zu beschaffen, selbst weiter zu entwickeln oder weiter entwickeln zu lassen.
Folien (MPG-IP-Range)
16:00–16:10Diskussion
16:10–16:25Dr. Alexander Schlemmer, Dr. Henrik tom Wörden, Prof. Dr. Ulrich Parlitz und Prof. Dr. Stefan Luther (Max-Planck-Institut für Dynamik und Selbstorganisation und IndiScale GmbH): Heterogene wissenschaftliche Dateistrukturen FAIR gestalten: Eine flexible, robuste Open-Source-Lösung mit dem CaosDB Crawler
In diesem Vortrag präsentieren wir die grundlegenden Konzepte des CaosDB-Crawlers und zeigen, wie diese in wissenschaftliche Use-Cases eingebettet werden können. Die Verknüpfung zwischen dem Forschungsdatenmanagement und den Datenquellen, die sich beispielsweise auf einem Dateisystem befinden, wird durch den CaosDB-Crawler ermöglicht und fortlaufend synchronisiert. Diese Vorgehensweise bietet eine robuste und flexible Lösung, um viele verschiedene Datenstrukturen und Dateiformate in das Forschungsdatenmanagementsystem einzubinden.
Folien (MPG-IP-Range)
16:25–16:40Diskussion
16:40–16:50Pause
16:50–18:00Podiumsdiskussion mit
Prof. Dr. Kurt Kremer (Max-Planck-Institut für Polymerforschung)
Dr. Johann-Mattis List (Max-Planck-Institut für Menschheitsgeschichte)
Sandra Martin (Max-Planck-Institut für Kognitions- und Neurowissenschaften)
Prof. Dr. Markus Reichstein (Max-Planck-Institut für Biogeochemie)

Tag 2 (6. Mai 2021): FDM-Kompetenzen – Forschungsdaten verarbeiten

9:00–9:05Dr. Yves Vincent Grossmann und Michael Franke (Max Planck Digital Library): Willkommen zu Tag 2
9:05–9:25Dr. Johannes Zierenberg (Max-Planck-Institut für Dynamik und Selbstorganisation): Die Rolle von GitHub zum Management der Forschungsdaten unserer Covid-19-Modellierungen
Im Frühjahr 2020 haben wir mathematische Modelle entwickelt um vergangene Covid-19-Fallzahlen zu beschreiben und deren Verlauf, unter Berücksichtigung verschiedener Szenarien, in die nahe Zukunft zu interpolieren. Um unsere Ergebnisse schnell mit der weltweiten Forschungsgemeinschaft zu teilen, haben wir unsere Modelle und Forschungsdaten frühzeitig auf GitHub zur Verfügung gestellt. Ich werde von unserer positiven Erfahrung berichten.
Folien (MPG-IP-Range) und Video (MPG-IP-Range)
9:25–9:35Diskussion
9:35–9:55Michael E. Rose PhD (Max-Planck-Institut für Innovation und Wettbewerb): Daten über die Wissenschaft: Publikationen, Patente, Unternehmensregister, und noch einiges mehr
Unsere Abteilung (Innovation & Entrepreneurship Research) arbeitet ausschließlich zu Wissenschaft, Erfindungen und jungen Unternehmen. Wir führen etwa 40 TB an internen und externen Daten zu Publikationen, Patenten und Unternehmensinformationen. In diesem Vortrag berichte ich, wie wir das effizient verwalten.
Folien (MPG-IP-Range) und Video (MPG-IP-Range)
9:55–10:05Diskussion
10:05–10:15Kurzes Online-Tutorial zu pybliometrics mit Michael E. Rose PhD
Online-Tutorial für pybliometrics (MPG-IP-Range)
10:15–10:25Pause
10:25–10:45Christoph Rzymski, Robert Forkel und Dr. Johann-Mattis List (Max-Planck-Institut für Menschheitsgeschichte): Forschungsdaten als organische Systeme?
Der konventionelle Lebenszyklus von Forschungsdaten sieht Daten an ihrem Endpunkt vor allem als Ausgangspunkt für die Generierung und Erhebung neuer Daten. Tatsächlich sehen wir eine Reihe von Vorteilen in der Konzeptualisierung von Forschungsdaten als organische, sich stets entwickelnde Systeme. In einer „Best Practice-Präsentation“ zu diesem Thema wollen wir zeigen, welche Möglichkeiten und Vorteile, aber auch welche potenziellen Probleme aus dieser Sichtweise entstehen können.
Folien (MPG-IP-Range) und Video (MPG-IP-Range)
10:45–11:05Dr. Kristina Starkloff (Max-Planck-Archiv Berlin): Archivieren von Anfang an denken!
Das Interesse an erhobenen Forschungsdaten kann über den geplanten Rahmen, sogar über die Interessen der eigenen Disziplin hinausreichen. Exemplarisch seien Daten zu später ausgestorbenen Tieren, vergangenen Himmelskonstellationen oder Beobachtungen zu wiederkehrenden gesellschaftlichen Ereignissen genannt. Elementare Voraussetzung ist, dass die Informationen lesbar bleiben, Zugangsrechte geklärt und sie in ihren Kontext einzuordnen sind. Archivierung bildet hierfür eine wichtige Voraussetzung.
Folien (MPG-IP-Range) und Video (MPG-IP-Range)
11:05-11:15Dr. Raphael Ritz (MPCDF): Neues von der MPCDF
Die Max Planck Computing and Data Facility bietet Dienstleistungen für alle Max-Planck-Institute an. Darunter fallen unter anderem das Datenmanagement für Big-Data-Projekte, der Betrieb eines zentralen Hochleistungsrechners und die Bereitstellung einer modernen Dateninfrastruktur einschließlich Langzeitarchivierung. Schwerpunkt des Vortrags werden aktuelle Entwicklungen im Bereich Datenanalyse und Datenmanagement sein.
Folien (MPG-IP-Range) und Video (MPG-IP-Range)
11:15–11:55Diskussion
11:55–12:00Pause
12:00–12:25Dr. Holger Dinkel (Max-Planck-Institut für biologische Kybernetik): SoftwareCarpentry: Extrakurrikuläre Weiterbildung für den Forscher von heute
Moderne Wissenschaft benötigt heutzutage Computer im selben Maße wie Teleskope oder Reagenzgläser. Leider wird noch immer an den meisten Universitäten unzureichend und ineffektiv der Umgang mit digitalen Tools vermittelt. Dass es auch anders geht beweist Software-Carpentry seit 1997: In tausenden Kursen auf der ganzen Welt wurde Wissenschaftlern Konzepte für die effektivere Nutzung von Computern in der Forschung beigebracht. Diese Trainings haben nachweislich einen unmittelbaren Einfluss auf die Produktivität der TeilnehmerInnen gehabt.
Folien (MPG-IP-Range)
12:25–12:35Diskussion
12:35–12:50Dr. Matthias Hölzl (Max-Planck-Institut für Plasmaphysik): Anforderungen an das Datenmanagement bezüglich des MHD-Code JOREK zur Simulation großskaliger Instabilitäten in Fusionsplasmen
Simulations-Codes mit ihren internationalen Communities haben vielfältige Anforderungen an FDM: Zusammenführen großer Datenmengen von Rechnern weltweit, Archivierung, Zugänglichkeit für Zweitnutzung, Dokumentation für Reproduzierbarkeit, Datenweitergabe an einzelne Personen oder öffentliche Bereitstellung, etc. Hr. Hölzl stelle den nicht-linearen MHD-Code JOREK und seine Anwendungen vor und geht auf die aktuelle Strategie beim FDM und insbesondere die bisher ungeklärten Punkte ein.
Folien (MPG-IP-Range) und Video (MPG-IP-Range)
12:50–13:00Diskussion
13:00–13:05Resümee der 1. Tageshälfte
13:05–14:00Mittagspause
14:00–14:25Dr. Carsten Fortmann-Grote (Max-Planck-Institut für Evolutionsbiologie) und Prof. Dr. Hans Fangohr (Max-Planck-Institut für Struktur und Dynamik der Materie): Reproducible Science with Jupyter
The Jupyter notebook format enables seamless coexistence of computer program code, documentation, and execution, as well as interactive visualization and discussion of results in one document and provides a user-friendly work environment. We will give an overview of the Jupyter ecosystem of tools and services and discuss how Jupyter enhances reproducibility in data intensive research.
Slides und Video
14:25–15:05Online-Tutorial zu Data Visualization with Jupyter mit Dr. Carsten Fortmann-Grote und Prof. Dr. Hans Fangohr
The presentation is followed by a hands-on tutorial for interested participants. We first give a basic introduction into the Jupyter notebook format and instruct how to use it in a data analysis setting. We then work through a small data analysis workflow with covid case number forecast with bayesian inference from Johannes Zierenberg talk in the morning. This consists of loading the data into the notebook, data cleanup, and exploratory data analysis with interactive visualisations.
Online-Tutorial-Datei
15:05–15:20Diskussion
15:20–15:30Dr. Yves Vincent Grossmann und Michael Franke (Max Planck Digital Library): Zusammenfassungen und Aussichten