Nach einem Jahr der Förderung durch die DFG hat sich unsere auf drei Standorte verteilte Arbeitsgruppe für zwei Tage an der TU Berlin zu einem Erfahrungsaustausch und zur weiteren Projektplanung getroffen.
Wir begrüßen als neues Mitglied Joris Hube vom Landesdenkmalamt Berlin. Die Mitglieder des Beirats sind unter Netzwerk genannt.
Gegenstand des Workshops war der Themenkomplex Datenkuration und Qualitätssicherung. Die zentrale Frage war, wie man die Speicherung qualitativ guter Daten in unserem Repositorium baureka.storage gewährleisten kann. Wann sollte die Kuratierung einsetzen und wie weit sollte die Kuratierung der Daten gehen? Inwiefern sollte baureka.online die Forschungsdaten auch ansehen und deren Vollständigkeit und technische Korrektheit überprüfen? Sollte es eine Art Redaktion oder sogar Peer-Review-Verfahren geben?
Allgemeiner Konsens in der Gruppe der Beiratsmitglieder war, dass Dateien nicht geöffnet und kontrolliert werden sollten, sondern allein die Datenintegrität, also die korrekte Übertragung der Daten nach baureka.online, die Lesbarkeit der Dateien und die Vollständigkeit der obligatorischen, beschreibenden Metadaten überprüft werden sollte. Sinnvoll und nötig sind Handreichungen und Leitfäden vorab, eine Beratung während des Uploads und eine abschließende Kontrolle durch Datenkurator:innen, welche die automatisierten Kontrollen ergänzen müssen.
Zentrales Werkzeug der Qualitätssicherung wird der Metadateneditor sein, der die hochgeladenen Forschungsdaten ausreichend beschreiben wird und dazu auf möglichst viele Normdaten zurückgreifen sollte. Die Datenkurator:innen sollten allein auf Plausibilität prüfen. Für die Qualität der Dateiinhalte und die Qualität der Metadaten ist damit der oder die Datengebende verantwortlich. Eine qualitativ gute Beschreibung durch Metadaten erhöht die Wahrscheinlichkeit der Auffindbarkeit und damit der Nachnutzung der Forschungsdaten und liegt im Interesse der Datengebenden. Von einem Peer-Verfahren nehmen wir für das Repositorium baureka.storage Abstand. Sinnvoll ist eine solche Qualitätssicherung für das Modul baureka.publications.
Fazit: Zur Qualitätssicherung sollen Dateiinhalte nicht geprüft werden, die Datenbeschreibung und die Datenintegrität hingegen schon.
Anschließend präsentierten wir den Stand der Entwicklung zu unserem Editor. Verbesserungsvorschläge werden gern berücksichtigt und umgesetzt. Allgemein wurde gelobt, dass viel Wert auf die leichte Benutzbarkeit gelegt wird, da diese ein zentraler Faktor für den Erfolg des gesamten Projektes ist.
Im zweiten Teil des Workshops stellten wir unsere Policy zur Diskussion, die wir noch in Form von Fragen formuliert haben. Der Schwerpunkt lag dabei auf dem Abschnitt zu Qualitätssicherung.
(...) 3. Qualitätssicherung
Wie und durch wen erfolgt die Qualitätsprüfung der Daten? - Welches sind die Voraussetzungen zur Aufnahme der Daten in qualitativer Hinsicht? - Übernimmt baureka.online eine Neuordnung der Daten? - Übernimmt baureka.online eine Umwandlung der Dateiformate?- Wird die Qualität der Daten durch Dritte geprüft? - Inwiefern sollte auch eine Prüfung der Ordner- und Datei-Inhalte auf "grobe Fahrlässigkeiten" erfolgen? - Welche Voraussetzungen sollten vor dem Hochladen der Daten geprüft werden oder auf welche Voraussetzungen soll hingewiesen werden? - Sollte eine Qualitätssicherung durch den Nutzer:innen-Kreis erfolgen können?
Die schriftlichen und mündlichen Rückmeldungen zu unseren Fragen waren sehr hilfreich und werden intern weiter diskutiert und in unsere Policy eingearbeitet. Nachdrücklich empfohlen wird uns - wie bereits als zentrales Arbeitspaket unseres Projekts vorgesehen - die Eingabe beispielhafter, vorbildlicher Forschungsdaten mit Pilotcharakter, die den potenziellen Daten-Gebenden und Daten-Nachnutzenden Orientierung bieten werden.
Wir bedanken uns für die Hinweise, Ratschläge, Kommentare zu unserer Policy auf dem Yopad und die konkreten Hilfestellungen bei allen Mitgliedern des Wissenschaftlichen Beirats und freuen uns darauf, sie bei unseren nächsten Treffen wiederzusehen. Es wird am Freitag, der 22. September 2023 in virtueller Umgebung stattfinden und ist von 9-15 Uhr geplant.