Dataverse
Dataverse ist eine Open-Source-Software für Forschungsdaten-Repositorien. Die Software wird am Institute for Quantitative Social Science (IQSS) der Universität Harvard entwickelt. Derzeit gibt es weltweit 66 Installationen (Stand 05.01.2021),[1] von denen die größte das Harvard Dataverse ist, in dem Forscher weltweit kostenfrei Forschungsdaten publizieren können. In Deutschland ist die Software an der Universität Heidelberg für deren institutionelles Forschungsdatenrepositorium heiDATA im Einsatz.
Die Benutzeroberfläche der Software ist derart strukturiert, dass eine Dataverse-Installation in mehrere Sektionen, sog. "Dataverses", unterteilt ist. In einem solchen Dataverse werden wiederum einzelne Datasets publiziert. Datasets wiederum bestehen aus den den eigentlichen Forschungsdaten, Metadaten sowie ggf. weiteren Dateien (Dokumentation etc.). Die Strukturierung des Repositories in Dataverses bietet die Möglichkeit einzelnen Einheiten, z.B. Arbeitsgruppen, Institute, einzelne Forscher, Forschungsprojekte oder auch Zeitschriften und Schriftenreihen, eigenständige Bereiche zur Präsentation ihrer Forschungsdatenbestände einzurichten.
Dataverse unterstützt unterschiedliche domänenspezifische Metadatenschemeta aus den Sozialwissenschaften, den Biowissenschaften und der Astronomie sowie raumbezogene Metadaten. [2] Es stehen zudem eine Reihe Softwaretools zur Verfügung, durch die sich weitere Funktionalitäten integrieren lassen, beispielsweise für statistische Analysen publizierter Daten oder die Visualisierung von Geodaten.[3]
Jede Forscherin und jeder Forscher der Stiftung Universität Hildesheim kann ihr/sein institutionelles Konto nutzen (‘Log-In’ über die Academic Cloud: https://academiccloud.de/) und ein persönliches „Dataverse“ anlegen, um Forschungsdaten als „Datasets“ hochzuladen. Dieser Service wird von der GWDG gehostet, die sich um Datensicherheit und -schutz, einschließlich Backups und Zugriffskontrolle sowie um die Verfügbarkeit und Zuverlässigkeit, kümmert. Das Forschungsdaten-Repositorium basiert auf dem Open-Source-Programm Dataverse (Harvard University). Die Software ist seit Mitte Mai 2020 an der Stiftung Universität Hildesheim für das institutionelle Forschungsdaten-Repositorium im Einsatz. Mit Inkrafttreten des DFG-Kodex “Leitlinien zur Sicherung guter wissenschaftlicher Praxis” zum 01.08.2019 müssen alle Hochschulen und außerhochschulischen Forschungseinrichtungen die 19 Leitlinien rechtsverbindlich umsetzen, um Fördermittel durch die DFG erhalten zu können.
“Wenn wissenschaftliche Erkenntnisse öffentlich zugänglich gemacht werden, werden die zugrunde liegenden Forschungsdaten (in der Regel Rohdaten) – abhängig vom jeweiligen Fachgebiet – in der Regel für einen Zeitraum von zehn Jahren zugänglich und nachvollziehbar in der Einrichtung, wo sie entstanden sind, oder in standortübergreifenden Repositorien aufbewahrt.” (Leitlinie 17)
Sofern nachvollziehbare Gründe dafür existieren, bestimmte Daten nicht aufzubewahren, muss dies dargelegt werden. Die langfristige Archivierung von Forschungsdaten ist Voraussetzung für die Nachvollziehbarkeit und Überprüfbarkeit wissenschaftlicher Ergebnisse, die auf der Auswertung dieser Daten beruhen. Forschungsdaten werden als eigenständige wissenschaftliche Leistungen sichtbar und gewürdigt.