Curation Domain Model
Im Laufe des digitalen Lebenszyklus von Forschungsdaten werden in den verschiedenen Phasen sehr unterschiedliche Anforderungen an die Persistenz der Daten und der Werkzeuge zum Umgang mit Forschungsdaten gestellt. Zwischen dem Entstehen der Daten in wissenschaftlichen Arbeitsprozessen und der sicheren, nachnutzbaren Archivierung der Daten besteht ein breites Spektrum von teilweise gegensätzlichen Anforderungen, auch Digital Curation Continuum genannt. Organisatorisch ist ein Kontinuum allerdings nicht handhabbar, weswegen es notwendig ist, innerhalb einer Organisation zu bestimmen, wer in welcher Phase des Lebenszyklus von Forschungsdaten für deren Pflege verantwortlich ist. Auf Grund des vorhandenen Kontextwissens reicht in den Phasen vor der Speicherung in der dauerhaften Domäne ein eingeschränktes Metadatenprofil aus, das bei der Überführung in die nächste Domäne angereichert werden muss, da in der nachfolgenden Domäne dieses Kontextwissen meist fehlt. Der Prozess der Anreicherung der Metadaten kann teilweise bis vollautomatisch erfolgen. [1] [2]
Organisatorisch und technisch müssen sich diese Prozesse möglichst nahtlos in die wissenschaftlichen Arbeitsabläufe eingliedern. Allerdings sind wissenschaftliche Daten geprägt durch ihre Herkunft aus experimentellem Vorgehen, d.h. anders als Daten aus Arbeitsabläufen der Industrie oder Verwaltung stammen Forschungsdaten überwiegend aus informellen Arbeitsabläufen, die immer wieder ad hoc an die untersuchte Fragestellung angepasst werden.[3]
Der kritischste Moment im Lebenszyklus von Forschungsdaten ist, wenn das Projekt endet, denn hier endet meistens auch die Finanzierung weiterer Maßnahmen zur Datenerhaltung und das Interesse der Forscher ist bereits auf das nächste Projekt gerichtet. Um diese Klippe zu umschiffen ist es daher notwendig die zu archivierenden Daten möglichst früh in das Archiv zu überführen. Dieser Schritt ist im gesamten Betrieb eines Forschungsdatenarchivs der aufwendigste, und damit auch teuerste, der ca. 45% der Gesamtkosten der Langzeitarchivierung eines digitalen Objekts verursacht (Beagrie u. a., 2010). Zudem sind die Risiken unkontrollierbarer Kostensteigerungen hier am höchsten (Digital Preservation Testbed, 2005).
- ↑ Treloar, A., D. Groenewegen, and C. Harboe-Ree (2007), The Data Curation Continuum - Managing Data Objects in Institutional Repositories, D-Lib Magazine, 13(9/10), 13, doi:10.1045/september2007-treloar.
- ↑ Treloar, A., and R. Wilkinson (2008), Access to Data for eResearch: Designing the Australian National Data Service Discovery Services, International Journal of Digital Curation, 3(2), 151–158. doi:doi:10.2218/ijdc.v3i2.66.
- ↑ Barga, R., and D. B. Gannon (2007), Scientific versus business workflows, in Workflows for e-Science, edited by I. J. Taylor, E. Deelman, D. B. Gannon, and M. Shields, pp. 9–16, Springer-Verlag, London, UK. doi:doi:10.1007/978-1-84628-757-2_2