Data Center for the Humanities (DCH): Unterschied zwischen den Versionen
Keine Bearbeitungszusammenfassung |
|||
Zeile 35: | Zeile 35: | ||
Das Projekt wird gefördert vom Ministerium für Innovation, Wissenschaft und Forschung des Landes Nordrhein-Westfalen.<br> | Das Projekt wird gefördert vom Ministerium für Innovation, Wissenschaft und Forschung des Landes Nordrhein-Westfalen.<br> | ||
= | =Clusteraufbau: Beispiel Sprachressourcen= | ||
; Language Archive Cologne | ; Language Archive Cologne | ||
Das LAC ist ein Projekt im Rahmen des Datenzentrums für die Geisteswissenschaften (DCH). In Zusammenarbeit mit dem Institut für Linguistik an der Universität zu Köln wird eine Repositoriumsplattform zur Verfügung gestellt, die es Wissenschaftlern und Studenten ermöglicht, stark strukturierte Sprachkorpora zu archivieren und zitierfähig im Internet zu präsentieren. Das LAC steht allen Wissenschaftlern an der Universität zu Köln und auf Anfrage darüber hinaus offen, die mit vergleichbar strukturierten Daten arbeiten, d.h. multimodale Daten mit Sprachbezug mit zeit-alinierten und tier-basierten Annotationen. | Das LAC ist ein Projekt im Rahmen des Datenzentrums für die Geisteswissenschaften (DCH). In Zusammenarbeit mit dem Institut für Linguistik an der Universität zu Köln wird eine Repositoriumsplattform zur Verfügung gestellt, die es Wissenschaftlern und Studenten ermöglicht, stark strukturierte Sprachkorpora zu archivieren und zitierfähig im Internet zu präsentieren. Das LAC steht allen Wissenschaftlern an der Universität zu Köln und auf Anfrage darüber hinaus offen, die mit vergleichbar strukturierten Daten arbeiten, d.h. multimodale Daten mit Sprachbezug mit zeit-alinierten und tier-basierten Annotationen. |
Version vom 11. Januar 2015, 13:31 Uhr
Projekt Data Center for the Humanities (DCH) Data Center for the Humanities (DCH) | |
Zeitraum: | seit Dezember 2012 bis offen |
Beteiligt: | Universität zu Köln Cologne Center for eHumanities (CCeH) Regionales Rechenzentrum der Universität zu Köln (RRZK) Universitäts- und Stadtbiblitohek (USB) Köln |
gefördert von: | Philosophische Fakultät der Universität zu Köln Ministerium für Innovation, Wissenschaft und Forschung des Landes Nordrhein-Westfalen |
Website: | Projekt-Webseiten |
Ziel
Aufbau einer nachhaltigen geisteswissenschaftlichen Infrastruktur für Forschungsdaten und Forschungsergebnisse an der Universität zu Köln und darüber hinaus.
Mission
Unterstützung einer dauerhafte Sicherung, Verfügbarkeit und Präsentation von Daten und Ergebnissen der geisteswissenschaftlichen Forschung an der Universität zu Köln und darüber hinaus.
Hintergrund
Unter Forschungsdaten werden gemeinhin sämtliche Daten verstanden, die als Grundlage für die Forschung dienen. Aufgrund der großen Methodenvielfalt in den geisteswissenschaftlichen Disziplinen zeichnen sich diese Daten besonders durch ihre Heterogenität aus. Um den Mehrwert der Daten in ihrer Kontextualität und Diskursivität zu wahren und nachnutzen zu können, kann häufig nicht einfach zwischen „Primärdaten“, die bloß zu archivieren wären, und den oft komplexen und individuellen Systemen der Präsentation und Benutzung von „Ergebnisdaten“ unterschieden werden. Neben der Langzeitarchivierung von Daten stehen deshalb die Pflege und Betreuung dieser komplexen Systeme im Fokus des Datenzentrums. Denn damit Forschungsdaten auch weiterhin vernetzt und kontextualisiert dargestellt und werden können, bedarf es eines Forschungsdatenmanagements und einer Begleitung der Forschung, die den Spezifika geisteswissenschaftlicher Fragestellungen und Methoden sowie der Präsentation ihrer Ergebnisse gerecht werden.
Umsetzung
Die Zusammenarbeit mit verschiedenen Akteuren mit ihren jeweiligen Kompetenzen ist für das Kölner Datenzentrum für die Geisteswissenschaften grundlegend. Im Zentrum stehen die Fachwissenschaften und ihre Forschungsprojekte, deren Inhalte (Forschungsdaten und Publikationen) nachhaltig gesichert und zugänglich gemacht werden müssen. Auf der technischen Ebene wird in Kooperation mit dem Regionalen Rechenzentrum der Universität zu Köln (RRZK) eine adäquate Server-Infrastruktur geschaffen, die einerseits eine Langzeitarchivierung der Forschungsdaten (und in Abstimmung mit anderen Infrastruktur-Einrichtungen wie z. B. dem Digitalen Archiv NRW (DA NRW)) ermöglicht und andererseits den laufenden Betrieb der Zugänglichkeits- und Präsentationssysteme gewährleistet. Das Cologne Center for eHumanities (CCeH) als fakultätsweite Einrichtung der digitalen Forschung übernimmt die Gesamtorganisation des Datenzentrums sowie die Koordination für das Zusammenspiel und einzelner Komponenten und deren Aufbau, namentlich die Einrichtung fachgruppenspezifischer Cluster, die Betreuung der Inhalte in diesen Teilzentren sowie die Entwicklung von Services und Präsentationsoberflächen.
Die konkrete Umsetzung des Datenzentrums erfolgt in zwei komplementären Ansätzen:
Top-down-Approach
In einem “top down”-Ansatz wird derzeit ein umfassender strategischer Plan für den nachhaltigen Aufbau des Datenzentrums ausgearbeitet, der sich auf nationaler wie internationaler Ebene in die laufende Infrastrukturentwicklung von Datenzentren für die Geisteswissenschaften und ihre nationale Koordination einpasst. Unter Einbeziehung der aktuellen Entwicklungen auf nationaler und internationaler Ebene werden hier institutionelle und strukturelle Fragen (Organisationsform, Rollen, Kooperationspartner etc.) gelöst, ebenso wie methodische und technische Herausforderungen.
Bottom-up-Approach
Zugleich werden derzeit in einem “bottom-up”-Ansatz erste konkrete Bausteine für das Gesamtsystem entwickelt. Hier werden zum Beispiel aktuelle Projekte wie die Cologne Language Archive Services (CLASS) oder das Language Archive Cologne (LAC) der Sprachwissenschaft bereits als Teile des im Aufbau befindlichen Gesamtsystems integriert. Aufgrund des unmittelbaren und bereits bestehenden Bedarfs an einigen Komponenten und Diensten des Datenzentrums, welche eine Evaluation der geisteswissenschaftlichen Disziplinen an der Philosophischen Fakultät der Universität zu Köln ergab, wird zur Zeit der Aufbau einer ersten minimalen technischen Infrastruktur organisiert. Dies erfolgt gleichzeitig in Abstimmung mit den jeweiligen Fachwissenschaftlern vor Ort, wobei dabei weitere anzubindende Projekte und Datenquellen ermittelt und die perspektivische Integration bereits ausgelaufener oder noch laufender Projekte vorbereitet werden.
Die Durchführung beider Ansätze erfolgt parallel und in enger Zusammenarbeit. Die konkrete Ausgestaltung und Entwicklung des Zentrums, seiner Inhalte, technischen Strukturen und Services können teilweise von anderen laufenden oder zukünftigen Projekten der Fachforschung profitieren.
Teilprojekte: Beispiel LAZARUS
Im Fokus des Projekts Lazarus ('Langfristige Aufbereitung, Zugänglichkeit und Archivierung universitärer Sammlungen') steht die exemplarische Aufbereitung, nachhaltige Sicherung und dauerhafte Bereitstellung digitaler Forschung. Der Begriff der “Sammlungen” umfasst dabei nicht nur ausschließlich materiell begründete Sammlungen, sondern in gleicher Weise digitale Sammlungen und Ressourcen, wie sie heute in Lehr- und Forschungsprojekten entstehen.
Für das Projekt wurden drei exemplarische universitäre Sammlungen ausgewählt:
Es handelt es sich (1) um das Meister-Eckhart-Archiv, (2) um das Cologne Digital Sanskrit Lexicon (CDSL) sowie (3) um Paläographie-Online.
Allen drei Sammlungen ist gemein, dass die jeweiligen Daten in unterschiedlichen Formaten bereits vorliegen. Während das Meister-Eckhart-Archiv ein physisches Archiv ist, zu dem bislang nur gering strukturierte textliche Beschreibungen vorliegen, besteht das Sanskrit-Lexikon bereits aus digitalen Volltexten mit einem in die Jahre gekommenen Benutzer-Interface, und Paläographie-Online aus einer Sammlung von didaktischen Materialien, die ebenfalls in ihrer Benutzbarkeit überarbeitet werden müssen. In allen drei Fällen geht es darum, wichtige Forschungsressourcen auf den Stand der Zeit zu bringen, um die ihnen zukommende Bedeutung ausschöpfbar zu machen.
Die langfristige Bereitstellung dieser Ressourcen erfolgt durch das DCH.
Das Projekt wird gefördert vom Ministerium für Innovation, Wissenschaft und Forschung des Landes Nordrhein-Westfalen.
Clusteraufbau: Beispiel Sprachressourcen
- Language Archive Cologne
Das LAC ist ein Projekt im Rahmen des Datenzentrums für die Geisteswissenschaften (DCH). In Zusammenarbeit mit dem Institut für Linguistik an der Universität zu Köln wird eine Repositoriumsplattform zur Verfügung gestellt, die es Wissenschaftlern und Studenten ermöglicht, stark strukturierte Sprachkorpora zu archivieren und zitierfähig im Internet zu präsentieren. Das LAC steht allen Wissenschaftlern an der Universität zu Köln und auf Anfrage darüber hinaus offen, die mit vergleichbar strukturierten Daten arbeiten, d.h. multimodale Daten mit Sprachbezug mit zeit-alinierten und tier-basierten Annotationen.
- Tools
Das DCH stellt eine Reihe von Tools bereit, die Arbeit mit Sprachressourcen vereinfachen sollen. Im Mittelpunkt steht der einfach benutzbare und plattformunabhängige CMDI Maker - ein Metadatengenerator, der für die schnelle und unkomplizierte Beschreibung von Ressourcen mit ausgewählten CMDI-Profilen angepasst ist.
Weitere Informationen
- DCH-Website
- DCH-Flyer
- DCH-Poster (dt.), DCH-Sustainabilibty-Poster (engl.)
- Patrick Sahle, Simone Kronenwett: "Jenseits der Daten: Überlegungen zu Datenzentren für die Geisteswissenschaften am Beispiel des Kölner ‘Data Center for the Humanities’". LIBREAS. Library Ideas, 23 (2013)