Semantic CorA
Projekt Semantic CorA Virtuelle Forschungsumgebung für die Historische Bildungsforschung mit Semantischer Wiki-Technologie (Semantic MediaWiki for Collaborative Corpora Analysis: Semantic CorA) | |
Zeitraum: | 04/2011 bis 10/2014 |
Beteiligt: | Deutsche Institut für Internationale Pädagogische Forschung (DIPF) Karlsruher Institut für Technologie (KIT) Institut für Erziehungswissenschaften der Universität Göttingen |
gefördert von: | Deutsche Forschungsgemeinschaft |
Website: | Projekt-Webseiten |
Ziel des Projekts „Virtuelle Forschungsumgebung für die Historische Bildungsforschung mit Semantischer Wiki-Technologie (Semantic MediaWiki for Collaborative Corpora Analysis: Semantic CorA)“ ist die Entwicklung einer virtuellen Forschungsumgebung (VFU) auf Basis von Semantic MediaWiki (SMW) für die kollaborative Analyse von umfangreichen digitalisierten Textkorpora und deren exemplarische nachhaltige Einbettung in die Fachcommunity der Historischen Bildungsforschung. Zudem wird eine mögliche Nachnutzung der Anreicherungs- und Analysearbeiten der Forscher sowie langfristig eine infrastrukturelle Distribution der VFU (Semantic CorA) in andere Disziplinen mit Community-Building angestrebt.
Hintergrund
In dem Projekt1 wird eine virtuelle Forschungsumgebung (VFU) entwickelt, die auf semantischer Wiki- Technologie basiert und darauf abzielt, das kollaborative Annotieren und Analysieren von Forschungsdaten speziell in den Sozial- und Geisteswissenschaften zu unterstützen. Die Forschungsumgebung baut auf der freiverfügbaren MediaWiki-Software2 auf, die durch die Verwendung bei der Online-Enzyklopädie Wikipedia weitbekannt ist und bereits die Potenziale für kollaborative Textarbeiten – wie bspw. Diskussion und Versionenkontrolle – beispielhaft darstellt. Um darüber hinaus Forschungsdaten bearbeiten und feingliedrig beschreiben, in Relation zu Entitäten setzen und in der Analyse befragen zu können, wird zusätzlich die Software-Erweiterung Semantic MediaWiki (SMW)3 verwendet, wobei für konkrete Forschungsbedarfe eigene SMW-Erweiterungen entwickelt werden (u.a. Lexikaimport-, Annotations-, Analysetool). Dadurch können mit der VFU potenziell sämtliche Interaktionen mit Forschungsdaten protokolliert, über Verlinkungen und Beschreibungen kontextualisiert und im Semantic Web Standard RDF exportiert werden. Dabei werden die Interaktionen der ForscherInnen bereits auf einer semantischen Plattform ausgeführt und müssen nicht im Nachhinein aufwendig zur Dokumentation und zur Teilung mit ForscherkollegInnen in eine Semantik übertragen werden. Ergebnisse von Digitalisierungsprojekten können somit in Form von Primärdaten in den fachlichen Diskurs eingebracht werden, wobei durch die direkte semantische Verlinkung der Digitalisate mit konkreten Forschungsinteraktionen Mehrwerte einer wissenschaftlichen Wertschöpfungskette generiert und in gebündelter Form nachgenutzt werden können. Die ForscherInnen selbst erhalten zusätzlich zur räumlich verteilten Kollaboration die Möglichkeiten der Kombination von quantitativen und qualitativen Verfahren sowie der Visualisierung von Analyseergebnissen in einer integrierten Forschungsumgebung ohne Reibungsverluste zwischen unterschiedlichen Werkzeugen. Die Virtuelle Forschungsumgebung SMW-CorA wird in einem ersten Schritt exemplarisch in der Historischen Bildungsforschung unter Verwendung digitalisierter Nachschlagewerke der Scripta Paedagogica Online (SPO) der Bibliothek für Bildungsgeschichtliche Forschung (BBF) 4 in einem partizipatorischen Verfahren mit konkreten Forschungsprojekten realisiert. Dabei wurden über 20 Lexika mit knapp 22.000 Artikeln mit ihren bibliographischen Daten und ihren Digitalisaten automatisch integriert, wobei ForscherInnen relevante Metadaten von weiteren 60 Lexika manuell integrierten.5 In einem zweiten Schritt, der in der gegenwärtigen zweiten Förderphase fokussiert wird, werden die bisherigen Entwicklungen in einem weiteren Forschungsprojekt über Schulkulturen in den 1950er und 1960er Jahren (DFG-finanziert) an einem neuen Korpus mit digitalisierten Schülerzeitungen geprüft sowie darüber hinaus die Bandbreite an Forschungsdatentypen exemplarisch erweitert.