Digitaler Wissensspeicher der BBAW
Projekt Digitaler Wissensspeicher der BBAW Digitaler Wissensspeicher | |
Zeitraum: | k.A. bis k.A. |
Beteiligt: | Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) |
gefördert von: | Deutsche Forschungsgemeinschaft (DFG) |
Website: | Projekt-Webseiten |
Einführung
Der Aufbau eines digitalen Wissensspeichers soll die vorhandenen elektronischen Ressourcen der BBAW erfassen und bündeln. Er stellt eine Weiterentwicklung der BBAW-Infrastruktur für die Präsentation der digitalen Wissensbestände dar und wird die Sichtbarkeit der Forschungstätigkeit im Internet erhöhen. Grundlage für ein erfolgreiches Konzept ist die Integration des Wissensspeichers in die bestehende Infrastruktur. Er soll sich von Entwicklungen aus dem Bereich der Wissensorganisation und -präsentation im virtuellen Raum inspirieren lassen und diese im Sinne der besonderen Situation an der Akademie weiterentwickeln.
Projektbeschreibung
Hintergrund
Die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) ist die größte außeruniversitäre geisteswissenschaftliche Forschungseinrichtung in der Region, die vornehmlich Grundlagenforschung betreibt. Die Ergebnisse vieler Akademienvorhaben sind, neben den Print-Publikationen, zunehmend elektronisch aufbereitete Daten der Grundlagenforschung, die in dieser Form einmalig sind und mit großem Aufwand und in hoher Qualität gesammelt wurden. Die Organisation des einfachen Zugriffs auf diese Daten stellt für die BBAW eine große Herausforderung dar. An der Akademie sind Vorhaben wie z. B. die Marx-Engels Gesamtausgabe, das Corpus Coranicum oder die Inscriptiones Graecae angesiedelt, deren Inhalte in Bezug auf den zeitgeschichtlichen Hintergrund und die Sprache stark variieren. Zudem werden zur digitalen Veröffentlichung der Forschungsergebnisse häufig unterschiedliche Datenformate und -strukturen verwendet. Seit 2003 bündelt die BBAW ihre elektronischen Aktivitäten in der TELOTA-Initiative (The Electronic Life Of The Academy). Aufgabe von TELOTA ist es, die Akademienvorhaben beim Ausbau ihres elektronischen Workflows zu unterstützen und die elektronische Präsentation der Forschungsergebnisse umzusetzen. Der Digitale Wissensspeicher soll die vorhandenen digitalen Ressourcen der BBAW erfassen und zugänglich machen. Er stellt eine Weiterentwicklung der BBAW-Infrastruktur für die Präsentation der digitalen Wissensbestände dar und soll durch die Schaffung eines zentralen Portals die Sichtbarkeit der Materialien und die Nutzungsmöglichkeit der Daten durch die Forschung im Internet erhöhen. Konzeption und Implementierung einer dialoggestützten Retrievaloberfläche sollen den Zugriff auf die Forschungsdaten unterstützen und steuern.
Technische Umsetzung
Eine besondere Herausforderung liegt in der Erschließung der zum Teil auch räumlich disparaten, heterogenen Ressourcen der Akademie. Die Vorhaben der Akademie behandeln hinsichtlich des zeitgeschichtlichen Hintergrundes und der Sprache ein breites Spektrum verschiedener Disziplinen und deren Ressourcen liegen in einer Vielzahl unterschiedlicher Formate vor. Dabei steht im Fokus, inhaltliche Überlappungen der Ressourcen aufzuzeigen und implizite Verbindungen in explizite Verbindungen zu überführen. Die dazu verwendeten Techniken stammen aus dem Bereichen Information Retrieval (Apache Lucene) und Semantic Web (RDF, Apache Jena) und sollen in zwei Komponenten münden: dem Knowledge Browser, einer innovativen Suchoberfläche, und dem Knowledge Store, einer Schicht zur Datenhaltung und -verarbeitung. Es wurden umfassende Retrievalmöglichkeiten für eine linguistische Volltextsuche geschaffen, unter Anderem durch die morphologische Analysesoftware DONATUS, die Sprachen wie Altgriechisch, Latein und Arabisch verarbeitet. Die Einrichtung einer OAI-PMH Schnittstelle ermöglicht auch externen Anbietern den Zugriff auf die Metadaten der Ressourcen. Gleichzeitig nutzt der Wissensspeicher Webservices externer Anbieter wie z.B. die des DFG-Projektes Personendaten Respositorium und der dbPedia zur Anreicherung der eigenen Daten. Durch den Einsatz von Semantic-Web-Technologien und Elementen des Text Mining versucht der digitale Wissensspeicher einen dialogbasierten Suchprozess anzustoßen und zu neuen Möglichkeiten der Verknüpfung von visuell innovativ aufbereiteter und klassischer Suchoberfläche zu gelangen. Die Metadaten des Wissensspeichers beruhen einerseits auf der automatischen (scriptbasierten) Erzeugung von Metadaten, die bereits strukturiert in einem verwertbaren Format vorliegen (z. B. In MODS) und andererseits auf Metadaten über Akademievorhaben und deren Ressourcen, die manuell erstellt werden. Mit der Modellierung der Metadaten des Wissensspeichers in OAI Object Reuse Exchange (OAI-ORE) wurde die Grundlage für die Nachbildung der vernetzen Struktur der Ressourcen gelegt. OAI-ORE ist ein RDF und damit graphbasiertes Datenmodell. Es ermöglicht eine adäquate Beschreibung von Ressourcensammlungen und deren Zusammenhängen, insbesondere die Modellierung von Named Graphs mit dem Apachen Jena Framework. Dafür wurde ein RDF-Store aufgesetzt, der als Datenhaltung der Metadaten fungiert. Ziel ist es, den Wissensspeicher langfristig zur Erschließung der digitalen Ressourcen der Akademie zu nutzen.