TextPlus
NFDI-Konsortium Text+ Text+ | |
Status: | bewilligt |
Zeitraum: | 01.10.2021 bis 30.09.2026 |
Antragsteller: | Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim |
Sprecher:innen: | Prof. Dr. Andreas Witt |
Website: | Projekt-Webseiten |
Twitter: |
Beschreibung
Text+ ist ein Konsortium der Nationalen Forschungsdateninfrastruktur (NFDI) in Deutschland und richtet sich an alle Forschenden, die mit Text- und Sprachdaten im weitesten Sinn arbeiten, einschließlich, aber nicht beschränkt auf Linguistik, Literaturwissenschaft, Philologien auch der sog. „Kleinen Fächer“, Philosophie sowie sprach- und textbasierte Forschung in den Sozialwissenschaften und der Politikwissenschaft.
Der Verbund ist eines von sechs Konsortien aus den Humanities, das sind desweiteren Berd@NFDI, KonsortSWD, NFDI4Culture, NFDI4Memory, NFDI4Objects. Während es über die NFDI-Sektionen viele konsortienübergreifene Aktivitäten gibt, steht Text+ mit den geistes- und sozialwissenschaftlichen Konsortien in besonders engem Austausch.
Text+ stellt im Rahmen der NFDI einen umfangreichen Bestand an Textsammlungen und Korpora, Editionen und lexikalischen Ressourcen zur Nachnutzung bereit. Zum Angebotsportfolio gehört neben eigenen Daten und Diensten die Möglichkeit, Forschungsdaten der Community aufzunehmen und langfristig zu bewahren. Einen weiteren Schwerpunkt setzen wir im Bereich Beratung durch das Text+ Consulting und dessen zentrale Anlaufstelle, den Text+ Helpdesk.
Angesichts der großen Heterogenität der adressierten Forschungsdaten organisiert sich Text+ über vier Arbeitsbereiche: Korpora & Textsammlungen, lexikalische Ressourcen und Editionen. Der Bereich Infrastructure/Operations nimmt die Providerrolle an.
Ziele
1. Daten
Die an Text+ beteiligten Institutionen stellen umfangreiche Ressourcen zur Nachnutzung bereit. Für den Nachweis und die Aufnahme von text- und sprachbasierten Forschungsdaten setzt der Verbund auf eine föderierte Infrastruktur (Text+ Data Space).
Registry: Eine Suche über den kompletten Bestand an Ressourcen ermöglicht das übergreifende Informations- und Nachweissystem der Text+ Registry (Stand 11/24: Frontend & Dokumentation sind noch in Entwicklung). Für wissenschaftliche Editionen ermöglicht ferner nicht bloß Zugang zu den Ressourcen der Partnerinstitutionen, sondern strebt eine möglichst vollständige Darstellung der deutschen Editionslandschaft an, ohne sich dabei auf Deutschland oder deutsche Institutionen zu beschränken. Ziel ist es, Editionen umfassend nachzuweisen, zu vernetzen und deren Auffindbarkeit und Sichtbarkeit zu erhöhen - ganz im Sinne der FAIR-Prinzipien. Die Registry berücksichtigt dabei unterschiedliche Editionstypen und Plattformen und erfasst laufende wie abgeschlossene Projekte umfassend hinsichtlich Sprache, Disziplin und Format.
Föderierte Inhaltssuche: Für eine Volltextsuche innerhalb der Text- und Sprachdaten steht die Föderierte Inhaltssuche (FCS) bereit.
Beide Dienste zielen darauf ab, das Potenzial für verbesserte Precision & Recall von Ergebnissen durch die Nutzung des kontrollierten Vokabulars der Gemeinsamen Normdatei (GND) zu nutzen. Durch die Verwendung der GND-Normdaten werden alle Einträge, die aufeinander Bezug nehmen, in der Registry übergreifend verknüpft. In der Förderierten Inhaltssuche (FCS) bieten potentiell zehn Millionen Entitäten der GND eindeutige Sucheinstiege und verbesseren so die Suchergebnisse. Eine umfassende Verknüpfung der gelieferten Daten mit GND-IDs schöpft dieses Potential voll aus und steigert die Sichtbarkeit der Inhalte. Zusätzliche GND-Identifier zu Entitäten, die noch nicht in der GND enthalten sind, können über die Text+ GND Agentur neu angesetzt und bestehende editiert werden.
2. Dienste
Text+ und die beteiligten Einrichtungen stellen eine Vielzahl von Angeboten rund um Sprach- und Textdaten zur Verfügung. Neben den Forschungsdaten sind Dienste und Werkzeuge ein wesentlicher Teil des Text+ Angebots für die Nutzenden. Für die Bereitstellung und Pflege dieser Dienste und Werkzeuge nutzt Text+ den SSH Open Marketplace, eine Discovery-Plattform aus dem Social Sciences and Humanities Cluster in der EOSC. Auf dem Webportal findet sich eine Übersicht unserer Dienste.
3. Beratung
In seiner Definition und seinem Umfang verstehen wir den Begriff Consulting breiter als die kurze Beantwortung technisch geprägter Fragen, wie sie häufig über klassische Helpdesks abgewickelt werden: Das Text+ Consulting leistet eine vollumfängliche Beratung durch ein Team von Agent:innen zu allen Fragen rund um text- und sprachbasierte Forschungsdaten – von der Antragsberatung über allgemeine Fragen zum Forschungsdatenmanagement, von der Diskussion von Forschungsideen und -prozessen bis hin zu Spezialfragen zu bestimmten Tools und Technologien über den gesamten Datenlebenszyklus hinweg. Ziel der Beratungen ist die Verbesserung der Datenqualität im Sinne der FAIR-Prinzipien, die Verbreitung standardisierter, nachhaltiger Forschungspraktiken und somit letztlich die Erhöhung der Erfolgsaussichten Ihrer Forschungsvorhaben. Text+ engagiert sich zudem in der Arbeitsgruppe FDM-Helpdesk Netzwerk der Sektion edutrain.
Helpdesk: Der Text+ Helpdesk stellt einen wesentlichen Einstiegspunkt in das Beratungsnetzwerk sowohl von Text+ als auch der NFDI dar. Im Zuge des Aufbaus der NFDI unter dem Leitgedanken „One NFDI” vernetzen sich die Helpdesks verschiedener Konsortien zunehmend, um Expertise abzustimmen sowie technisch und fachlich übergreifende Beratungsfälle nahtlos unterstützen zu können. Text+ arbeitet diesbezüglich bereits mit den geisteswissenschaftlichen Partnerkonsortien NFDI4Culture, NFDI4Memory und NFDI4Objects zusammen.
Research Rendezvous: Abgerundet wird unser Angebot durch die Text+ Research Rendezvous, in denen ohne vorherige Anmeldung Anliegen und Fragen rund um Text+ und dessen Services, die NFDI sowie zu text- und sprachbezogenen Forschungsdaten direkt mit Kolleg:innen aus Text+ besprochen werden können. Für umfangreichere Fragen werden gerne individuelle (Folge-)Termine vereinbart. Eine Anmeldung zur Sprechstunde ist nicht erforderlich. Ein Zutritt zur Sprechstunde ist während der gesamten Stunde möglich. Die Sprechstunden finden zweiwöchentlich statt im Wechsel von Dienstag (9:00–10:00) und Donnerstag (10:00–11:00).
Konsortium
Applicant institution
- Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim
Co-applicant institutions
- Berlin-Brandenburgische Akademie der Wissenschaften
- Deutsche Nationalbibliothek
- Niedersächsische Staats- und Universitätsbibliothek Göttingen
- Nordrhein-Westfälische Akademie der Wissenschaften und der Künste
Participating institutions
- Akademie der Wissenschaften in Hamburg
- Akademie der Wissenschaften und der Literatur | Mainz
- Hochschule Darmstadt
- Jülich Supercomputing Centre (JSC)
- Julius-Maximilians-Universität Würzburg
- Klassik Stiftung Weimar
- Leopoldina, Nationale Akademie der Wissenschaften
- Ludwig-Maximilians-Universität München
- Max Weber Stiftung, Bonn
- Otto-Friedrich-Universität Bamberg
- Sächsische Akademie der Wissenschaften, Leipzig
- Salomon Ludwig Steinheim-Institut, Essen
- Akademie der Wissenschaften zu Göttingen
- Technische Universität Darmstadt
- Technische Universität Dresden, Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH)
- Universität des Saarlandes
- Universität Duisburg-Essen
- Universität Hamburg
- Universität Paderborn
- Universität Trier
- Universität zu Köln
- Universitäts- und Landesbibliothek Darmstadt
- Hochschule Wismar
- Albert-Ludwigs-Universität Freiburg
- Bergische Universität Wuppertal
- Philipps-Universität Marburg
- Bayerische Akademie der Wissenschaften
- Deutsches Literaturarchiv Marbach
- Eberhard Karls Universität Tübingen
- Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen
- Heidelberger Akademie der Wissenschaften
- Herzog August Bibliothek Wolfenbüttel
Ergebnisse
Referenzen