BERD@NFDI: Unterschied zwischen den Versionen
Keine Bearbeitungszusammenfassung |
|||
Zeile 23: | Zeile 23: | ||
==Beschreibung== | ==Beschreibung== | ||
BERD@NFDI ist eine Initiative zum Aufbau einer leistungsstarken Plattform | BERD@NFDI ist eine Initiative zum Aufbau einer leistungsstarken Plattform von Werkzeugen zur Verarbeitung, Analyse und Aufbewahrung von Geschäfts-, Wirtschafts- und verwandten Daten. Das Konsortium wird das integrierte Management von Algorithmen und Daten entlang des gesamten Forschungszyklus ermöglichen, mit besonderem Fokus auf unstrukturierte, heterogene, multimodale und große Daten wie Video, Bild, Audio, Text oder mobile Daten. | ||
Weiterführende Information zu BERD@NFDI | Weiterführende Information zu BERD@NFDI ist hier zu finden: [https://www.berd-nfdi.de/wp-content/uploads/resources/BERD-NFDI-in-a-nutshell.pdf] | ||
==Ziele== | ==Ziele== | ||
BERD@NFDI wird eine Infrastruktur für die Herausforderungen der erweiterten empirischen Forschung bereitstellen und nicht nur den Aufbau von Gemeinschaften fördern | BERD@NFDI wird eine Infrastruktur für die Herausforderungen der erweiterten empirischen Forschung bereitstellen und nicht nur den Aufbau von Gemeinschaften fördern sondern auch öffentlich verfügbare und online zugängliche Datensätze anbieten und die Datendokumentation und -aufbewahrung nach den FAIR-Prinzipien verbessern. Ziel ist es ein Algorithmus-Repository und Benchmarks, Rechen- und Speicherleistung zur Analyse von (großen) Daten sowie eine breite Palette von APIs zur Interaktion mit externen Systemen zu entwickeln und zu etablieren. | ||
Im Folgenden werden die Ziele der Arbeitsbereiche skizziert: | Im Folgenden werden die Ziele der Arbeitsbereiche skizziert: | ||
Zeile 41: | Zeile 41: | ||
====TA 3 Processing BERD==== | ====TA 3 Processing BERD==== | ||
Forscher müssen sich mit einer Vielzahl von Daten und unterschiedlicher Datenqualität auseinandersetzen. Das gleiche Problem ergibt sich für die Metadaten von Ressourcen, die aus externen Quellen in die BERD@NFDI-Infrastruktur importiert werden. Liegen die Daten bereits in strukturierter Form vor, können etablierte Prüf- und Normalisierungsverfahren eingesetzt werden, um die Qualität der (Meta-)Daten zu verbessern. Für unstrukturierte Daten | Forscher müssen sich mit einer Vielzahl von Daten und unterschiedlicher Datenqualität auseinandersetzen. Das gleiche Problem ergibt sich für die Metadaten von Ressourcen, die aus externen Quellen in die BERD@NFDI-Infrastruktur importiert werden. Liegen die Daten bereits in strukturierter Form vor, können etablierte Prüf- und Normalisierungsverfahren eingesetzt werden, um die Qualität der (Meta-)Daten zu verbessern. Für unstrukturierte Daten werden neue Methoden der Klassifizierung, Normalisierung und Qualitätsbewertung angewendet, aber es gibt keinen allgemein anerkannten Standard. Beim Umgang mit historischen Datenquellen müssen zudem gedruckte Quellen zunächst mit Texterkennungsverfahren digitalisiert und maschinenlesbar gemacht werden. In allen Fällen können datenschutzrechtliche Anforderungen eine weitere Verarbeitung erforderlich machen, wie z. B. eine Anonymisierung zum Schutz personenbezogener Daten. | ||
BERD@NFDI wird die Forschungsgemeinschaft dabei unterstützen, geeignete Methoden zur Verarbeitung in BERD auszuwählen, zu dokumentieren und zugänglich zu machen. | BERD@NFDI wird die Forschungsgemeinschaft dabei unterstützen, geeignete Methoden zur Verarbeitung in BERD auszuwählen, zu dokumentieren und zugänglich zu machen. | ||
====TA 4 Analyzing BERD==== | ====TA 4 Analyzing BERD==== | ||
Um Daten für Forschungsanwendungen in Wirtschaft und verwandten Bereichen nutzbar zu machen, wird BERD@NFDI analytische Ansätze dokumentieren, die auf verschiedene Datensätze angewendet werden können. Dies wird es den Forschern ermöglichen, sowohl in Bezug auf die Daten als auch auf die analytischen Fähigkeiten auf früheren Arbeiten aufzubauen. Es wird auch redundante Anstrengungen zwischen Forschungseinheiten reduzieren und den Anforderungen einer verantwortungsbewussten KI gerecht werden. Diese Fähigkeiten sind für alle zugänglich, die bereit sind, ihre Daten, Datenvorverarbeitung und analytischen Implementierungen in zulässiger Form zu teilen. Basierend auf früheren Arbeiten zu OpenML ermöglicht BERD@NFDI Benutzern, die algorithmische Leistung zu bewerten für Daten zu BERD@NFDI und für ihre eigenen Daten, um potenzielle neue Anwendungen sowie Leistungsunterschiede zwischen Anwendungen von Interesse schnell zu verstehen. Dies sorgt für zusätzliche Effizienz Anreize für Benutzer, mit der BERD@NFDI-Community zusammenzuarbeiten und die Ergebnisse ihrer eigenen Arbeit zu teilen. | Um Daten für Forschungsanwendungen in Wirtschaft und verwandten Bereichen nutzbar zu machen, wird BERD@NFDI analytische Ansätze dokumentieren, die auf verschiedene Datensätze angewendet werden können. Dies wird es den Forschern ermöglichen, sowohl in Bezug auf die Daten als auch auf die analytischen Fähigkeiten auf früheren Arbeiten aufzubauen. Es wird auch redundante Anstrengungen zwischen Forschungseinheiten reduzieren und den Anforderungen einer verantwortungsbewussten KI gerecht werden. Diese Fähigkeiten sind für alle zugänglich, die bereit sind, ihre Daten, Datenvorverarbeitung und analytischen Implementierungen in zulässiger Form zu teilen. Basierend auf früheren Arbeiten zu OpenML ermöglicht BERD@NFDI es Benutzern, die algorithmische Leistung zu bewerten für Daten zu BERD@NFDI und für ihre eigenen Daten, um potenzielle neue Anwendungen sowie Leistungsunterschiede zwischen Anwendungen von Interesse schnell zu verstehen. Dies sorgt für zusätzliche Effizienz Anreize für Benutzer, mit der BERD@NFDI-Community zusammenzuarbeiten und die Ergebnisse ihrer eigenen Arbeit zu teilen. | ||
====TA 5 Preservation and Access to BERD==== | ====TA 5 Preservation and Access to BERD==== | ||
Zeile 56: | Zeile 56: | ||
==Konsortium== | ==Konsortium== | ||
=== | ===Antragstellende Institution, Ko-SprecherIn=== | ||
*Universität Mannheim | *Universität Mannheim, Sprecher: Prof. Florian Stahl, Ko-SprecherIn: Dr. Sabine Gehrlein und Prof. Hartmut Höhle | ||
===Mitantragstellende Institutionen=== | ===Mitantragstellende Institutionen=== | ||
*GESIS Leibniz-Institut für Sozialwissenschaften | *GESIS Leibniz-Institut für Sozialwissenschaften | ||
*Leibniz-Informationszentrum Wirtschaft (ZBW) | *Leibniz-Informationszentrum Wirtschaft (ZBW), Ko-Sprecher: Prof. Klaus Tochtermann | ||
*Ludwig-Maximilians-Universität München | *Ludwig-Maximilians-Universität München, Ko-SprecherIn: Prof. Frauke Kreuter, Prof. Bernd Bischl und Prof. Göran Kauermann | ||
*Universität Hamburg | *Universität Hamburg, Ko-Sprecher: Prof. Mark Heitmann | ||
*Universität Köln | *Universität Köln, Ko-Sprecher: Prof. Marc Fischer | ||
===Teilnehmende Institutionen=== | ===Teilnehmende Institutionen=== |
Version vom 25. Mai 2022, 13:54 Uhr
NFDI-Konsortium BERD@NFDI BERD@NFDI – NFDI Consortium for Business, Economic and Related Data | |
Status: | bewilligt |
Zeitraum: | 01.10.2021 bis 30.09.2026 |
Antragsteller: | Universität Mannheim |
Sprecher:innen: | Prof. Dr. Florian Stahl |
Website: | Projekt-Webseiten |
Twitter: |
Beschreibung
BERD@NFDI ist eine Initiative zum Aufbau einer leistungsstarken Plattform von Werkzeugen zur Verarbeitung, Analyse und Aufbewahrung von Geschäfts-, Wirtschafts- und verwandten Daten. Das Konsortium wird das integrierte Management von Algorithmen und Daten entlang des gesamten Forschungszyklus ermöglichen, mit besonderem Fokus auf unstrukturierte, heterogene, multimodale und große Daten wie Video, Bild, Audio, Text oder mobile Daten.
Weiterführende Information zu BERD@NFDI ist hier zu finden: [1]
Ziele
BERD@NFDI wird eine Infrastruktur für die Herausforderungen der erweiterten empirischen Forschung bereitstellen und nicht nur den Aufbau von Gemeinschaften fördern sondern auch öffentlich verfügbare und online zugängliche Datensätze anbieten und die Datendokumentation und -aufbewahrung nach den FAIR-Prinzipien verbessern. Ziel ist es ein Algorithmus-Repository und Benchmarks, Rechen- und Speicherleistung zur Analyse von (großen) Daten sowie eine breite Palette von APIs zur Interaktion mit externen Systemen zu entwickeln und zu etablieren.
Im Folgenden werden die Ziele der Arbeitsbereiche skizziert:
TA 1 BERD Community Involvement
Die Benutzergemeinschaft, die das Publikum der BERD@NFDI-Infrastruktur repräsentiert, spielt eine Schlüsselrolle in diesem Projekt. Der Aufbau einer Kommunikationsverbindung mit der Community ist ein wichtiger erster Schritt. Basierend auf dieser Verbindung werden eine Anforderungserfassung und kontinuierliche Feedbackprozesse durchgeführt, die für die Bereitstellung und Aufrechterhaltung der richtigen Dienste für die Benutzer unerlässlich sind. Die Einbindung von Wissenschaft (z. B. VHB) und Bibliotheken unterstützt den Prozess der Anforderungserhebung. Beim Requirements Engineering wirdauf nutzerzentrierte Methoden gesetzt. In der ersten Phase dient das benutzerzentrierte Design dazu, die Anforderungen an die Infrastruktur von der Konzeption bis zur Implementierung zu identifizieren. Die zweite Phase dreht sich weiterhin um den Benutzer, diesmal jedoch in einer „Push“-Manier. Nachdem die Infrastrukturdienste implementiert sind, werden die Nutzungsaktivitäten überwacht um allgemeine Muster zu ermitteln – sowohl solche, die von allen Benutzern gefördert werden sollten, als auch solche, die von ihnen vermieden werden sollten. Daraus soll eine bestmögliche Infrastrukturnutzung abgeleitet werden. Das Benutzerfeedback erfolgt in beiden Phasen kontinuierlich und agil, sodass Lücken zwischen der Benutzerwunschliste und ihrer Umsetzung weitgehend eliminiert werden.
TA 2 Collecting BERD
Dieser Aufgabenbereich zielt darauf ab, eine robuste Infrastruktur zur kontinuierlichen Erfassung und gemeinsamen Nutzung von Forschungsdaten bereitzustellen, die für die Bereiche Wirtschafts- und Sozialwissenschaften relevant sind. Ein Fokus liegt dabei auf neue Formen von Daten aus nicht standardmäßigen Datenquellen. Darüber hinaus werden ein Prozess und Regeln festlegt, um relevante Quellen für strukturierte und unstrukturierte Daten fürdie sozialwissenschaftlichen Forschung und Entwicklung zu identifizieren, zu bewerten und zu priorisieren.
TA 3 Processing BERD
Forscher müssen sich mit einer Vielzahl von Daten und unterschiedlicher Datenqualität auseinandersetzen. Das gleiche Problem ergibt sich für die Metadaten von Ressourcen, die aus externen Quellen in die BERD@NFDI-Infrastruktur importiert werden. Liegen die Daten bereits in strukturierter Form vor, können etablierte Prüf- und Normalisierungsverfahren eingesetzt werden, um die Qualität der (Meta-)Daten zu verbessern. Für unstrukturierte Daten werden neue Methoden der Klassifizierung, Normalisierung und Qualitätsbewertung angewendet, aber es gibt keinen allgemein anerkannten Standard. Beim Umgang mit historischen Datenquellen müssen zudem gedruckte Quellen zunächst mit Texterkennungsverfahren digitalisiert und maschinenlesbar gemacht werden. In allen Fällen können datenschutzrechtliche Anforderungen eine weitere Verarbeitung erforderlich machen, wie z. B. eine Anonymisierung zum Schutz personenbezogener Daten.
BERD@NFDI wird die Forschungsgemeinschaft dabei unterstützen, geeignete Methoden zur Verarbeitung in BERD auszuwählen, zu dokumentieren und zugänglich zu machen.
TA 4 Analyzing BERD
Um Daten für Forschungsanwendungen in Wirtschaft und verwandten Bereichen nutzbar zu machen, wird BERD@NFDI analytische Ansätze dokumentieren, die auf verschiedene Datensätze angewendet werden können. Dies wird es den Forschern ermöglichen, sowohl in Bezug auf die Daten als auch auf die analytischen Fähigkeiten auf früheren Arbeiten aufzubauen. Es wird auch redundante Anstrengungen zwischen Forschungseinheiten reduzieren und den Anforderungen einer verantwortungsbewussten KI gerecht werden. Diese Fähigkeiten sind für alle zugänglich, die bereit sind, ihre Daten, Datenvorverarbeitung und analytischen Implementierungen in zulässiger Form zu teilen. Basierend auf früheren Arbeiten zu OpenML ermöglicht BERD@NFDI es Benutzern, die algorithmische Leistung zu bewerten für Daten zu BERD@NFDI und für ihre eigenen Daten, um potenzielle neue Anwendungen sowie Leistungsunterschiede zwischen Anwendungen von Interesse schnell zu verstehen. Dies sorgt für zusätzliche Effizienz Anreize für Benutzer, mit der BERD@NFDI-Community zusammenzuarbeiten und die Ergebnisse ihrer eigenen Arbeit zu teilen.
TA 5 Preservation and Access to BERD
Dieser Aufgabenbereich unterstützt die Datenerhaltung und Zugriffsaktivitäten auf digitale Inhalte in BERD@NFDI. Aufgrund der unterschiedlichen Ebenen und Formen von Datenstrukturen, mit denen das Projekt konfrontiert ist (von streng standardisierten bis zu nicht standardisierten Daten), müssen geeignete Methoden zur Datenerhaltung auf Metadaten- und Datenebene entwickelt werden. RDA ist eine der großen Organisationen, die Aktivitäten zur Datenaufbewahrung steuert. Dies wird der Ausgangspunkt für die Entwicklung einer Datenerhaltungsstrategie für BERD@NFDI sein. Darüber hinaus sind der Data Management Plan Guide und das DMP-Tool selbst eine weitere Initiative, die ebenfalls berücksichtigt wird. Der Data Management Plan Guide hebt die Bedeutung der Planung von Datenlebenszyklusaktivitäten, z. B. Datenkuratierung und Datenerhaltung, in einem frühen Stadium des Forschungsdateninfrastrukturprojekts hervor und bietet außerdem bewährte Metadatenpraktiken. Darüber hinaus unterstützen viele Initiativen auch die Erhaltung digitaler Assets auf der Grundlage spezifischer (restriktiver) und benutzerdefinierter (minimaler) Sätze von Metadatenelementen. Damit sind (Meta-)Datenintegrität, (sicherer) Speichermechanismus und Datenmigrationsstrategie die Hauptziele für die BERD@NFDI-Aufbewahrung.
TA 6 Re-using BERD
BERD@NFDI zielt darauf ab, eine zentrale Anlaufstelle zu schaffen, an die sich Forschende aus Wirtschaftswissenschaften und verwandten Bereichen wenden können, wenn sie Rat brauchen, um ihre Daten FAIR zu machen. Diese Kontaktstelle wird die bereits erzielten Ergebnisse des deutschen GO FAIR-Büros bei der ZBW nutzen und weiterentwickeln. Ziel von BERD@NFDI ist es, seine Nutzer zu unterstützen, damit sie die Tools und Dienste der Infrastruktur effektiv nutzen können. Schließlich zielt es darauf ab, ein automatisiertes System zur Datenverwaltung aufzubauen, das allen NFDIs zugute kommt, unabhängig von ihrem thematischen Fokus.
Konsortium
Antragstellende Institution, Ko-SprecherIn
- Universität Mannheim, Sprecher: Prof. Florian Stahl, Ko-SprecherIn: Dr. Sabine Gehrlein und Prof. Hartmut Höhle
Mitantragstellende Institutionen
- GESIS Leibniz-Institut für Sozialwissenschaften
- Leibniz-Informationszentrum Wirtschaft (ZBW), Ko-Sprecher: Prof. Klaus Tochtermann
- Ludwig-Maximilians-Universität München, Ko-SprecherIn: Prof. Frauke Kreuter, Prof. Bernd Bischl und Prof. Göran Kauermann
- Universität Hamburg, Ko-Sprecher: Prof. Mark Heitmann
- Universität Köln, Ko-Sprecher: Prof. Marc Fischer
Teilnehmende Institutionen
- Gesellschaft für Sozial- und Wirtschaftsgeschichte (GSWG)
- Gesellschaft für Unternehmensgschichte (GUG)
- Institut für Bank- und Finanazgeschichte (IBF)
- Leibniz-Institut für ökologische Raumentwicklung e.V. (IOER)
- Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften in Garching (LRZ)
- Leibniz-Institut für Finanzmarktforschung SAFE („Sustainable Architecture for Finance in Europe“)
- Rat für Sozial- und Wirtschaftsdaten (RatSWD)
- Verband der Hochschullehrer für Betriebswirtschaft e.V. (VHB)
- Verein für Sozialpolitik, Wirtschaftshistorischer Ausschuss
- Leibniz-Zentrum für Europäische Wirtschaftsforschung (ZEW)