Post on 30-Jul-2015
transcript
Stand und Perspektive des globalen Verzeichnisses von Forschungsdaten-Repositorien re3data.org
Maxi Kindling | Humboldt-Universität zu Berlin Heinz Pampel, Roland Bertelmann, Paul Vierkant | Deutsches Geo-ForschungszentrumFrank Scholze | KIT Karlsruhe
8. DFN-Forum Kommunikationstechnologien | FH Lübeck, 08.06.2015
Agenda
• Hintergrund
• Funktionen
• Projekt
• Nachhaltigkeit und Lessons Learned
Digitale Forschungsdaten
• Digital vorliegende Daten, die während des
Forschungsprozesses entstehen oder Ergebnis sind
(Generierung und Nachnutzung)
• Disziplinspezifische Methoden und Werkzeuge
(Datentypen, Datenformate, Aggregationsstufen)
• Datendokumentation: Entstehungskontext, Prozessierung,
Aufbereitung, Analyse, Archivierung Basierend auf: Kindling & Schirmbacher (2013). Die digitale Forschungswelt als Gegenstand der Forschung. In: Information - Wissenschaft & Praxis Bd. 64, H. 2-3, S. 137-148. DOI: 10.1515/iwp-2013-0017
Hintergrund
European Commisson. (2014). Horizon 2020 Annotated Model Grant Agreements. Version 1.6.2 .Retrieved fromhttp://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf
• Förderorganisationen: Data Policies
• Beispiel: Europäische Kommission
Hintergrund
NPG (2013). Availability of data and materials. Retrieved from http://www.nature.com/authors/policies/availability.htmlPLOS (2014). PLOS Editorial and Publishing Policies. Retrieved from http://www.plosone.org/static/policies.action
• Journals: Data Policies
• Beispiel: Nature Publishing Group
• “[...] authors are required to make materials, data andassociated protocols promptly available to readerswithout undue qualifications. “
• Beispiel: PLOS
• “PLOS journals require authors to make all dataunderlying the findings described in their manuscriptfully available without restriction, with rare exception.“
Hintergrund
NPG (2013). Availability of data and materials. Retrieved from http://www.nature.com/authors/policies/availability.htmlPLOS (2014). PLOS Editorial and Publishing Policies. Retrieved from http://www.plosone.org/static/policies.action
• Journals: Data Policies
• Beispiel: Nature Publishing Group
• “[...] authors are required to make materials, data andassociated protocols promptly available to readerswithout undue qualifications. “
• Beispiel: PLOS
• “PLOS journals require authors to make all dataunderlying the findings described in their manuscriptfully available without restriction, with rare exception.“
Hintergrund
Deutschlands Zukunft gestalten. Koalitionsvertrag zwischen CDU, CSU und SPD. 18. Legislaturperiode. Retrieved fromhttps://www.cdu.de/sites/default/files/media/dokumente/koalitionsvertrag.pdf
• Wissenschaftspolitische Diskussion
• Beispiel: Koalitionsvertrag
Hintergrund• Heterogene Landschaft der Forschungsdaten-Repositorien
• Beispiele: Disziplinäre Repositorien
Pampel, H. et al. (2013). Making Research Data Repositories Visible: The re3data.org Registry. PLOS ONE, 8(11), e78080. doi:10.1371/journal.pone.0078080
PANGAEA, http://www.pangaea.deGEO, http://www.ncbi.nlm.nih.gov/geo/
Hintergrund• Heterogene Landschaft der Forschungsdaten-Repositorien
• Beispiele: Institutionelle Repositorien
Pampel, H. et al. (2013). Making Research Data Repositories Visible: The re3data.org Registry. PLOS ONE, 8(11), e78080. doi:10.1371/journal.pone.0078080
Open Data LMU, http://data.ub.uni-muenchen.de/PURR, http://research.hub.purdue.edu
Hintergrund• Heterogene Landschaft der Forschungsdaten-Repositorien
• Beispiele: Projektbezogene Forschungsdaten-Repositorien
Pampel, H. et al. (2013). Making Research Data Repositories Visible: The re3data.org Registry. PLOS ONE, 8(11), e78080. doi:10.1371/journal.pone.0078080
BDPP, http://www.digitalpantheon.ch
SDDB, http://www.scientificdrilling.org
Hintergrund• Heterogene Landschaft der Forschungsdaten-Repositorien
• Beispiele: Generische Forschungsdaten-Repositorien
Pampel, H. et al. (2013). Making Research Data Repositories Visible: The re3data.org Registry. PLOS ONE, 8(11), e78080. doi:10.1371/journal.pone.0078080
Figshare, http://figshare.com
Zenodo, http://zenodo.org
Veröffentlichungsstrategien
Pampel, H., & Dallmeier-Tiessen, S. (2014). Open Research Data: From Vision to Practice. In S. Bartling & S. Friesike (Eds.), OpeningScience. The Evolving Guide on How the Internet is ChangingResearch, Collaboration and Scholarly Publishing (pp. 213–224). Heidelberg: Springer. doi:10.1007/978-3-319-00026-8
• Veröffentlichung der Forschungsdaten als eigenständiges
Informationsobjekt in einem Daten-Repositorium
• Veröffentlichung der Forschungsdaten als textuelle
Dokumentation im Rahmen eines begutachteten „Data
Papers“
• Veröffentlichung der Forschungsdaten als Ergänzung zu
einem begutachteten Artikel („enhanced publication“)
doi:XX.XXXX/XXX.XX
doi:XX.XXXX/XXX.XX
doi:XX.XXXX/XXX.XX
doi:XX.XXXX/XXX.XX
doi:XX.XXXX/XXX.XX
RRZE Icon Set (CC: BY-SA)
Mission• re3data.org
• is a global registry of research data repositories
• covers research data repositories from all academic
disciplines
• helps researchers, funding bodies, publishers and
scholarly institutions to find research data repositories
• aims to promote a culture of sharing, increased access
and better visibility of research data
Pampel, H. et al. (2013). Making Research Data Repositories Visible: The re3data.org Registry. PLOS ONE, 8(11), e78080. doi:10.1371/journal.pone.0078080
simple search box
filters
results icons
Schema• Schema for the Description of Research Data Repositories
• Das Schema umfasst folgende Aspekte:
• general information (e.g. short description of theRDR, content types, keywords)
• responsibilities (e.g. institutions responsible forfunding, content or technical issues)
• policies (e.g. policies of the RDR, incl. there URL)• legal aspects (e.g. licenses of the database and
datasets)• technical standards (e.g. APIs, versioning of datasets,
software of the RDR)• quality standards (e.g. certificates, audit processes)
Vierkant, P., et al. (2014). Schema for the Description of Research Data Repositories. Version 2.2. doi:10.2312/re3.006
Icons
Vierkant, P., et al. (2014). Schema for the Description of Research Data Repositories. Version 2.2. doi:10.2312/re3.006
Workflow
Wachstum
0
200
400
600
800
1000
1200
1400
Aug-
12
Sep-
12O
ct-1
2
Nov
-12
Dec-
12
Jan-
13
Feb-
13
Mar
-13
Apr-
13
May
-13
Jun-
13
Jul-1
3
Aug-
13Se
p-13
Oct
-13
Nov
-13
Dec-
13
Jan-
14Fe
b-14
Mar
-14
Apr-
14
May
-14
Jun-
14
Jul-1
4
Aug-
14Se
p-14
Oct
-14
Nov
-14
Dec-
14
Jan-
15Fe
b-15
Mar
-15
Apr-
15
Indexed ResearchData Repositories
Verankerung in Leit- und Richtlinien• Beispiel: Europäische Kommission
• Beispiel: Universität Bielefeld
• „Verzeichnisse, wie das DFG-geförderte "Registry of Research Data Repositories", bilden die
Grundlage für die Suche nach geeigneten Publikationsorten für die Forschungsdaten. “
• Beispiel: Scientific Data (NPG)
• „Physics, astrophysics, astronomy and geoscience databases should be registered with
re3data.org.“
• Humboldt-Universität zu Berlin (2014): Handlungsempfehlungen in Ergänzung zu den Grundsätzen zum Umgang mit Forschungsdaten an der Humboldt-Universität zu Berlin: https://www.cms.hu-berlin.de/de/ueberblick/projekte/dataman/policy/guidelines
Scientific Data (2013): Data policies. http://www.nature.com/sdata/data-policies
Universität Bielefeld (2011): Resolution zum Forschungsdatenmanagement. https://data.uni-bielefeld.de/de/resolution re3data
Projektpartner• Deutschland
• Deutsches GeoForschungsZentrum GFZ, Library and
Information Services (LIS)
• Humboldt-Universität zu Berlin, Institut für Bibliotheks-
und Informationswissenschaft (IBI)
• Karlsruher Instituts für Technologie (KIT), KIT-Bibliothek
• Förderung durch die Deutsche Forschungsgemeinschaft
• USA• Purdue University, Purdue Libraries
• Förderung durch das Institute of Museum and Library
Services (IMLS)
Projektpartner• Deutschland
• Deutsches GeoForschungsZentrum GFZ, Library and
Information Services (LIS)
• Humboldt-Universität zu Berlin, Computer- und
Medienservice (CMS)
• Karlsruher Instituts für Technologie (KIT), KIT-Bibliothek
• Förderung durch die Deutsche Forschungsgemeinschaft
• USA• Purdue University, Purdue Libraries
• Förderung durch das Institute of Museum and Library
Services (IMLS)
Kooperationspartner
• Deutsche Initiative für Netzwerkinformation e.V. (DINI)
• DataCite (MoU, April 2012)
• OpenAIRE (MoU, Oktober 2013)
• BioSharing (MoU, November 2013)
• Databib (MoU, März 2014)
• DataCite (Kooperationsvereinbarung, März 2015)
Kooperationspartner
• Deutsche Initiative für Netzwerkinformation
• DataCite (MoU, April 2012)
• OpenAIRE (MoU, Oktober 2013)
• BioSharing (MoU, November 2013)
• Databib (MoU, März 2014)
• DataCite (Kooperationsvereinbarung, März 2015)
Vielen Dank für Ihre Aufmerksamkeit!
Wiki Forschungsdaten.org
info@re3data.org
http://re3data.orgWith the exception of all photos and graphics, this slides are licensed under the “Attribution 4.0 International (CC BY 4.0)“ Licence: http://creativecommons.org/licenses/by/4.0/
Vier Dimensionen der Nachhaltigkeit
TECHNOLOGIE
RECHTLICHESFINANZIERUNG
ORGANISATION
Nachhaltigkeit: Technologie• Offene Schnittstellen
• RESTful API
• OpenSearch
• Dokumentation: http://www.re3data.org/api/doc
• Diverse Nutzungsszenarien z. B. durch OpenAIRE
• Offene Metadaten
• Dokumentation: http://www.re3data.org/schema/
• Langfristiger technischer Betrieb durch das KIT
Nachhaltigkeit: Rechtliches• Offene Lizenzen
• CC BY für die Website
• CC 0 für die Metadaten
Nachhaltigkeit: Organisation• Zusammenschluss mit Databib im Rahmen von DataCite
• Steuerung durch DataCite Arbeitsgruppe
• Indexierung durch internationales Editorial Board
• Diverse Kooperationen u. a. auch im Rahmen der Research
Data Alliance (US/EU/DE)
• „Community Building“ z. B. Entwicklung des Schemas im
Dialog mit der relevanten Akteuren
• Wiki Forschungsdaten.org
Nachhaltigkeit: Finanzierung• Finanzierung des technischen Betriebs durch
DataCite
• Entscheidungen über Weiterentwicklungen und
deren Finanzierung durch DataCite
• Ggf. weitere Drittmittelprojekte
Lessons Learned
• Offenheit als Paradigma des Projekts hat sich bewährt („Open
Science“)
• Bereitschaft zu Kooperationen –Vermeidung von Redundanzen
• Offene Konsultationsprozesse sind hilfreich (Beispiel:
Entwicklung des Schemas)
• Qualitätssicherung durch internationales Editorial Board
• DataCite – verlässlicher Partner für die Weiterentwicklung