Datenmanagementpläne an der Universität Wien...15 FFG Die Österreichische...

Post on 22-May-2020

0 views 0 download

transcript

Datenmanagementpläne an der Universität Wien Dr. Susanne Blumesberger & Mag. Barbara Sánchez Solís, ÖAW, 16. März 2016

Agenda

• Begriffsdefinitionen » Forschungsdaten » Forschungsdatenmanagement (FDM) » Open Data, Open Science » Datenmanagementpläne (DMP)

• Anforderungen der nationalen und internationalen Fördergeber

• Vertiefende Hinweise zu Datenmanagement

» Datenarchive/Repositorien » Data Sharing

Begriffsdefinitionen Forschungsdaten

Forschungsdatenmanagement (FDM)

Open Data, Open Science

Datenmanagementpläne (DMP)

4

Was sind Forschungsdaten?

• Zahlreiche Definitionen von Forschungsdaten

• Definitionsversuch (einer unter vielen) …

„Unter dem Begriff "Forschungsdaten" sind alle Daten zu verstehen, die im Zuge wissenschaftlicher Forschungs- und kunstlerischer Schaffensprozesse entstehen (z.B. Text, Tabellen, Video, Audio, Grafik etc.) und/oder auf deren Grundlage Ihre Forschungsergebnisse und/oder Kunstwerke basieren – z.B. durch Experimente, Quellenforschungen, Messungen, Erhebungen, Digitalisate oder Entwurfe.“

5

Was ist Forschungsdatenmanagement (FDM)?

Quelle: Quelle: Helbig, Kerstin ; Aust, Pamela. Datenmanagementpläne für EU, DFG und BMBF. November 2015. Workshop-Unterlagen online unter: http://dx.doi.org/10.5281/zenodo.33482

• Der Umgang mit Daten entlang des gesamten Daten-Lebenszyklus (von der Generierung bis zur Nachnutzung)

• Der Umgang mit Daten in derlei Art und Weise, dass Daten für eine Nachnutzung auffindbar, zugänglich, authentisch, zitierbar und die rechtlichen Verhältnisse geklärt sind

»Data Management starts on Day

One« (OpenAIRE)

6

FAIR Data Principles Findable

Accessible

Interoperable

Re-usable

7

Open Data

»Open data and content can be freely used, modified and shared by anyone for any

purpose« http://opendefinition.org

Offene Arbeitsmethoden:

Dokumentation und Teilen von Workflows und Methoden

Offenlegung und Teilen von Codes und Tools

Verwendung webbasierter Technologien

9

Was ist ein Datenmanagement-

plan (DMP)?

• Ein strukturierter Leitfaden (Dokument oder Online-Tool), der den gesamten Lebenszyklus von Daten abdeckt

• Ein DMP ist ein „lebendes“ Dokument (soll während des Projekts angepasst und aktualisiert werden)

• Instrument für effizientes Datenmanagement (nicht Datenmanagement selbst!)

• Forschende machen sich bei der Projektplanung durch einen DMP Gedanken über:

» geeignete Formate, Standards, Dokumentationen, Speicherung, Archivierung und ggf. über Rechtsberatung oder technische Hilfeleistungen (ev. finanzieller Impact)

Weshalb ein DMP? (Für Forschende,

Förderer, Universitäten &

Gesellschaft)

• Effizienter Einsatz von Ressourcen (auch zeitliche)

• Planung und Kostentransparenz

• Verständnis für eigene Arbeitsprozesse

• Klärung von Rollen und Verantwortlichkeiten

• Rechtssicherheit

• Steigerung der Sichtbarkeit (Zitation) von Forschenden und Institutionen

• Kontinuierliche Nachnutzung von Daten

» Ermöglicht Validierung von Forschung

» Fördert Kollaboration

» Unterstützt Nachfolgeprojekte

» Fördert Innovation

» Legt den Grundstein für Open Science

» Ermöglicht Verwendung der Daten für Lehre

» Involviert die Öffentlichkeit/Gesellschaft (Citizen Science)

11 Grafik: Workflow-Modell für die digitale Archivierung, ©Raman Ganguly, e-Infrastructures Austria

12 Grafik: Rollenmodell, ©Raman Ganguly, e-Infrastructures Austria

Vorgaben der nationalen Fördergeber FWF – Der Wissenschaftsfonds

FFG - Die Österreichische Forschungsförderungsgesellschaft

14

FWF „Open Research

Data Pilot “

• „Forschungsdaten [beinhalten] auch Software“

• „Die Forschungsdaten müssen (1) nach den neuesten technischen Standards, (2) frei zugänglich (Open Access), (3) reproduzierbar, (4) maschinenlesbar, (5) zitierfähig sowie unter (6) Verwendung möglichst offener Lizenzen zur uneingeschränkten Weiterverwendung (7) in registrierten Repositorien publiziert werden“

15

FFG Die Österreichische

Forschungsförde-rungsgesellschaft

• Open Access und Open Data:

» Policy bis Ende 2016 zu erwarten

• FFG ist National Contact Point for Horizon 2020

» Schwerpunkt-Veranstaltung zu Open Research Data in H2020 und Webinar - Informationen über Rechts- und Finanz-News bzw. Mailinglisten

» Generelle Informationen zu Kontakt, Serviceleistungen und Veranstaltungen siehe: https://www.ffg.at/europa/ncp

Vorgaben der internationalen Fördergeber Europäische Kommission: Horizon 2020

17

Horizon2020 Open Access

Publikationen

• Alle wissenschaftlichen Publikationen mit Peer Review müssen in H2020 Open Access veröffentlicht werden – Verpflichtung!

• Publikationen ohne Peer Review: OA-Veröffentlichung freiwillig

• Mindestvoraussetzung:

» Publikationen müssen online gelesen, heruntergeladen und ausgedruckt werden können

» Weitergehende Rechte der LeserInnen (z.B. Bearbeitung, Verbreitung) sind erwünscht, aber nicht verpflichtend

» Zur Validierung der Ergebnisse nötige Daten („underlying data“) sollten zeitgleich veröffentlicht werden – Verpflichtung nur im Rahmen des Open Research Data Pilot

18

Horizon2020 Open Data

Research Data Pilot Allgemeines

• Verpflichtende Veröffentlichung von Forschungsdaten für ausgewählte Programmbereiche („Work Programme“)

• Opt-in/opt-out möglich

» Opt-in/opt-out hat keinen Einfluss auf die Evaluierung; Opt-out ist im Antrag und während des Projekts möglich

• Wenn Daten nicht veröffentlicht werden, sind die Gründe dafür anzugeben (z.B. Datenschutz)

• Datenmanagementkosten sind förderfähig

» Archivierungskosten: direkte Kosten (messbar)

19

Open Research Data Pilot: Teilnehmende Programmbereiche 2016-17

1. Future and Emerging Technologies

2. Research infrastructures

3. Leadership in enabling & industrial technologies – Information & Communication Technologies

4. Nanotechnologies, Advanced Materials, Advanced Manufacturing & Processing, & Biotechnology – 'nanosafety' & 'modelling' topic

5. Societal Challenge – Food security, sustainable agriculture & forestry, marine & maritime & inland water research & the bioeconomy - selected topics as specified in the work programme

6. Societal Challenge – Climate Action, Environment, Resource Efficiency & Raw Materials – except raw materials

7. Societal Challenge – Europe in a changing world – inclusive, innovative & reflective societies

8. Science with & for Society

9. Cross - cutting activities – focus areas – part Smart & Sustainable Cities

Quelle: European Commission: Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020: http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf

20

Horizon2020 Open Data

Research Data Pilot Welche Daten?

• Um welche Daten geht es?

» Underlying data = Daten, die dazu dienen, Forschungsergebnisse (= Publikationen) zu validieren

und/oder

» Other data = andere Daten bzw. Rohdaten, wie im DMP festgehalten

• Merke: Die Teilnahme am Open Data Pilot verpflichtet nicht dazu, alle Daten offen zur Verfügung zu stellen

«As open as possible, as closed as

necessary» (H2020)

21

Horizon2020 Open Data

Research Data Pilot Data Management

Plans

• Jedes Konsortium legt in einem Data Management Plan fest, welche Daten veröffentlicht werden

• Der DMP muss up-to-date gehalten werden (initial/mid term/final)

• Die erste DMP-Version muss innerhalb der ersten 6 Monate des Projekts geliefert werden

• Aktualisierte Versionen

» im Falle von signifikanten Änderungen während des Projekts (zB neue Datensets, Änderungen im Konsortium)

» mind. bis Projektende bzw. vor Reviews

• Ein bestimmtes Formular wird derzeit von der Europäischen Kommission nicht vorgeschrieben. Forschende können das Horizon2020 Template auf der Online-Plattform DMPonline verwenden: https://dmponline.dcc.ac.uk/

22

Horizon2020 Open Data

Research Data Pilot DMP Aspekte

• Aspekte die durch DMP abgedeckt sein müssen

» Daten sind in einem beliebigen Datenrepositorium abzulegen

» Dritte müssen das Recht zur kostenlosen Weiterverwendung haben („access, mine, exploit, reproduce, dissseminate“)

» Daten und Tools müssen entsprechend dokumentiert sein (auch Informationen über Software, Software Code, Algorithmen usw.)

23

Horizon2020 Open Data

Research Data Pilot DMP Inhalte

• Inhalte die durch DMP abgedeckt sein müssen

» Name und Beschreibung der Daten: Ursprung, Art, Umfang, Nutzen, Zusammenhang mit Publikationen

» Standards, Metadaten

» Data Sharing: offener/beschränkter Zugang, Sperrfristen, Repositorium, Gründe, wieso Daten nicht veröffentlicht werden (Datenschutz, Sicherheit usw.)

» Dauer der Archivierung, Kosten, Kostentragung

Vertiefende Informationen zu Datenmanagement Data Sharing

Datenarchive/Repositorien

Data Sharing Prozess

• Sind die Rechte auf die Daten geklärt?

• Sollten die Daten (vorerst) nur innerhalb des Projekts/des Instituts oder gleich öffentlich geteilt werden?

• Welche Daten sollten mit welcher Nutzungslizenz zur Verfügung gestellt werden?

• Wo sollten die Daten zur Verfügung gestellt werden?

• Wie erfahren potenzielle NutzerInnen von den Daten?

• Wird ein Persistent Identifier (DOI, URN, Handle etc.) zur leichteren Zitation der Daten vergeben?

• Welcher Dissemination-Plan wird verfolgt?

Data Sharing Lizenzen

• Bei der Veröffentlichung von Forschungsdaten verwendet man am besten Lizenzen (z.B. Creative Commons License, General Public License, GNU etc.). Nähere Informationen unter:

» http://opendefinition.org/guide/data/

» http://opendefinition.org/licenses/

» GNU Lizenzen: http://www.gnu.org/licenses/licenses.de.html

» https://wiki.creativecommons.org/wiki/Data_and_CC_licenses

» EUDAT: Tool für die Auswahl einer geeigneten Forschungsdaten-Lizenz: https://b2share.eudat.eu/

» FAQs zu Creative-Commons-Lizenzen unter besonderer Berücksichtigung der Wissenschaft (e-Infrastructures Austria): https://phaidra.univie.ac.at/detail_object/o:408042

» Open Access Office Universität Wien: http://openaccess.univie.ac.at/ openaccess@univie.ac.at

• Projekt re3data.org - Registry of Research Data Repositories

• Globales Verzeichnis von Forschungsdatenrepositorien

• Nachweis von weltweit 1.475 Repositorien

» disziplinäre, multidisziplinäre, behördliche, institutionelle und projektspezifische

Grafik: Suchmaske von re3data.org

29

Quelle: Helbig, Kerstin ; Aust, Pamela. Datenmanagementpläne für EU, DFG und BMBF. November 2015. Workshop-Unterlagen online unter: http://dx.doi.org/10.5281/zenodo.33482

Wie wählt man ein Repositorium aus? Weitere Kriterien:

Freier Zugang zum Repositorium

Policies/Nutzungsbedingungen

Beibehaltung der Datenhoheit

Persistente Identifikatoren für AutorInnen/Beitragende (zB

ORCID)

Interoperabilität

Zugrunde liegende Kosten- und Geschäftsmodelle

Fortbestand des Repositoriums

30

Disziplinspezifische Speicher-Infrastrukturen (EU)

Grafik aus: Sarah Jones: The European Framework: Horizon 2020 and the Open Research Data pilot. Bologna, Workshop, November 2015

Speicherung (Store & Share) von Daten

an der Universität Wien

• Share (vergleichbar mit einer Festplatte, auf die berechtigte User Zugang haben)

• u:cloud (vergleichbar mit Dropbox, Vorteil von außen sichtbar, Nachteil Daten liegen am Rechner, besserer Schutz, da Daten an der Uni Wien liegen)

• GitHub Enterprise (Repositorium für Software, Testbetrieb)

• Phaidra LZA (Repositorium für Langzeitarchivierung, Daten sind nicht löschbar)

• Phaidra Temp (Archivierung bis zu 8 Jahren, Löschbarkeit ist gegeben)

• Unidam (Repositorium vorwiegend für Bilddaten, Daten sind löschbar)

• u:scholar (Dissemination von Peer-reviewed Materialien, Langzeitarchivierung in Phaidra)

• u:cris (Datenbank für Forschungsdokumentation)

32

Download DMP Templates

(Word Docs)

• Version 1.0, generische Version DE: http://phaidra.univie.ac.at/o:424283

• Version 1.0, generische Version EN: https://phaidra.univie.ac.at/view/o:424284

• Version 2.0, abgestimmt auf UNIVIE/Phaidra DE: https://phaidra.univie.ac.at/view/o:424301

• Version 2.0, abgestimmt auf UNIVIE/Phaidra EN: https://phaidra.univie.ac.at/view/o:424303

33

Österreichs Forschende und

ihre Daten

Danke für Ihre Aufmerksamkeit!

Susanne Blumesberger & Barbara Sánchez Solís

Anmerkung: Diese Präsentation entstand auf Basis von Vorarbeiten im Rahmen von Phaidra/Universität Wien und e-Infrastructures Austria

35

Support/Kontakt • Paolo Budroni (Leitung der Abteilung Phaidra) paolo.budroni@univie.ac.at

• Susanne Blumesberger (Stellv. Leitung Abt. Phaidra, Customermanagement, Leitung Phaidra Local), susanne.blumesberger@univie.ac.at

• Barbara Sánchez Solís (Abteilung Phaidra, e-Infrastructures Austria) barbara.sanchez.solis@univie.ac.at

• Raman Ganguly, Zentraler Informatikdienst der Universität Wien, techn. Leitung Phaidra, raman.ganguly@univie.ac.at

36

Weiterführende Quellen und Links

• Horizon 2020 - Guidelines von der EU: » Factsheet on Open Access:

https://ec.europa.eu/programmes/horizon2020/sites/horizon2020/files/FactSheet_Open_Access.pdf

» Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020: http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf

» Guidelines on Data Management in Horizon 2020 (aktualisierte Fassung/Feb 2016): http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf

!

!

37

Weiterführende Quellen und Links

• Horizon 2020: » Horizon 2020 Programmes:

http://ec.europa.eu/programmes/horizon2020/ » Horizon 2020 Grant Agreement:

http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf

» Jean-Francois Dechamp, Celina Ramjoué (European Commission: Horizon 2020 and Open Access in 10 minutes. February 2016. Vortragsfolien online unter: http://de.slideshare.net/OpenAccessEC/horizon2020-and-openaccess-in-10-minutes

» Martin Baumgartner, FFG: Open Access und Open Data in Horizon 2020, Vortrag vom 11.06.2015. Online unter: https://www.fosteropenscience.eu/content/open-access-and-open-data-horizon-2020-legal-requirements

38

Weiterführende Quellen und Links

• Weitere Unterlagen zum Verständnis des H2020 Open Research Data Pilot:

» European IPR Helpdesk: FAQs Open Access to scientific publications and research data in Horizon 2020: https://www.iprhelpdesk.eu/Fact-Sheet-Open-Access-to-Publications-and-Data-in-H2020-FAQ

» OpenAIRE guide on the Open Research Data Pilot: https://www.openaire.eu/opendatapilot

» OpenAIRE Research Data Management Briefing paper. February 2016: https://www.openaire.eu/briefpaper-rdm-infonoads

» OpenAIRE guide on the Open Research Data Pilot: https://www.openaire.eu/opendatapilot

39

Weiterführende Quellen und Links

• Forschungsdatenmanagement und DMP: » FOSTER (Facilitate Open Science Training for

European Research): https://www.fosteropenscience.eu/

» RDA (Research Data Alliance) Europe Training Programme: http://europe.rd-alliance.org/training-programme

» Mantra (University of Edinburgh): http://datalib.edina.ac.uk/mantra

» Research Data Oxford: http://researchdata.ox.ac.uk/

» Australian National Data Service (ANDS): http://ands.org.au/working-with-data/data-management/data-management-plans

» Stanford University Libraries: https://library.stanford.edu/research/data-management-services/data-management-plans

» Forschungsdaten in Sozial- und Wirtschaftswissenschaften: http://auffinden-zitieren-dokumentieren.de/

» DMPTool (US): https://dmptool.org/

40

Weiterführende Quellen und Links

DMPOnline:

» DMPonline des Digital Curation Centre (DCC), UK: https://dmponline.dcc.ac.uk/

» Digital Curation Center (DCC) resources on DMPs: www.dcc.ac.uk/resources/data-management-plans