Post on 29-Oct-2019
transcript
Maurice Heinrich / Felix Schäferhttp://www.ianus-fdz.de
3. Arbeitstreffen der Delegationsgruppe
Maurice Heinrich / Felix Schäferhttp://www.ianus-fdz.de
3. Arbeitstreffen der Delegationsgruppe
223.01.2013
AGENDA
10.00 Uhr – 10.15 Uhr 1. Begrüßung und Formalia
10.15 Uhr – 11.15 Uhr 2. Kurzbericht Vor-Ort-Begehung GESIS (Köln)
11.15 Uhr – 12.15 Uhr 3. Kurzbericht Vor-Ort-Begehung MPI/TLA (Nijmegen)
12.15 Uhr – 13.00 Uhr - Mittagspause -
13.00 Uhr – 13.30 Uhr 4. Übersicht der besuchten Datenzentren
13.30 Uhr – 14.30 Uhr 5. Diskussion der Ergebnisse
14.30 Uhr – 15.00 Uhr 6. Geplante Begehungen weiterer Datenzentren
15.00 Uhr – 15.30 Uhr - Kaffee-Pause -
15.30 Uhr – 16.30 Uhr 7. Künftige Aufgaben und Ziele der Arbeitsgruppe
16.30 Uhr – 17.00 Uhr 8. Abschlussdiskussion
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
323.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
423.01.2013
GESIS -
Datenarchiv für Sozialwissenschaften, Köln
2.1 Geschichte
2.2 Zahlen & Fakten
2.3 Organisationsstruktur
2.4 Finanzierung & Kostenstruktur
2.5 Daten
2.6 Workflows
2.7 Nutzung
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
523.01.2013
2.1 Geschichte des Datenarchivs
Gründung: 1960 als Zentralarchiv für Empirsche Sozialforschung an der Uni Köln
1986 Mitglied des neu gegründeten GESIS-Institutes
2008 Umstrukturierung von GESIS (drei Teil-Institute vereint), Datenarchiv seitdem wissenschaftliche Abteilung innerhalb von GESIS
Ziele/Aufgaben:
Langfristige Speicherung von relevanten Studien sichernZugang zu Studien und Ergebnissen gewährleisten (auch internat.)Primärforscher durch Dienstleistungen unterstützenSekundäranalysen ermöglichen durch DatenaufbereitungEigene Forschung mit archivierten Daten durch GESIS
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
623.01.2013
2.1 Geschichte des Datenarchives
Datengeber: Projekte in GESIS, Universitäten, Politik, Barometer, etc. (überwiegend Soziologie und Politikwissenschaft)keine amtlichen Statistikdaten
LZA-Partner: keine externen Partner, Daten werden In-House verwaltet, archiviert und an GESIS-Standorten gespiegelt
Referenzmodell: OAIS nicht vollständig umgesetzt
Software: Sukzessive Eigenentwicklungen(v.a. Datenbank für Metadaten)
Repository: keines, stattdessen Dateibasierte Verzeichnisstrukturalle zu einer Studie gehörenden digitalen Objekte werden so abgelegt, dass sie den Archiv-Lebenszyklus reflektieren
Gebühren: gestaffelte Gebühren für Nutzung von Archivdatengemäß Gebührenordnung zwischen 50 – 250 €
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
723.01.2013
2.1 Geschichte des Datenarchives
Seit über 50 Jahren praktische Erfahrung in der Datenarchivierung
Datenarchiv ist ein Digitales Langzeitarchiv und betreibt Digital Curation
in erster Linie nationale und international-vergleichende Umfragen zu soziologischen und politikwissenschaftlichen Fragestellungen = Daten sind strukturell relativ homogen
Gewachsene Infrastruktur mit stetig veränderten Prozessen, Systemen und Aufgaben
Erhalt der Nutzbarkeit und Interpretierbarkeit von Daten hauptsächlich durch Migrationsstrategien erreicht
Im Fokus stand/steht die Nachnutzung von Daten: „neue Fragen an alte Daten“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
823.01.2013
2.2 Zahlen & Fakten Datenarchiv
Speicherplatz: gesamt 1-2 TB
Datensatzgröße: ca. 200-400 MB/Studie
Datenzuwachs: 30-60 GB
Anzahl Datensätze:5.100 Studien (primär Mikrodaten der Umfrageforschung)
Nutzung: ca. 35.000 Datenweitergaben pro Jahr, überwiegend akademische Nutzung (Forschung, Lehre)
Metadatenmodelle:DDI, SDMX
Persist. Identifier: DOI
Mitarbeiter: 30 Wiss. Ma. + 20 Entwickler + Wiss. Hk,insgesamt 30 Vollzeitstellen
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
923.01.2013
2.3 Organisationsstruktur GESIS
Personal: 268 (davon ca. 170 wiss. MA) an 3 Standorten
Träger: Bund-Länder-Förderung
Rechtsform: Verein, Mitglied der Leibniz-Gemeinschaft
Abteilungen:
Survey Design and MethodologyDauerbeobachtung der Gesellschaft Datenarchiv Fachinformation für SozialwissenschaftenWissenstechnologien für Sozialwissenschaften
Leitlinie: Angebote orientieren sich an Forschungsdatenzyklus
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1023.01.2013
2.4 Finanzierung und Kostenstruktur GESIS
Finanzierung: durch Leibnizgemeinschaft (80 % Bund, 20 % Länder) 7 Jahre lang gesichert
Service: Garantie der LZA für 50 Jahre (enthalten in Satzung von GESIS)Langzeitspeicherung von und Zugang zu Studien
Jahresbudget: 20 Mio. € + 3-4 Mio. € Drittmittel
Kostenstruktur: Personalmittel 2/3Sachmittel 1/3
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1123.01.2013
2.5 Daten
Rollenkonzept: Datengeber → Daten zuschicken Datennutzer → Daten suchen/anschauen: ohne Einloggen Daten downloaden: Registrierung + Einloggen
Datenarchivar → erweiterte Rechte (GESIS-Personal)Administrator → Vollzugriff, alle Rechte (GESIS-Personal)
Datenbestände:
… selbst bzw. unter Beteiligung von GESIS erhoben
… akquiriert von externen Datenerzeugern
… entwickelt / produziert / transformiert unter Beteiligung von GESIS
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1223.01.2013
2.5 Daten
Zugangsarten:
Kategorie 0 → Daten/Dokumente für jedermann freigegebenKategorie A → Daten/Dokumente für akadem. Forschung und Lehre
freigegeben
Kategorie B → Daten/Dokumente nur dann für akadem. Forschung und Lehre freigegeben, wenn Ergebnisse nicht veröffentlicht werden. Ist eine Veröffentlichung geplant, muss die Genehmigung des Datenarchivs eingeholt werden
Kategorie C → Daten/Dokumente nur nach schriftlicher Genehmigung des Datengebers zugänglich
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1323.01.2013
2.6 Workflows
Akquisition von Daten
Kriterien für Auswahl und Bewertung:fachliche Relevanz, Datentypen, Bezug zu Deutschland / deutschen Forschern, Bedeutung, Qualität, …
Aufnahme ins Archiv (Ingest)
Vorbereitung der Archivierung mit Datengebern:Klärung Aufbereitungs-, Dokumentations- und Publikationsziele, rechtliche Fragen, Datenschutz, Archivierungsvertrag
Eingangskontrolle SIP:Technische Kontrolle, Vollständigkeit, Übereinstimmung Daten und Dokumentation,Fachliche Konsistenz der Daten
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1423.01.2013
2.6 Workflows
Aufnahme ins Archiv (Ingest)
Korrigierende Basis-Aufbereitung
Dokumentation:Studienbeschreibung technisch, methodisch, inhaltlich (DDI kompatibel)
Versionierung
Vergabe Persistenter Identifier (DOI):Datenregistrierung mittels da|ra
Erzeugung AIP:Originale, aufbereitete Dateiversionen, normalisierte Dateien, Metadaten
Erzeugung DIP:Je nach Service unterschiedliche DIPs
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1523.01.2013
2.6 Workflows
Datenaufbereitung und -dokumentation
Standardarchivierung (s.o.)
Added-Value für ausgewählte Studien (oft GESIS bereits beteiligt):Standardisierung, Harmonisierung, Integration / Kumulation, Ergänzung Kontextdaten
Umfassende Produktion von strukturierten Metadaten
Erstellung Codebücher, Variablenreports, Methodenbericht
Dokumentation der Aufbereitung
Access / Bereitstellung
Online-Portale, Datenträger, ftp
(Meta-)Datenportale
Zugang zur Datenbeständen ausländischer Archive
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1623.01.2013
2.7 Nutzung Startseite
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1723.01.2013
2.7 Nutzung BestandskatalogEinfache Suche
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1823.01.2013
2.7 Nutzung Trefferanzeige: Übersicht
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1923.01.2013
2.7 Nutzung Trefferanzeige: Daten & Dokumente
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2023.01.2013
2.7 Nutzung Bezeichnung von Dokumenten
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2123.01.2013
2.7 Nutzung Trefferanzeige: Daten & Dokumente
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2223.01.2013
2.7 Nutzung Online-Zugang via HISTAT
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2323.01.2013
2.7 Nutzung Online-Zugang via HISTAT
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2423.01.2013
2.7 Nutzung Online-Zugang via HISTAT
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2523.01.2013
2.7 Nutzung Produktliste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2623.01.2013
2.7 Nutzung Trefferliste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2723.01.2013
2.7 Nutzung Trefferliste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2823.01.2013
2.7 Nutzung ZACAT - Bereitstellung von ausgewählten Studien (auch internationale Daten)
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2923.01.2013
The Language Archive am
MPI für Psycholinguistik, Nijmegen
3.1 Geschichte
3.2 Zahlen & Fakten
3.3 Organisationsstruktur
3.4 Finanzierung & Kostenstruktur
3.5 Daten
3.6 Workflows
3.7 Nutzung
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3023.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.1 Geschichte von MPI/TLA
Gründung: 1990er 1. Technische Arbeitsgruppe2000-2016 Projekt DOBES
„Dokumentation bedrohter Sprachen“ (VW-Stiftung)
09. 2011 The Language Archive als neue Abteilung gegründet
Träger: MPI, KNAW, BBAW
Ziele: Datenarchiv für Dokumentation weltweiter Sprachen
Zugang zu Sprachaufnahmen, Studien und ErgebnisseWerkzeuge für die Erzeugung, Management und Analyse
von Daten
3123.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.1 Geschichte von MPI/TLA
projektbezogene Verpflichtung, Daten zu archivieren
Unterstützung des kompletten Data-Lifecycles mit Anwendungen und Tools
Verbreitung der „Language Archive Technology“ auf neue Standorte weltweit
3223.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.2 Zahlen & Fakten
Speicherplatz: gesamt 65.000 GB (65 TB)
Datensatzgröße: ca. 1 GB
Datenvolumen: ca. 73.000 Datensätze21.000 h Audio/Video-Aufzeichnungen 167.000 Metadaten zu Sessions5 Mio annotierte Segmente90 Lexika
Datenprovider: verschiedene Projekte, u.a. 60 DOBES-Teams dokumentieren 80 bedrohte Sprachen
Software: 14 verschiedene Systeme in Eigenentwicklung (seit 2000)
Metadatenmodell: IMDI, CDMI
Persist. Identifier: handle
3323.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.3 Organisationsstruktur
Institution: Integriert in MPI für Psycholinguistik
TLA: 33 MA (davon ca. 7 feste Stellen, 10 Programmierer)
LZA-Partner: MPI-Rechenzentrum GarchingenGWDG Göttingen (LZA für 50 Jahre garantiert)
Sicherheit: insgesamt 4 volldynamische Kopien(Safe Replication mit PIDs und Prüfung von Checksums) 11 regionale Repositories
Qualität: Data Seal of Approval
3423.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.4 Finanzierung und Kostenstruktur
Finanzierung: durch Max-Planck-Gesellschaft für Psycholinguistik 7 Jahre lang gesichert
Service: diverse Guidlines zu den vier Themenbereichen: Allgemein, Audio/Video/Photo, Lexika, AndereInstallation Software und LATUnterstützung Projektdurchführung
Gebühren: nein
Jahresbudget: ? €viele nationale (D + NL) / internationale Drittmittelprojekte
3523.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.5 Daten
Andere Daten aus dem Bereich der Neuro-Sciences, Genetik, Gehirnforschung, ...
3623.01.2013
3.5 Daten
Rollenkonzept: Datengeber → Daten zuschicken (Bänder, CD, etc.)Datennutzer → (Meta-)Daten suchen/anschauen: ohne Einloggen Daten bearbeiten/downloaden: Registrierung +Einloggen
Datenarchivar → erweiterte Rechte (TLA-Personal)Administrator → Vollzugriff, alle Rechte (TLA-Personal)
Zugangsarten:
offen → für jeden zugänglich
teiloffen → nur für Projekt-Mitglieder
geschützt → nur für Dateneigentümer
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3723.01.2013
3.6 Workflows
Werkzeuge für den vollständigen Datenworkflowsüber Jahr in selbständig entwickeltKern ist flexibles Metadatenmodell CMDIAnspruch einer generischen Infrastruktur für Forschungsdaten in den Digital Humanities
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3823.01.2013
3.6 Workflows
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3923.01.2013
3.6 Workflows
Datenerhebung
ELAN - Annotierung von Multimedia-Dateien
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4023.01.2013
3.6 Workflows
Datenerhebung:
LEXUS - Lexikon-Tool
&
VICOS – semantische Annotation
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4123.01.2013
3.6 Workflows
Dokumentation:
ARBIL - Editor, Browser & Organizer für Metadaten (IMDI, CMDI)
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4223.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.6 Workflows
Dokumentation:
ISOcat - Registry für Konzepte und Begriffe
4323.01.2013
3.6 Workflows
Ingest:
LAMUS - Upload und Organisation der Daten im Archiv
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4423.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.7 Nutzung
Bereitstellung:
IMDI-Browser - Zugang zu Archivbestand über Verzeichnis-struktur und Metadaten
4523.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.7 Nutzung
Bereitstellung:
TROVA - Suche nach Annotationen im Archiv
4623.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.7 Nutzung
Bereitstellung:
ANNEX - Auswertung von Annotationen im Archiv
4723.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4823.01.2013
ArcheoINF
GESIS
TLA
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4923.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Orte ArcheoInf (BRD) GESIS (BRD) TLA (The Language Archive) am MPI in Nijmegen (Niederlande)
Kriterien 06.08.2012 27.11.2012 01.12.2012
Statistische Daten
Rechtsform DFG-Projekt,an den Unis
Dortmund, Bochum, Göttingen
Vereinsform im Leibnizverbund zugehörig zur Max-Planck-Gesellschaft bzw. zum MPI für Psycholinguistik aber teilfinanziert/getragen von MPI,
KNAW und BBAW
Gründung 2008-2010, (1. Projektphase)2011-2014 (2. Projektphase?)
1960 als erste sozialwissenschaftl. Datenarchiv in EU (zugehörig zur Uni Köln)
1986 Zentralarchiv wird Mitglied beim neu gegründeten GESIS
2008 Zusammenführung der drei Teil-Institute in GESIS zu einem Instistut, seitdem ist das Datenarchiv eine
wissenschaftl. Abt. von GESIS
seit 1990 werden digitalen Daten der Disziplin archiviert, seit 2000 - 2016 DoBeS-Projekt (VW-Stiftung): "Dokumentation Bedrohter Sprachen"
09. 2011 The Language Archive als neue Abteilung gegründet
Anzahl Mitarbeiter 4 268 (davon ca.170 wiss. MA) GESIS insgesamt50 MA (davon 30 Vollzeit und 30 wiss. MA) Datenarchiv
30-33 MA (davon 7 feste Stellen)
Anzahl an Projektarchive
9 5100 Studien ca. 200 Sprachen archiviert (davon 80 bedrohte Sprachen)ca. 21.000 h (Audio- und Videoaufnahmen),
ca. 73.000 mit Metadaten versehene Aufzeichnungen, über 5 Mio. kommentierte Textabschnitte, über 90 Lexika
Anzahl an sogenannte graue Literatur
0 nicht relevant nicht relevant
Anzahl an Doktorarbeiten
0 - ?
Anzahl an Retro-Digitalisierte Zeitschriften
0 nicht relevant nicht relevant
Anzahl an Einträge Nachweiskatalog
0 nicht relevant nicht relevant
5023.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Orte ArcheoInf (BRD)
GESIS (BRD) TLA (The Language Archive) am MPI in Nijmegen (Niederlande)
Kriterien 06.08.2012 27.11.2012 01.12.2012
Statistische Daten
Anzahl an Einträge Nachweiskatalog 0 nicht relevant nicht relevant
Speicherbedarf (Stand heute) k. A. 1.000 -2.000 GByte (1-2TB) 65.000 GByte (65 TB)
Datensatzgröße 0 zw. 200-400 MByte/Studie ca. 1 TByte
Datenzuwachs jährlich 0 150 Studien = 30-60 GByte ?
Referenzmodell OAIS ?
Persistente Identifikatoren DOI handle
Metadatenmodell CIDOC-CRM + FRBRoo
Data Cite , DDI, SDMX IMDI, CMDI(bis Juni 2013 Umstellung auf CMDI)
Finanzierung
Jahresbudget k. A. 20 Mio. ?
Basisfinanzierung k. A. ? ?
Zeitraum der vertraglich Finanzierung k. A. 7 Jahre 7 Jahre (momentan für 5 Jahre), nach 3 Jahren Evaluation
restliche Finanzierung zur Zeit 100 % DFG-Förderung
100% Leibnizfinanzierung;gestaffelte Gebühren für Benutzung
100% durch MPI für Psycholinguistikmit Ende des DoBeS-Projekts läuft Finanzierung aus
Gebühren für das Archivieren von Daten
nicht relevant keine keine
Gebühren für das Nutzung von Daten nicht relevant ja, gemäß Gebührenordnung: 50-250 Euro keine
Kostenstruktur nach Kostenträger
Personalkosten k. A. 2/3 ?
Hardware k. A. 1/3 Sachausgaben ?
Reisekosten, Gebäudeinstandhaltung
k. A. 1/3 Sachausgaben ?
5123.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Orte ArcheoInf (BRD) GESIS (BRD) TLA (The Language Archive) am MPI in Nijmegen (Niederlande)
Finanzierung
Kostenstruktur nach Kostenstellen
Daten akquirieren und aufbereiten
k. A. ? ?
Daten archivieren nicht relevant ? ?
Daten zugänglich machen nicht relevant ? ?
Service
Guidelines keine Bereitstellung von Thesauri und KlassifikationenTools zur Datenalayse
Archivierung, Metadatenerstellung, manuelle und automatische Anmerkungen, Suche in AV Aufnahmen, Suche in Statistischen Daten
Antragsberatung nein ja ja
Datenzugriff
Registrierung bzw. Login für Nutzer notwendig?
z. Zt. Testbetrieb,nur Zugang für MA
für Suche in Datenbestandskatalog nicht, für Download von Daten Anmeldung erfordelich
ja
Wird die IP und der Zugriff geloggt? nicht relevant ? ?
Gibt es verschiedene Authentifizierungsstufen
nein nein ja
Zugriff geplant ist Open Access für Online-Publikationen
Online per Portal oder ftp, postalisch per Datenträger, zukünftig sind sog. SafeRäumen zur
Einsicht sensibler Daten geplant
Online über Portal
Rollenkonzept Nutzer, Administrator ja Offen, Teiloffen, Auf Anfrage Closed
Qualitätssicherung keine Daten werden nach methodischer Qualität beurteilt
ja
Technischer Partner für LZA keine keine RZ Garchingen (MPI), GWDG Göttingen
Verpflichtung Daten zu sichern? nein Es besteht keine Verpflichtung, aber BMBF bzw. DFG empfehlen Daten bei GESIS
zu archivieren
projektbezogene Verpflichtung Daten zu archivieren
Online-Upload möglich? nicht relevant Nein Nein
Software/Collection registry Dokument.repository in Eigenentwicklung
dara für online Selbst-Registrierung von StudienDspace in Entwicklung
Verschiedene Tools zur Registrierung von Projektdokumenten
5223.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5323.01.2013
Geodateninfrastruktur Deutschland (GDI-DE)
Frankfurt/Main, 13. März 2012, 13-17 Uhr
Zentrale Koordinierungsstelle für Bereitstellung von Geo-Daten vom Bund, Bundesländern und Kommunen, um Zugänglichkeit zu Daten zu verbessern
beim Bundesamt für Kartographie und Geographie angesiedelt
Umsetzung der fachlichen, technischen und organisatorischen Vorgaben der INSPIRE-Richtlinie in Deutschland wird über das GDI-DE in nationaler Verantwortung gesteuert
Meisten Denkmalfachbehörden der Länder von INSPIRE-Initiative betroffen
„Die Architektur der GDI-DE basiert auf etablierten nationalen und internationalen Normen und Standards aus dem Bereich der allgemeinen Informationstechnologie und des Geoinformationswesens.“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5423.01.2013
„Die GDI-DE orientiert sich an den Nutzeranforderungen aus Gesellschaft, Politik, Wirtschaft und Verwaltung und ist offen für Geodaten und Geodatendienste aus Wirtschaft, Wissenschaft und Gesellschaft.“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5523.01.2013
„Die GDI-DE verlangt ein abgestimmtes Vorgehen zwischen Bund, Ländern und Kommunen unter Einbeziehung der Interessen von Gesellschaft, Wirtschaft und Wissenschaft.“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5623.01.2013
Service-Oriented-Architecture mit folgenden Anforderungen
Interoperabilität
Erweiterbarkeit
Übertragbarkeit
Verfügbarkeit
Richtlinien und Durchführungsbestimmungen zu
Metadaten
Interoperabilität
Netzdienste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Performanz
Testbarkeit
Skalierbarkeit
Gemeinsame Nutzung
Überwachung und Berichterstattung
5723.01.2013
PANGAEA -
Publishing Network for Geoscientific and Environmental Data
Träger
Alfred-Wegener-Institut für Polar- und Meeresforschung in Bremerhaven
Zentrum für Marine Umweltwissenschaften „Marum“ Universität Bremen
Mitglied des World Data System (WDS) of the International Council for Science (ICSU).
Onlinearchiv für Daten aus den Geo- und Umweltwissenschaften (v.a. aus den Umgebungen Wasser, Eis, Atmosphere, Sediment)
Open Access Bibliothek für georeferenzierte Forschungsdaten
Langzeitarchivierung und Langzeitverfügbarkeit wird garantiert
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5823.01.2013
Große Heterogenität der Daten, viele Messdaten: fünf Milliarden Messwerte in 600.000 Datensätzen
thematische Überschneidungen mit der Archäologie (z. B. Daten zur Klimaentwicklung, Dendrodaten, Bohrkerne, ...)
Datenmanagement und Archivierung nach OECD-Standard „Principles and Guidelines for Access to Research Data from Public Funding“
Publikation von Rohdaten zu Publikationen von Forschungsergebnissen in Fachzeitschriften
Archivierung, Publikation und Bereitstellung von Daten
VerwendungPersistenter Identifikator – DOI
Entwicklung von Tools zur Datenanaylse/-visualisierung
Hohe Akzeptanz in Wissenschaft, bewährte Systeme & etablierte Workflows
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5923.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6023.01.2013
Genese der Arbeitsgruppe Delegation
AP 1.2 Forschungsdateninfrastukturen (fachwissenschaftlicher Aspekt)
„In einem zweiten Teilpaket (AP 1.2), das von einer Arbeitsgruppe „Infrastruktur“ bearbeitet wird, werden hingegen die bereits vorhandenen fachwissenschaftlichen Softwarelösungen, Werkzeuge, Online-Services und Web-Angebote geprüft.“
AP 2.1 Interoperabilität (technische Aspekte)
„In technischer Hinsicht gilt es, verschiedene technische Datenformate, Werkzeuge/Services zur Datenmigration bzw. Standardisierung sowie Schnittstellen zur Datenkommunikation zu untersuchen.“
AP 5.1 Langzeitarchivierung (Organisation, Konzept, Struktur)
„Es behandelt Fragen der Organisation von Langzeitarchivierung bei dezentralen Datenlieferanten sowie Nutzern, deren Einbindung in den Prozess der Datengenerierung, Fragen der Auswahl und Strukturierung von Daten vor der Übergabe an ein Archiv und innerhalb eines Archivs, technische und inhaltliche
nach Zugang, Nachnutzung, Verfügbarkeit, Adressierbarkeit der archivierten Daten und schließlich die Dokumentenhistorie (Data-Life-Cycle). mehrere Projekte mit diesen Fragen befasst, die hinsichtlich ihrer Eignung für
“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6123.01.2013
Auftrag durch DFG-Arbeitsgruppe
Fokus von Begehungen sind Analyse von existierenden Systemen hinsichtlich der eingesetzten Technologien, Anforderungen, Arbeitsabläufe
Konkretisierung / Fokussierung der Vorüberlegungen zu technischen Aspekten der Interoperabilität
Entscheidung für technische Standards
Konkretisierung / Fokussierung der Vorüberlegungen zu Organisation und Struktur Langzeitarchivierung
Entscheidung für Konzept Langzeitarchivierung
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6223.01.2013
Weitere Expertengespräche ?
Befragung von Datenservicezentren / -infrastrukturen hinsichtlich einer geeigneten Nutzung durch IANUS in technischer Hinsicht
(z. B. MPDL, FIZ Karlsruhe, GWDG, Landesarchive, … )
Prüfungen fachwissenschaftlicher Lösungen hinsichtlich einer geeigneten Nutzung durch bzw. Abgrenzung zu IANUS
(z. B. ArcheoInf, GDI-DE, eAqua, eSciDoc, Propylaeum, Arachne, OpenContext, Perseus Digital Library, Stoa Consortium, … )
Überprüfung technischer Standards ?
OASIS, GML, TEI, OWL, RDF, ...
Persistente Identifier
Untersuchung existierender Projekte/Konzepte ?
KOPAL, NESTOR, PLANTS, PANGAEA, …
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6323.01.2013
Ausarbeitung Fragenkataloge
Ausarbeitung relevanter Vergleichskriterien
Ausarbeitung Vorschläge, Empfehlungen bzw. Entscheidungskriterien zu
Technischen Standards
Konzept der Langzeitarchivierung
Auswahl Persistente Identifier
Authentifizierungssysteme
Definition IT-basierte Services
Definition nicht-technischer Dienstleistungen
Auswahl Repository-System - Eigenentwicklung
Workflow-Komponenten - Unterstützung Forschungsprozess
Gebühren Datengeber - Datennutzer
Verhältnis Datengeber - IANUS
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6423.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
223.01.2013
AGENDA
10.00 Uhr – 10.15 Uhr 1. Begrüßung und Formalia
10.15 Uhr – 11.15 Uhr 2. Kurzbericht Vor-Ort-Begehung GESIS (Köln)
11.15 Uhr – 12.15 Uhr 3. Kurzbericht Vor-Ort-Begehung MPI/TLA (Nijmegen)
12.15 Uhr – 13.00 Uhr - Mittagspause -
13.00 Uhr – 13.30 Uhr 4. Übersicht der besuchten Datenzentren
13.30 Uhr – 14.30 Uhr 5. Diskussion der Ergebnisse
14.30 Uhr – 15.00 Uhr 6. Geplante Begehungen weiterer Datenzentren
15.00 Uhr – 15.30 Uhr - Kaffee-Pause -
15.30 Uhr – 16.30 Uhr 7. Künftige Aufgaben und Ziele der Arbeitsgruppe
16.30 Uhr – 17.00 Uhr 8. Abschlussdiskussion
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
323.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
423.01.2013
GESIS -
Datenarchiv für Sozialwissenschaften, Köln
2.1 Geschichte
2.2 Zahlen & Fakten
2.3 Organisationsstruktur
2.4 Finanzierung & Kostenstruktur
2.5 Daten
2.6 Workflows
2.7 Nutzung
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
523.01.2013
2.1 Geschichte des Datenarchivs
Gründung: 1960 als Zentralarchiv für Empirsche Sozialforschung an der Uni Köln
1986 Mitglied des neu gegründeten GESIS-Institutes
2008 Umstrukturierung von GESIS (drei Teil-Institute vereint), Datenarchiv seitdem wissenschaftliche Abteilung innerhalb von GESIS
Ziele/Aufgaben:
Langfristige Speicherung von relevanten Studien sichernZugang zu Studien und Ergebnissen gewährleisten (auch internat.)Primärforscher durch Dienstleistungen unterstützenSekundäranalysen ermöglichen durch DatenaufbereitungEigene Forschung mit archivierten Daten durch GESIS
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
623.01.2013
2.1 Geschichte des Datenarchives
Datengeber: Projekte in GESIS, Universitäten, Politik, Barometer, etc. (überwiegend Soziologie und Politikwissenschaft)keine amtlichen Statistikdaten
LZA-Partner: keine externen Partner, Daten werden In-House verwaltet, archiviert und an GESIS-Standorten gespiegelt
Referenzmodell: OAIS nicht vollständig umgesetzt
Software: Sukzessive Eigenentwicklungen(v.a. Datenbank für Metadaten)
Repository: keines, stattdessen Dateibasierte Verzeichnisstrukturalle zu einer Studie gehörenden digitalen Objekte werden so abgelegt, dass sie den Archiv-Lebenszyklus reflektieren
Gebühren: gestaffelte Gebühren für Nutzung von Archivdatengemäß Gebührenordnung zwischen 50 – 250 €
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
723.01.2013
2.1 Geschichte des Datenarchives
Seit über 50 Jahren praktische Erfahrung in der Datenarchivierung
Datenarchiv ist ein Digitales Langzeitarchiv und betreibt Digital Curation
in erster Linie nationale und international-vergleichende Umfragen zu soziologischen und politikwissenschaftlichen Fragestellungen = Daten sind strukturell relativ homogen
Gewachsene Infrastruktur mit stetig veränderten Prozessen, Systemen und Aufgaben
Erhalt der Nutzbarkeit und Interpretierbarkeit von Daten hauptsächlich durch Migrationsstrategien erreicht
Im Fokus stand/steht die Nachnutzung von Daten: „neue Fragen an alte Daten“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
823.01.2013
2.2 Zahlen & Fakten Datenarchiv
Speicherplatz: gesamt 1-2 TB
Datensatzgröße: ca. 200-400 MB/Studie
Datenzuwachs: 30-60 GB
Anzahl Datensätze:5.100 Studien (primär Mikrodaten der Umfrageforschung)
Nutzung: ca. 35.000 Datenweitergaben pro Jahr, überwiegend akademische Nutzung (Forschung, Lehre)
Metadatenmodelle:DDI, SDMX
Persist. Identifier: DOI
Mitarbeiter: 30 Wiss. Ma. + 20 Entwickler + Wiss. Hk,insgesamt 30 Vollzeitstellen
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
923.01.2013
2.3 Organisationsstruktur GESIS
Personal: 268 (davon ca. 170 wiss. MA) an 3 Standorten
Träger: Bund-Länder-Förderung
Rechtsform: Verein, Mitglied der Leibniz-Gemeinschaft
Abteilungen:
Survey Design and MethodologyDauerbeobachtung der Gesellschaft Datenarchiv Fachinformation für SozialwissenschaftenWissenstechnologien für Sozialwissenschaften
Leitlinie: Angebote orientieren sich an Forschungsdatenzyklus
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1023.01.2013
2.4 Finanzierung und Kostenstruktur GESIS
Finanzierung: durch Leibnizgemeinschaft (80 % Bund, 20 % Länder) 7 Jahre lang gesichert
Service: Garantie der LZA für 50 Jahre (enthalten in Satzung von GESIS)Langzeitspeicherung von und Zugang zu Studien
Jahresbudget: 20 Mio. € + 3-4 Mio. € Drittmittel
Kostenstruktur: Personalmittel 2/3Sachmittel 1/3
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1123.01.2013
2.5 Daten
Rollenkonzept: Datengeber → Daten zuschicken Datennutzer → Daten suchen/anschauen: ohne Einloggen Daten downloaden: Registrierung + Einloggen
Datenarchivar → erweiterte Rechte (GESIS-Personal)Administrator → Vollzugriff, alle Rechte (GESIS-Personal)
Datenbestände:
… selbst bzw. unter Beteiligung von GESIS erhoben
… akquiriert von externen Datenerzeugern
… entwickelt / produziert / transformiert unter Beteiligung von GESIS
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1223.01.2013
2.5 Daten
Zugangsarten:
Kategorie 0 → Daten/Dokumente für jedermann freigegebenKategorie A → Daten/Dokumente für akadem. Forschung und Lehre
freigegeben
Kategorie B → Daten/Dokumente nur dann für akadem. Forschung und Lehre freigegeben, wenn Ergebnisse nicht veröffentlicht werden. Ist eine Veröffentlichung geplant, muss die Genehmigung des Datenarchivs eingeholt werden
Kategorie C → Daten/Dokumente nur nach schriftlicher Genehmigung des Datengebers zugänglich
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1323.01.2013
2.6 Workflows
Akquisition von Daten
Kriterien für Auswahl und Bewertung:fachliche Relevanz, Datentypen, Bezug zu Deutschland / deutschen Forschern, Bedeutung, Qualität, …
Aufnahme ins Archiv (Ingest)
Vorbereitung der Archivierung mit Datengebern:Klärung Aufbereitungs-, Dokumentations- und Publikationsziele, rechtliche Fragen, Datenschutz, Archivierungsvertrag
Eingangskontrolle SIP:Technische Kontrolle, Vollständigkeit, Übereinstimmung Daten und Dokumentation,Fachliche Konsistenz der Daten
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1423.01.2013
2.6 Workflows
Aufnahme ins Archiv (Ingest)
Korrigierende Basis-Aufbereitung
Dokumentation:Studienbeschreibung technisch, methodisch, inhaltlich (DDI kompatibel)
Versionierung
Vergabe Persistenter Identifier (DOI):Datenregistrierung mittels da|ra
Erzeugung AIP:Originale, aufbereitete Dateiversionen, normalisierte Dateien, Metadaten
Erzeugung DIP:Je nach Service unterschiedliche DIPs
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1523.01.2013
2.6 Workflows
Datenaufbereitung und -dokumentation
Standardarchivierung (s.o.)
Added-Value für ausgewählte Studien (oft GESIS bereits beteiligt):Standardisierung, Harmonisierung, Integration / Kumulation, Ergänzung Kontextdaten
Umfassende Produktion von strukturierten Metadaten
Erstellung Codebücher, Variablenreports, Methodenbericht
Dokumentation der Aufbereitung
Access / Bereitstellung
Online-Portale, Datenträger, ftp
(Meta-)Datenportale
Zugang zur Datenbeständen ausländischer Archive
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1623.01.2013
2.7 Nutzung Startseite
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1723.01.2013
2.7 Nutzung BestandskatalogEinfache Suche
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1823.01.2013
2.7 Nutzung Trefferanzeige: Übersicht
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
1923.01.2013
2.7 Nutzung Trefferanzeige: Daten & Dokumente
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2023.01.2013
2.7 Nutzung Bezeichnung von Dokumenten
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2123.01.2013
2.7 Nutzung Trefferanzeige: Daten & Dokumente
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2223.01.2013
2.7 Nutzung Online-Zugang via HISTAT
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2323.01.2013
2.7 Nutzung Online-Zugang via HISTAT
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2423.01.2013
2.7 Nutzung Online-Zugang via HISTAT
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2523.01.2013
2.7 Nutzung Produktliste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2623.01.2013
2.7 Nutzung Trefferliste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2723.01.2013
2.7 Nutzung Trefferliste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2823.01.2013
2.7 Nutzung ZACAT - Bereitstellung von ausgewählten Studien (auch internationale Daten)
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
2923.01.2013
The Language Archive am
MPI für Psycholinguistik, Nijmegen
3.1 Geschichte
3.2 Zahlen & Fakten
3.3 Organisationsstruktur
3.4 Finanzierung & Kostenstruktur
3.5 Daten
3.6 Workflows
3.7 Nutzung
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3023.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.1 Geschichte von MPI/TLA
Gründung: 1990er 1. Technische Arbeitsgruppe2000-2016 Projekt DOBES
„Dokumentation bedrohter Sprachen“ (VW-Stiftung)
09. 2011 The Language Archive als neue Abteilung gegründet
Träger: MPI, KNAW, BBAW
Ziele: Datenarchiv für Dokumentation weltweiter Sprachen
Zugang zu Sprachaufnahmen, Studien und ErgebnisseWerkzeuge für die Erzeugung, Management und Analyse
von Daten
3123.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.1 Geschichte von MPI/TLA
projektbezogene Verpflichtung, Daten zu archivieren
Unterstützung des kompletten Data-Lifecycles mit Anwendungen und Tools
Verbreitung der „Language Archive Technology“ auf neue Standorte weltweit
3223.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.2 Zahlen & Fakten
Speicherplatz: gesamt 65.000 GB (65 TB)
Datensatzgröße: ca. 1 GB
Datenvolumen: ca. 73.000 Datensätze21.000 h Audio/Video-Aufzeichnungen 167.000 Metadaten zu Sessions5 Mio annotierte Segmente90 Lexika
Datenprovider: verschiedene Projekte, u.a. 60 DOBES-Teams dokumentieren 80 bedrohte Sprachen
Software: 14 verschiedene Systeme in Eigenentwicklung (seit 2000)
Metadatenmodell: IMDI, CDMI
Persist. Identifier: handle
3323.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.3 Organisationsstruktur
Institution: Integriert in MPI für Psycholinguistik
TLA: 33 MA (davon ca. 7 feste Stellen, 10 Programmierer)
LZA-Partner: MPI-Rechenzentrum GarchingenGWDG Göttingen (LZA für 50 Jahre garantiert)
Sicherheit: insgesamt 4 volldynamische Kopien(Safe Replication mit PIDs und Prüfung von Checksums) 11 regionale Repositories
Qualität: Data Seal of Approval
3423.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.4 Finanzierung und Kostenstruktur
Finanzierung: durch Max-Planck-Gesellschaft für Psycholinguistik 7 Jahre lang gesichert
Service: diverse Guidlines zu den vier Themenbereichen: Allgemein, Audio/Video/Photo, Lexika, AndereInstallation Software und LATUnterstützung Projektdurchführung
Gebühren: nein
Jahresbudget: ? €viele nationale (D + NL) / internationale Drittmittelprojekte
3523.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.5 Daten
Andere Daten aus dem Bereich der Neuro-Sciences, Genetik, Gehirnforschung, ...
3623.01.2013
3.5 Daten
Rollenkonzept: Datengeber → Daten zuschicken (Bänder, CD, etc.)Datennutzer → (Meta-)Daten suchen/anschauen: ohne Einloggen Daten bearbeiten/downloaden: Registrierung +Einloggen
Datenarchivar → erweiterte Rechte (TLA-Personal)Administrator → Vollzugriff, alle Rechte (TLA-Personal)
Zugangsarten:
offen → für jeden zugänglich
teiloffen → nur für Projekt-Mitglieder
geschützt → nur für Dateneigentümer
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3723.01.2013
3.6 Workflows
Werkzeuge für den vollständigen Datenworkflowsüber Jahr in selbständig entwickeltKern ist flexibles Metadatenmodell CMDIAnspruch einer generischen Infrastruktur für Forschungsdaten in den Digital Humanities
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3823.01.2013
3.6 Workflows
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3923.01.2013
3.6 Workflows
Datenerhebung
ELAN - Annotierung von Multimedia-Dateien
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4023.01.2013
3.6 Workflows
Datenerhebung:
LEXUS - Lexikon-Tool
&
VICOS – semantische Annotation
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4123.01.2013
3.6 Workflows
Dokumentation:
ARBIL - Editor, Browser & Organizer für Metadaten (IMDI, CMDI)
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4223.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.6 Workflows
Dokumentation:
ISOcat - Registry für Konzepte und Begriffe
4323.01.2013
3.6 Workflows
Ingest:
LAMUS - Upload und Organisation der Daten im Archiv
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4423.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.7 Nutzung
Bereitstellung:
IMDI-Browser - Zugang zu Archivbestand über Verzeichnis-struktur und Metadaten
4523.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.7 Nutzung
Bereitstellung:
TROVA - Suche nach Annotationen im Archiv
4623.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
3.7 Nutzung
Bereitstellung:
ANNEX - Auswertung von Annotationen im Archiv
4723.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4823.01.2013
ArcheoINF
GESIS
TLA
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
4923.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Orte ArcheoInf (BRD) GESIS (BRD) TLA (The Language Archive) am MPI in Nijmegen (Niederlande)
Kriterien 06.08.2012 27.11.2012 01.12.2012
Statistische Daten
Rechtsform DFG-Projekt,an den Unis
Dortmund, Bochum, Göttingen
Vereinsform im Leibnizverbund zugehörig zur Max-Planck-Gesellschaft bzw. zum MPI für Psycholinguistik aber teilfinanziert/getragen von MPI,
KNAW und BBAW
Gründung 2008-2010, (1. Projektphase)2011-2014 (2. Projektphase?)
1960 als erste sozialwissenschaftl. Datenarchiv in EU (zugehörig zur Uni Köln)
1986 Zentralarchiv wird Mitglied beim neu gegründeten GESIS
2008 Zusammenführung der drei Teil-Institute in GESIS zu einem Instistut, seitdem ist das Datenarchiv eine
wissenschaftl. Abt. von GESIS
seit 1990 werden digitalen Daten der Disziplin archiviert, seit 2000 - 2016 DoBeS-Projekt (VW-Stiftung): "Dokumentation Bedrohter Sprachen"
09. 2011 The Language Archive als neue Abteilung gegründet
Anzahl Mitarbeiter 4 268 (davon ca.170 wiss. MA) GESIS insgesamt50 MA (davon 30 Vollzeit und 30 wiss. MA) Datenarchiv
30-33 MA (davon 7 feste Stellen)
Anzahl an Projektarchive
9 5100 Studien ca. 200 Sprachen archiviert (davon 80 bedrohte Sprachen)ca. 21.000 h (Audio- und Videoaufnahmen),
ca. 73.000 mit Metadaten versehene Aufzeichnungen, über 5 Mio. kommentierte Textabschnitte, über 90 Lexika
Anzahl an sogenannte graue Literatur
0 nicht relevant nicht relevant
Anzahl an Doktorarbeiten
0 - ?
Anzahl an Retro-Digitalisierte Zeitschriften
0 nicht relevant nicht relevant
Anzahl an Einträge Nachweiskatalog
0 nicht relevant nicht relevant
5023.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Orte ArcheoInf (BRD)
GESIS (BRD) TLA (The Language Archive) am MPI in Nijmegen (Niederlande)
Kriterien 06.08.2012 27.11.2012 01.12.2012
Statistische Daten
Anzahl an Einträge Nachweiskatalog 0 nicht relevant nicht relevant
Speicherbedarf (Stand heute) k. A. 1.000 -2.000 GByte (1-2TB) 65.000 GByte (65 TB)
Datensatzgröße 0 zw. 200-400 MByte/Studie ca. 1 TByte
Datenzuwachs jährlich 0 150 Studien = 30-60 GByte ?
Referenzmodell OAIS ?
Persistente Identifikatoren DOI handle
Metadatenmodell CIDOC-CRM + FRBRoo
Data Cite , DDI, SDMX IMDI, CMDI(bis Juni 2013 Umstellung auf CMDI)
Finanzierung
Jahresbudget k. A. 20 Mio. ?
Basisfinanzierung k. A. ? ?
Zeitraum der vertraglich Finanzierung k. A. 7 Jahre 7 Jahre (momentan für 5 Jahre), nach 3 Jahren Evaluation
restliche Finanzierung zur Zeit 100 % DFG-Förderung
100% Leibnizfinanzierung;gestaffelte Gebühren für Benutzung
100% durch MPI für Psycholinguistikmit Ende des DoBeS-Projekts läuft Finanzierung aus
Gebühren für das Archivieren von Daten
nicht relevant keine keine
Gebühren für das Nutzung von Daten nicht relevant ja, gemäß Gebührenordnung: 50-250 Euro keine
Kostenstruktur nach Kostenträger
Personalkosten k. A. 2/3 ?
Hardware k. A. 1/3 Sachausgaben ?
Reisekosten, Gebäudeinstandhaltung
k. A. 1/3 Sachausgaben ?
5123.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Orte ArcheoInf (BRD) GESIS (BRD) TLA (The Language Archive) am MPI in Nijmegen (Niederlande)
Finanzierung
Kostenstruktur nach Kostenstellen
Daten akquirieren und aufbereiten
k. A. ? ?
Daten archivieren nicht relevant ? ?
Daten zugänglich machen nicht relevant ? ?
Service
Guidelines keine Bereitstellung von Thesauri und KlassifikationenTools zur Datenalayse
Archivierung, Metadatenerstellung, manuelle und automatische Anmerkungen, Suche in AV Aufnahmen, Suche in Statistischen Daten
Antragsberatung nein ja ja
Datenzugriff
Registrierung bzw. Login für Nutzer notwendig?
z. Zt. Testbetrieb,nur Zugang für MA
für Suche in Datenbestandskatalog nicht, für Download von Daten Anmeldung erfordelich
ja
Wird die IP und der Zugriff geloggt? nicht relevant ? ?
Gibt es verschiedene Authentifizierungsstufen
nein nein ja
Zugriff geplant ist Open Access für Online-Publikationen
Online per Portal oder ftp, postalisch per Datenträger, zukünftig sind sog. SafeRäumen zur
Einsicht sensibler Daten geplant
Online über Portal
Rollenkonzept Nutzer, Administrator ja Offen, Teiloffen, Auf Anfrage Closed
Qualitätssicherung keine Daten werden nach methodischer Qualität beurteilt
ja
Technischer Partner für LZA keine keine RZ Garchingen (MPI), GWDG Göttingen
Verpflichtung Daten zu sichern? nein Es besteht keine Verpflichtung, aber BMBF bzw. DFG empfehlen Daten bei GESIS
zu archivieren
projektbezogene Verpflichtung Daten zu archivieren
Online-Upload möglich? nicht relevant Nein Nein
Software/Collection registry Dokument.repository in Eigenentwicklung
dara für online Selbst-Registrierung von StudienDspace in Entwicklung
Verschiedene Tools zur Registrierung von Projektdokumenten
5223.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5323.01.2013
Geodateninfrastruktur Deutschland (GDI-DE)
Frankfurt/Main, 13. März 2012, 13-17 Uhr
Zentrale Koordinierungsstelle für Bereitstellung von Geo-Daten vom Bund, Bundesländern und Kommunen, um Zugänglichkeit zu Daten zu verbessern
beim Bundesamt für Kartographie und Geographie angesiedelt
Umsetzung der fachlichen, technischen und organisatorischen Vorgaben der INSPIRE-Richtlinie in Deutschland wird über das GDI-DE in nationaler Verantwortung gesteuert
Meisten Denkmalfachbehörden der Länder von INSPIRE-Initiative betroffen
„Die Architektur der GDI-DE basiert auf etablierten nationalen und internationalen Normen und Standards aus dem Bereich der allgemeinen Informationstechnologie und des Geoinformationswesens.“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5423.01.2013
„Die GDI-DE orientiert sich an den Nutzeranforderungen aus Gesellschaft, Politik, Wirtschaft und Verwaltung und ist offen für Geodaten und Geodatendienste aus Wirtschaft, Wissenschaft und Gesellschaft.“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5523.01.2013
„Die GDI-DE verlangt ein abgestimmtes Vorgehen zwischen Bund, Ländern und Kommunen unter Einbeziehung der Interessen von Gesellschaft, Wirtschaft und Wissenschaft.“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5623.01.2013
Service-Oriented-Architecture mit folgenden Anforderungen
Interoperabilität
Erweiterbarkeit
Übertragbarkeit
Verfügbarkeit
Richtlinien und Durchführungsbestimmungen zu
Metadaten
Interoperabilität
Netzdienste
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
Performanz
Testbarkeit
Skalierbarkeit
Gemeinsame Nutzung
Überwachung und Berichterstattung
5723.01.2013
PANGAEA -
Publishing Network for Geoscientific and Environmental Data
Träger
Alfred-Wegener-Institut für Polar- und Meeresforschung in Bremerhaven
Zentrum für Marine Umweltwissenschaften „Marum“ Universität Bremen
Mitglied des World Data System (WDS) of the International Council for Science (ICSU).
Onlinearchiv für Daten aus den Geo- und Umweltwissenschaften (v.a. aus den Umgebungen Wasser, Eis, Atmosphere, Sediment)
Open Access Bibliothek für georeferenzierte Forschungsdaten
Langzeitarchivierung und Langzeitverfügbarkeit wird garantiert
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5823.01.2013
Große Heterogenität der Daten, viele Messdaten: fünf Milliarden Messwerte in 600.000 Datensätzen
thematische Überschneidungen mit der Archäologie (z. B. Daten zur Klimaentwicklung, Dendrodaten, Bohrkerne, ...)
Datenmanagement und Archivierung nach OECD-Standard „Principles and Guidelines for Access to Research Data from Public Funding“
Publikation von Rohdaten zu Publikationen von Forschungsergebnissen in Fachzeitschriften
Archivierung, Publikation und Bereitstellung von Daten
VerwendungPersistenter Identifikator – DOI
Entwicklung von Tools zur Datenanaylse/-visualisierung
Hohe Akzeptanz in Wissenschaft, bewährte Systeme & etablierte Workflows
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
5923.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6023.01.2013
Genese der Arbeitsgruppe Delegation
AP 1.2 Forschungsdateninfrastukturen (fachwissenschaftlicher Aspekt)
„In einem zweiten Teilpaket (AP 1.2), das von einer Arbeitsgruppe „Infrastruktur“ bearbeitet wird, werden hingegen die bereits vorhandenen fachwissenschaftlichen Softwarelösungen, Werkzeuge, Online-Services und Web-Angebote geprüft.“
AP 2.1 Interoperabilität (technische Aspekte)
„In technischer Hinsicht gilt es, verschiedene technische Datenformate, Werkzeuge/Services zur Datenmigration bzw. Standardisierung sowie Schnittstellen zur Datenkommunikation zu untersuchen.“
AP 5.1 Langzeitarchivierung (Organisation, Konzept, Struktur)
„Es behandelt Fragen der Organisation von Langzeitarchivierung bei dezentralen Datenlieferanten sowie Nutzern, deren Einbindung in den Prozess der Datengenerierung, Fragen der Auswahl und Strukturierung von Daten vor der Übergabe an ein Archiv und innerhalb eines Archivs, technische und inhaltliche
nach Zugang, Nachnutzung, Verfügbarkeit, Adressierbarkeit der archivierten Daten und schließlich die Dokumentenhistorie (Data-Life-Cycle). mehrere Projekte mit diesen Fragen befasst, die hinsichtlich ihrer Eignung für
“
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6123.01.2013
Auftrag durch DFG-Arbeitsgruppe
Fokus von Begehungen sind Analyse von existierenden Systemen hinsichtlich der eingesetzten Technologien, Anforderungen, Arbeitsabläufe
Konkretisierung / Fokussierung der Vorüberlegungen zu technischen Aspekten der Interoperabilität
Entscheidung für technische Standards
Konkretisierung / Fokussierung der Vorüberlegungen zu Organisation und Struktur Langzeitarchivierung
Entscheidung für Konzept Langzeitarchivierung
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6223.01.2013
Weitere Expertengespräche ?
Befragung von Datenservicezentren / -infrastrukturen hinsichtlich einer geeigneten Nutzung durch IANUS in technischer Hinsicht
(z. B. MPDL, FIZ Karlsruhe, GWDG, Landesarchive, … )
Prüfungen fachwissenschaftlicher Lösungen hinsichtlich einer geeigneten Nutzung durch bzw. Abgrenzung zu IANUS
(z. B. ArcheoInf, GDI-DE, eAqua, eSciDoc, Propylaeum, Arachne, OpenContext, Perseus Digital Library, Stoa Consortium, … )
Überprüfung technischer Standards ?
OASIS, GML, TEI, OWL, RDF, ...
Persistente Identifier
Untersuchung existierender Projekte/Konzepte ?
KOPAL, NESTOR, PLANTS, PANGAEA, …
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6323.01.2013
Ausarbeitung Fragenkataloge
Ausarbeitung relevanter Vergleichskriterien
Ausarbeitung Vorschläge, Empfehlungen bzw. Entscheidungskriterien zu
Technischen Standards
Konzept der Langzeitarchivierung
Auswahl Persistente Identifier
Authentifizierungssysteme
Definition IT-basierte Services
Definition nicht-technischer Dienstleistungen
Auswahl Repository-System - Eigenentwicklung
Workflow-Komponenten - Unterstützung Forschungsprozess
Gebühren Datengeber - Datennutzer
Verhältnis Datengeber - IANUS
Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion
6423.01.2013 Begrüßung - GESIS - MPI/TLA - Übersicht - Ergebnisse - Weitere Begehungen - Aufgaben & Ziele - Diskussion