Post on 05-Apr-2015
transcript
BIK2001 / 5.4.2001
Frank Lützenkirchen / Dieter Nastoll Universität Essen
Das MILESS Datenmodell einer Digitalen Bibliothek
http://miless.uni-essen.de/
BIK2001 / 5.4.2001
Medien-zentrum
Universitäts-bibliothek
Fachbereiche(Physik,
Linguistik, ... )
Hochschul-rechenzentrum
MILESS: Projektbeteiligte
BIK2001 / 5.4.2001
• oft mühsam auffindbar, verstreut in der Hochschule
Lehr- und Lernmaterial istvorhanden, aber Ziele des MILESS Projektes:
• Zentraler, einheitlicher Zugang für alle Fachbereiche, Suche und Navigation in einem homogenen System
MILESS: Intentionen und Ziele
• keine systematische Ordnung • Sachliche, systematische
Erschließung in bibliothekarischer Qualität, Integration der Bibliothek in den Dokumentenworkflow
BIK2001 / 5.4.2001
• oft flüchtig, Verfügbarkeit nicht garantiert
Lehr- und Lernmaterial ist Ziele des MILESS Projektes:
• Archivierung und Sicherung, dauerhafte, zuverlässige Verfügbarkeit
MILESS: Intentionen und Ziele
• Pflege des Distributionssystems (Web-Server) aufwendig
• Zentrale Plattform zur Verteilung von Materialien
• Manipulationsgefahr, Urheberschutzprobleme • Manipulationssicherheit,
Digitale Signatur, Zugriffsschutz• Elektronische Dissertationen
BIK2001 / 5.4.2001
Katalogsysteme:• Integration auf Metadatenebene, nur Nachweis (Link)• Keine Archivierung, keine Verfügbarkeitsgarantie
MILESS:• Dokumente werden im System selbst gehalten: Einheit von Metadaten und Inhalten• Verfügbarkeit der Inhalte kann garantiert werden
• Keine ungültigen Verweise • Grundlage für zuverlässigen Einsatz in Vorlesung, Vor- und Nachbereitung, zur Schaffung von Zitierfähigkeit
• Archivierung und Sicherung, Zugriffs- und Manipulationsschutz • Zusatzdienste werden ermöglicht, z. B. Suche im Volltext, nach Bildern (QBIC), ZIP-Generierung, ...
MILESS als „Digitale Bibliothek“
BIK2001 / 5.4.2001
MILESS Persistency Layer (Java-Klassenbibliothek):MILESS Daten-Objekte erzeugen, lesen, ändern, löschen, suchen
IBM Content Manager/EIP API (C, C++, ActiveX, Java)
MILESSData Model Package
(Java-Klassenbibliothek):Dokumente, Personen,
Derivate, ... Java Servlets: Inhaltesuchen, anzeigen, verwalten
Java Applets: Inhalte einbringen und bearbeiten
ServletCommunicator
HTML-Seiten:Suchmasken, Navigation,
Inhalte anzeigen
MILESS: Software-Komponenten
CM
WEB-SRV
BROWSER
BIK2001 / 5.4.2001
MILESS und Content Manager:Systemkomponenten
IBM Content Manager
Library Server: Metadaten
(Titel, Autor, ...)
VideoChargerServer:
Streaming von Audio/Video Daten
(MPEG, ...)
Text Search Server: Volltext-Suche(Textindizes)
TSM-Server: Langzeit-Archivierung
Object Server:Dateien
(PS, PDF, ...),zentral / dezentral
Web-Server
Java ServletEngine:MILESS
Server-Komponenten
Web-Browser
Java VM: AppletsMILESS
Autoren-GUI
IBM3494Tape
LibrarySystem
OPAC-System
HTTP
IBM DB2 / Oracle
HTML
XML
BIK2001 / 5.4.2001
MILESS: Hardware-Basis
Stand 17.8.1998 NA
RS/6000 SP
Ethernet
RS/6000 25T
Kontrollworkstations als HACWS-Cluster
RS
232
HACWS-Cluster
Eth
ernet
Uni FDDIBackbone
RS/6000 25T
Scalable POWERParallel Switch30 GB
RAID
30 GB
RAID
58,5 GB
SSA
36 GB
SSA
Festplattensysteme
SCSI
SSA
IBM 3494 Tape Library3494-C2A 3494-L10 3494-D12
Frame 3 Frame 2 Frame 1
34903490
3590 3590
3590 3590
Ca. 800Band-lager-fächer
MILESS
IBM CONTENTMANAGER
58,5 GB
SSA
Ethernet
BWIN34 Mbit/s
BIK2001 / 5.4.2001
• MILESS Software ist in Java implementiert• MILESS Software selbst ist als Open Source verfügbar über
www.campussource.de (OpenSource-Börse am 1.4.2001 gestartet und vom Land NRW gefördert, Lehr- und Lernplattformen)
• Erste Nachnutzung an anderen Universitäten in DFG-Projekten• MILESS ist Prototyp für das Projekt Bach Digital mit digi-
talisierten Autographen und Tonbeispielen an der Uni Leipzig • DFG Projekt „Digitale Online Video-Bibliothek“ Essen - Jena
•Verteilte Digitale Bibliothek (Oberfläche, Objektverteilung)•Verbesserungen bei der Inhaltserschliessung und Segmentierung von digitalisiertem Video-Lehr-Material (insbes. Beispiele aus der Medizin)
MILESS
BIK2001 / 5.4.2001
• Dokumentenmodell ist Umsetzung des Dublin Core Element Set:Creator, Publisher, Contributor, Title, Subject, Description, Source, Coverage, Rights, Type, Format, Date, Language
• Ergänzt um Modell für Personen / Körperschaftsdaten:Personen, Namensformen, Kontaktinformationen, ...
• Ergänzt um Modell für Dokumenten-Derivate und DateienEin Dokument in verschiedenen Formaten (HTML, PS, PDF, ...)
• Metadatensatz ist abgestimmt auf / mit
• Flexibles Modell auch für multimediale Dokumente
MILESS Datenmodell
Deutsche Bibliothek:Dissertationen Online
BIK2001 / 5.4.2001
Architektur MILESS Datenmodell
Classification
Category Document Role Legal Entity
Derivate
DerivatePart
Contact
Person Coorperation
BIK2001 / 5.4.2001
Titel, Dokumententyp, Sprache, Medientyp, Datumswerte, ...
• Bis zu neun alternative Titel je Dokument, Sprache, Typ des Titels (main / alternative, translated), Länge beliebig, Volltextsuche im Titel• Angabe der Sprache(n) des Dokumentes anhand ISO 639-2 Liste• Mehrere Datumsangaben je Dokument: Datum der Erzeugung, der letzten Änderung, Gültigkeitszeitraum von / bis, Datum der Antragstellung zur Promotion, Datum der Prüfung (Dissertationen)
BIK2001 / 5.4.2001
Autoren und Personendaten
• Personen- / Körperschaftsdaten• Unterstützung mehrerer Namensformen je Person, z. B. für verschiedene Schreibweisen, Nachname nach und vor der Heirat etc.• L/M/R-trunkierte Suche• Mehrere Kontakte (dienstl., privat)• Mehrere E-Mail- und Web- Adressen, Telefon, Telefax, Anschriften je Kontakt
Bis zu je 10 Autoren, Herausgeber, Beitragende
(Übersetzer, ...) je Dokument
BIK2001 / 5.4.2001
• Freie Stichwörter / Schlagwörter• Unterstützung beliebiger hierarchischer Fachklassifikationen• Mehrfachzuordnung, parallele Verwendung mehrer Klassifikationen
Stichwörter, Klassifikationen
• Exakte Suche nach bestimmten Kategorien• Volltextsuche (Wörter, Phrasen) nach Kategorien und Stichwörtern
BIK2001 / 5.4.2001
Stichwörter, Klassifikationen
• Klassifikations- bäume können in MILESS integriert werden• Navigation durch die Hierarchie, Suche in der Hierarchie
• Volltextsuche im Klassifikationssystem zum Auffinden von Kategorien ( z. B. PACS: ca. 2900 Kategorien )
BIK2001 / 5.4.2001
Description, Source,Coverage, Rights
• Description: Beschreibung oder Zusammenfassung (Abstract)• Source: Hinweis auf Herkunft (Freitext, ISBN-Angabe etc.)• Coverage: Räumlicher / zeitlicher Bezug des Dokumentes• Rights: Rechtliche Vermerke, Lizenzbedingungen etc.
• Je bis zu 10 Angaben je Dokument, Länge beliebig• Freitext, URL (z. B. Verweis auf externe Zusammenfassung) oder andere Schemata, Sprache zu diesen Elementen erfaßbar• Volltextsuche in diesen Elementen
BIK2001 / 5.4.2001
• Verschiedenste Formate
Multimediales Material: Ziele in MILESS:
• Unterstützung beliebiger Dateiformate
MILESS: Intentionen und Ziele
• Audio / Videomaterialien: Große Datenmengen
• Skalierbarkeit des Systems: Spezielle Audio-/Videosoftware
• Audio / Videomaterialien: Intensive Nutzung bisher nicht verbreitet
• Einsatz direkt in der Vorlesung: geringe technische Hemmschwelle
BIK2001 / 5.4.2001
Dokumente und Derivate
• Ein Dokument kann in mehreren Formaten (Derivate) vorliegen• Medientyp: Grobeinordnung, Formate: Genauere Angabe• Derivat kann in MILESS archiviert oder auch nur URL sein• Unterstützung beliebiger Dateiformate (erweiterbare Liste) • Beibehaltung der Verzeichnishierarchie des Derivates• Integrierter Verweis auf Plug-In-Sammlung, Anzeige Umfang• Generierung von zip-Archiven on the fly
BIK2001 / 5.4.2001
Dokumente, Derivate, Dateien, Beschreibung der Formate
Dokument 4711„Nachweiss von atomarem Wasserstoff
Medientyp: Text
Derivat 12345 (derivat)Inhaltstyp: HTML-Dokument
Derivat 12346 (derivat)Inhaltstyp: PDF-Dokument
Derivat 12347 (derivat)Inhaltstyp: LaTeX-Dokument
DerivateParts:
- index.html HTML- images/abb1.gif GIF - images/abb2.jpg JPEG - kap1.html HTML
DerivateParts:
- wasserstoff.pdf PDF
DerivateParts:
- wasserstoff.tex LaTeX- images/abb1.eps EPS-Grafik - images/abb2.eps EPS-Grafik - layout.sty LaTeX Style
BIK2001 / 5.4.2001
Weitere Modellbereiche -zukünftige Entwicklungsschritte
• Modell zur Nutzer-, Rechte- Zugriffsverwaltung
• Workflows zur Bearbeitung von Dokumenten
• Digitale Signatur um Unverfälschtheit zu sichern
• integrierte Versionsverwaltung
• Strukturierte Dokumente: Buchmodell, Zeitschriftenmodell,..... interne Dokumentstrukturen : Kapitel, Absatz
• Beziehungen zwischen den Dokumenten : externe Aspekte