Universität zu Köln
Der Kölner UniversitätsGesamtkatalog
Praxisbericht 'Betrieb einer Recherche-Infrastruktur'
Oliver Flimm <[email protected]>
ZBIW: DV-Systembetreuung in Hochschulbibliotheken28.11.2014
Universität zu Köln
„Der KUG“• Zentrale Recherche-Infrastruktur für
die Bestände der Universität zu Köln• Umfang (Stand 11/2014): 17.2 Mio.
Titel in 212 separaten Katalogen• Integriert verschiedene Prinzipien und
Funktionen aus dem Social- und Semantic Web
• Realisiert mit der Open-Source Software OpenBib (GPL, seit 1997)
Universität zu Köln
Universität zu Köln
Besonderheiten
• Open Source als zentrales Prinzip– Softwareverteilung über öffentliches SVN
Repository (Google Code)
• LAPPX (Linux, Apache, PostgreSQL, Perl, Xapian)
• Eine Infrastruktur für effiziente Bereitstellung vieler separater Portale– Objektorientiertes Templating
Universität zu Köln
Flexibles Templating
Verschiedene Abstraktionsebenen (Kataloge, Views, Katalogprofile)Default: 701 Alle: 3621/titles_record
/_databases/mdz/titles_record
/_views/gdz/titles_record
/_profiles/kug/titles_record
/_profiles/kug/_databases/mdz/titles_record
/_profiles/sammlungen/_views/muenzen/titles_record
Universität zu Köln
Universität zu Köln
Infrastruktur: Ziele• Eine Lösung für
– Endnutzer im Web-Browser– Integration in andere Dienste (USB-Portal)– Semantic Web
• Durchgehender 24/7 Betrieb– Möglichst keine Downtimes bei
Erweiterungen/Updates
• Größtmögliche Flexibilität und Erweiterbarkeit
Universität zu Köln
Infrastruktur: Zentrale Prinzipien
• Trennung von Resourcen und verschiedenen Repräsentationen– Content-/Language-Negotiation per 303
Redirect– HTML, INCLUDE, JSON, RDF, RSS, CSV,
TXT, ICAL
• REST für einzelne Resourcen (JSON)– GET, POST, PUT, DELETE
Universität zu Köln
Beispiel: URI's
Resource: – /portal/<view>/databases (GET,POST)
Repräsentationen:– /portal/<view>/databases.html?l=de– /portal/<view>/databases.json?l=de– /portal/<view>/admin/databases.html?l=de– /portal/<view>/admin/databases.json?l=de
Universität zu Köln
Beispiel: URI's II
Resource: – /portal/<view>/databases/id/mdz
(GET,PUT,DELETE)
Repräsentationen:– /portal/<view>/databases/id/mdz.html?l=de– /portal/<view>/databases/id/mdz.json?l=de– /portal/<view>/admin/databases/id/mdz.html?l=de– /portal/<view>/admin/databases/id/mdz.json?l=de
Universität zu Köln
Beispiel: URI's III oder JSON RuleZ{ "link": { "rel": "self", "href": "http://kug.ub.uni-koeln.de/portal/kug/databases.json?l=de" }, "databases": [ { "link": { "rel": "self", "href": "http://kug.ub.uni-koeln.de/portal/kug/databases/id/afrikaans.json?l=de" }, "system": "Sisis", "active": 1, "description": "Sammlung Afrikaans", "dbname": "afrikaans", "sigel": "afri", "url": "http://www.ub.uni-koeln.de", "id": "afrikaans" },
Universität zu Köln
USB-Portal KUG
S1 S2 S3 S4
Frontend S0
Cluster A
System /User DB
Cluster B
HaProxy
Recherche Update
Architektur für 24/7
Universität zu Köln
Architektur: 24/7 II
• Frontend-Server mit Proxy und externer Steuerung
option httpchk HEAD /portal/openbib/server_is_active
• Alternierende Cluster für Recherche und Updates
Universität zu Köln
Aggregation externer Daten als Kataloge
• Standard-Schnittstellen (OAI) und Formate (DC, MARC21) nutzen, sonst API (YouTube/OER) und/oder eigene Konverter
• Zentrale OAI-Aggregation mit REPOX• Open Data nutzen (BVB, SWB, hbz)
– Beispiel: Nomos Online Premium
Universität zu Köln
Universität zu Köln
Anreicherungen
Problem Sacherschliessung– RVK, DDC, Schlagworte, Links auf
Inhaltsverzeichnisse aus Open Data Dumps– Verschlankung verschiedener Systematiken
zu 20 Themengebieten über Konkordanzen- 370.000 Titel mit BK vs. 1.1 Mio Titel mit
Themengebiet
– Referenzierende Artikelnamen aus der Wikipedia als 'Schlagworte'
Universität zu Köln
Anreicherungen II
Mehr finden:– ISBN10 und ISBN13– „Erscheinungsjahre“ bei Zeitschriften– Schiller-Räuber-Problem– Medientyp, Sprache– Synonym-Wörterbücher
Universität zu Köln
Administration
• Grundlegende Administration muss an Nicht-Techniker delegierbar sein– Web-Oberfläche für Administratoren
• Gleiches gilt für die textuelle Betreuung von Sammlungsportalen durch externe Wissenschaftler (Präsentation von Forschungsdaten)
Universität zu Köln
Universität zu Köln
Universität zu Köln
Elementare Bedürfnisse der Nutzer im Blick behalten
• Relevantes Finden und Einordnen– Rechercheanreicherungen– Livesearch, Rechtschreibkorrektur, Toleranzen– Systematische Einordnung (Themengebiete)
• Wie komme ich dran?– Facettierung nach Standort und Zugriffs-Status– Priorität: Online > ausleihbar > einsehbar
Universität zu Köln
Universität zu Köln
Tools
• REPOX• Yslow• YAML Framework• ORM• CGI::Application
Universität zu Köln
Fragen?
Universität zu Köln
Vielen Dank für Ihre Aufmerksamkeit
Quellen:KUG - http://kug.ub.uni-koeln.de/
OpenBib - http://www.openbib.org/
OpenBib Wiki - http://wiki.openbib.org/
OpenBibBlog - http://blog.openbib.org/
Projektseite – http://code.google.com/p/openbib/
Xapian Suchmaschine - http://www.xapian.org/