Date post: | 25-Jan-2015 |
Category: |
Documents |
Upload: | sven-s-porst |
View: | 437 times |
Download: | 5 times |
Metasuche mit pazpar2Sven-S. Porst
Niedersächsische Staats- undUniversitätsbibliothek Göttingen
dankeselbst vorstellenarbeite an der SUB, an Metasuche und virtuellen Fachbibliothekeninsbesondere Lib AAC, GEO-LEO, SUB Metasuche
Metasuche
•Was ist Metasuche?
•… hört sich an wie ein Albtraum
•… ist aber manchmal unvermeidlich
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Was: Metasuche / förderierte Suche / verteilte Suchegleichzeitige Abfrage aus mehreren entfernten Datenquellengemeinsame Anzeige der ErgebnisseAlbtraum (Unvollständigkeit, Geschwindigkeit, Unzuverlässigkeit, Indexe/Möglichkeiten) also: technisch problematisch + potentiell schlechte user experience also: wenn möglich vermeiden + lokalen Index nutzenAber: schwierig, Daten dafür zu bekommen + Updates + hoher Aufwand
Schritte
1. Daten holen
2. Daten normalisieren
3. Ergebnisse verfügbar machen
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.20121. Protokolle (Z39.50, SRU, Solr) / Abfragesprache (CCL/RPN, CQL, Solr) / Ergebnisformat (ISO 2709, XML)2. Normalisieren (heterogene Eingabge → homogene Ausgabe) / MARC/DC/Solr → internes Format / unterschiedlich: Detailtiefen, codierte Informationen (z.B. Medientyp, Sprache)3. Verfügbar machen: wann (a/synchron)? Quellen mischen? Facetten? Exportformate? UX?
bisherige Lösungen
• ohne Support (alt oder selbstgebaut)
• monolithisch (feste Oberfläche)
• an der SUB Göttingen Entscheidung für pazpar2 als Ersatz
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012SUB früher: iPort + eigenes GEO-LEOandere Lösungen, z.B. Metalib, i.d.R. in andere Produkte eingebundenEntscheidung der SUB für: homogene Infrastruktur,
pazpar2
• http://indexdata.com/pazpar2
• open source
• aktive Entwicklung durch Index Data
• Daten, keine Nutzeroberfläche
• als Dienst einbindbar
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Index Data: yaz + andere Projekte, viele Server beruhen auch auf yaz … bieten Support an»Dienst«: primär Schritte 1+2 für Daten: eigene Nutzeroberfläche wird benötigt
1. Daten holen
• basiert auf yaz
• Z39.50, SRU, Solr
• … und zugehörige Abfragesprachen
• liest XML und MARC 21 Daten
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012yaz: Standardbibliothek für bibliographische Verbindungen (Z39.50, SRU, Solr) Liest XML und ISO 2709; NICHT MAB oder unstrukturierte Daten tmarc?liest Daten in 20er Schritten
2. XML Workflow
• internes Datenformat ist XML
… mit frei definierbaren Feldern
• Normalisierung durch XSLT
• XSLTs verkett- und nachnutzbar
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012ISO 2709 wird in MARC XML oder tmarc konvertiertXSL Beispiele: ISO 639-1 zu ISO 639-2/B Sprachcodes oder Fehlerbereinigung
Internes Datenformat
• XSLT für MARC 21 enthalten
• gibt ein gutes Datenformat vor
• Facettierung pro Feld
• Deduplizierung
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012MARC 21 gerne totgesagt, aber: weit verbreitet, Detailtiefetmarc.xsl gibt gutes Datenmodell + eigene Felder (language, multivolume-title, …)Facetten: gute Normalisierung wichtig, ICU Filter anwendbarDeduplizierung: recht einfaches Modell auf Feldbasis, + Merging (siehe Anschlußvortrag S. Lohrum)
MARC 21 → pazpar2
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Datensatz aus OLC SSG-Geo, ArtikelAutoren in MARC 700Sprache unbekanntArtikeldetails in MARC 773
3. Abfrage
• keine Weboberfläche
• http/XML Schnittstelle
• sessionbasiert: init / search / show
• JavaScript zur Kommunikation: pz2.js
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012weitere Befehle: ping / bytarget / termlist / record / settings /
Anzeige
• elementarer JavaScript Client dabei
• erweitert für SUB Göttingen:
• Interface auf Deutsch und Englisch
• ZDB-JOP, Google Books und Maps
• Exportformate
• Nutzungsanalyse mit piwik
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Export RIS/BibTeX/COiNSpiwik: knapp 10% erweiterte Suche, detailanzeige ca 1:1 mit Suchen, gut 10% Facetten, Export 1%, Google Books 2%Histogramm
Bemerkungen
• Entwicklungen: Facettierung, Solr
• Zugriffskontrolle mit pazpar2-access
• TYPO3 Einbindung
• Beispiele:
• GEO-LEO: geo-leo.de
• Lib AAC: aac.sub.uni-goettingen.de
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012auch: Verbesserungsmöglichkeiten (Deduplizierung, Services abfragen, Protokoll)
Demo
http://geo-leo.de/bibtag
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Demo: Suche nach Solling Treffer Artikel »Numerical Assessment …«, Vollanzeige + JOP Facette Karte Sonderblatt Waldfunktionenkarte + Google Maps Histogramm
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Vielen Dank
• http://github.com/ssp/pazpar2-all
• Fragen?
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012