Die ZBW ist Mitglied der Leibniz-Gemeinschaft
Bibliotheken im Spannungsfeld zwischen Nutzungsmessung und Datenschutz
Jan Lüth, Dr. Timo Borst
IT-Entwicklung
ZBW - Deutsche Zentralbibliothek für Wirtschaftswissenschaften
Leibniz-Informationszentrum Wirtschaft
100. DEUTSCHER BIBLIOTHEKARTAG
Berlin, 08.06.2011 (aktualisiert: 24.11.2011)
Seite 2
Schwerpunkte des Vortrages Technische Aspekte der automatischen Datenerhebung von
Nutzungsdaten Nutzungsmessung / Webanalytics Rechtliche Aspekte / Datenschutz
Seite 3
Angebote von Bibliotheken im WWW Website Online Public Access Catalog (OPAC) Fachportal Repository E.Journal E-Books Apps Social Media Linked Open Data (LOD)
Seite 4
Datenerhebung Nutzerdaten
Dienst erbringen Versand eines Newsletter Alerting per Email
Abrechnung / Bezahlung Dokumentenlieferung E-Books
Personalisierung Login, Präferenzen Nutzungsverhalten
Seite 5
Datenerhebung Nutzungsdaten (automatisch)
Technischer Betrieb Dokumentation von Angriffen Technische Optimierung
Inhaltliche Optimierung des Angebots Seitenstruktur, Layout Suchmaschinen Optimierung (SEO)
Marketing / Controlling Wirkung von Marketing-Aktivitäten (z.B. Roadshow) Auswertung von Kampagnen Zielerreichung (z.B. Download nach Rechercheprozess)
Datenbasis für eigene Dienste Suchmaschinen: Empfehlungs-Dienste, Ranking
Seite 6
Nutzungsmessung Webseiten
Abrufe aller Objekte (Hits) Anzahl der Besuche (Visits) Anzahl der Besucher (Unique Visitors) Wiederkehrende Besucher Dauer der Besuche (Session) Seitenabrufe (Pageviews)
pro Seite insgesamt pro Besuch
Metriken bezogen auf Zeitraum z.B. pro Tag / Woche / Monat
}
Traffic Metriken
Seite 7
Nutzungsmessung Webseiten
Nutzer-Interaktion während eines Besuchs Einstiegsseite, Ausstiegsseite Landingpages Klickpfade Aufruf definierter Objekte (z.B. Bannerwerbung) Heatmaps Klickmaps
Seite 8
Nutzungsmessung Webseiten
Referer (Verweise auf das aufgerufene Objekt) Internetsuchmaschinen Keywords
Herkunft der Besucher (Land / Region / Stadt) Hardware Betriebssysteme Software Plugins Bildschirmauflösung
Seite 9
Nutzungsmessung Bibliothekssuchmaschine, OPAC, Repositorien
Suchterme Verwendete Parameter Verwendung verschiedener Sucheinstiege Verwendung von Facetten/Drill-Downs Trefferansichten Ansichten von Volltexten Ansichten von Abstracts Heruntergeladene Dokumente (Downloads)
Granulare Details Dimension (z.B. Seite Titel)
} Erfolgs Metriken
Seite 10
Technologien zur Datenerhebung
Dateneingabe durch Nutzerin Automatisiert
Applikations-Logfiles Webserver-Logfiles Pixelbasiertes Tracking Datenbank-Logs Netzwerkverkehr Download-Scripte
Seite 11
Webserver-Logfiles Protokollierung aller Anfragen an den Webserver
Webseiten, Grafiken, PDF-Dateien, Seiten-Stylesheets etc. Anfragen auf nicht vorhandene Objekte
Dokumentieren zeilenweise jede Anfrage eines Objektes Server nimmt die Protokollierung vor Basis für eine Auswertung mit entsprechenden Analyse-Tools
Seite 12
Webserver-Logfiles 192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /index.php?id=search HTTP/1.1" 200 4392 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1„
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /typo3temp/stylesheet_bf871ed27f.css?1282651429 HTTP/1.1" 200 11727 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/german_icons.css?1282651428 HTTP/1.1" 200 220 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /typo3temp/javascript_0b12553063.js?1282651429 HTTP/1.1" 200 951 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/my_layout.css HTTP/1.1" 200 9284 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/patch_teaser.css HTTP/1.1" 200 201 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/scripts/cookies.js HTTP/1.1" 200 5758 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/scripts/efa_fontsize.js HTTP/1.1" 200 10800 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/suchergebnisse.css HTTP/1.1" 200 10116 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /images/zew.png HTTP/1.1" 200 1416 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/core/base.css HTTP/1.1" 200 7838 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/basemod.css HTTP/1.1" 200 2086 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/navigation/nav_shinybuttons.css HTTP/1.1" 200 2905 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/print/print_draft.css HTTP/1.1" 200 4629 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/templates/screen/form.css HTTP/1.1" 200 6376 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:01 +0200] "GET /fileadmin/yaml/core/print_base.css HTTP/1.1" 200 3520 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/icons/zoomOut.gif HTTP/1.1" 200 919 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/icons/normal.gif HTTP/1.1" 200 902 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/icons/zoomIn.gif HTTP/1.1" 200 879 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/bordertopnav.gif HTTP/1.1" 200 45 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/flags/en.gif HTTP/1.1" 200 163 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/econbiz_logo.gif HTTP/1.1" 200 4192 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/personal_border.gif HTTP/1.1" 200 54 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/btn_suche.png HTTP/1.1" 200 1278 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/unikoeln.png HTTP/1.1" 200 2736 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/zbw.png HTTP/1.1" 200 2214 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /images/dfg.png HTTP/1.1" 200 554 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/body_border.gif HTTP/1.1" 200 56 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav_r_border.png HTTP/1.1" 200 220 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav_no.png HTTP/1.1" 200 147 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav.png HTTP/1.1" 200 182 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/bg_nav.png HTTP/1.1" 200 13567 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/nav_ac.png HTTP/1.1" 200 115 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/footer_bk.png HTTP/1.1" 200 205 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
192.168.1.111 - - [31/May/2011:15:10:02 +0200] "GET /fileadmin/images/dot_border.gif HTTP/1.1" 200 48 "http://www.google.de?q=econbiz" "Mozilla/5.0 (Windows NT 5.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"
35 Zeilen: Hits beim Aufruf einer Seite (pageview)
Seite 13
Webserver-Logfiles
IP-Adresse / Hostname
192.168.0.1 Datum / Zeit
[01/Jul/2010:00:06:52 +0200] Methode, Angefragtes Objekt, Protokoll
"GET /index.shtml HTTP/1.1„ http-Statuscode
200, 206, 404, 500 Übertragene Daten(byte)
24866
NCSA extended/combined log format: http://httpd.apache.org/docs/current/mod/mod_log_config.htmlhttp status codes: http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html
Seite 14
Webserver-Logfiles
Referer
"http://www.google.com/search?q=econbiz„ User-Agent (Browser, Betriebssystem etc)
"Mozilla/5.0 (Windows; U; Windows NT 6.1; de; rv:1.9.2.6) Gecko/20100625 Firefox/3.6.6 GTB7.1 „
NCSA extended/combined log format: http://httpd.apache.org/docs/current/mod/mod_log_config.html
Seite 15
Logfile-Analyse: Software
Seite 16
Logfile-Analyse: Bsp. Geolokalisation 134.245.94.1-255
Ort der IP Adresse: Kiel ISP: Universitaet Kiel
188.108.121.1-255 Ort der IP Adresse: Eschborn / Germany ISP: Arcor AG
188.108.255.1-255 Ort der IP Adresse: Hannover / Germany ISP: Arcor AG
nicht immer identisch mit dem tatsächlichen Standort z.B. UMTS /
DSL (dynamische IP-Vergabe)
Seite 17
Logfile-Analyse: Software
Kostenlose Lizenz Webalizer (http://webalizer.com/) AW-Stats (http://awstats.sourceforge.net/)
Demo:
http://www.nltechno.com/awstats/awstats.pl?config=destailleur.fr … selbst entwickelte Software-Scripte
Seite 18
Webserver-Logfiles: Vorteile Automatisch auf dem eigenen Webserver verfügbar Kostenlose Tools für Auswertung http-Statuscodes insbes. Fehlercodes Protokollierung von Robots
Seite 19
Webserver-Logfiles: technische Grenzen IP-Adresse/Hostname nicht immer aussagekräftig bzw. eindeutig
Router (Network Address Translation NAT) Proxy-Server (Zwischenspeicher) während einer Session wechselnde IP-Adressen (Bsp. AOL)
Robots müssen gefiltert werden Webbrowser / Software
Referer und User-Agent manipulierbar (SPAM) Verwendung paralleler Tabs
Eingeschränkte Detail-Analyse Keine Ergebnisse in “Echtzeit“
Seite 20
Nutzer-Tracking Einbindung einer 1x1 Pixel großen Grafik (Zählpixel)
im <body> jeder Webseite vor dem Content / hinter dem Content
Einbindung als <img …> mit JavaScript alternativ <noscript>…
Client-PC liefert Informationen an Tracking-Server
Seite 21
Nutzer-Tracking Code
<!-- BEGIN etracker code ETRC 3.0 --><script
type="text/javascript">document.write(String.fromCharCode(60)+"scr
ipt type=\"text/javascript\" src=\"http"+
("https:"==document.location.protocol?"s":"")+"://code.etracker.com/
t.js?et=b9xpM9\">"+String.fromCharCode(60)+"/script>");</
script><!-- etracker PARAMETER 3.0 --><script
type="text/javascript">var et_pagename = "Suche";var et_areas
= "Suche";</script><!-- etracker PARAMETER END --><script
type="text/javascript">_etc();</script><noscript><p><a
href="www.etracker.com"><img style="border:0px;" alt=""
src="http://www.etracker.com/nscnt.php?et=b9xpM9"
/></a></p></noscript><!-- etracker CODE END -->
Seite 22
Nutzer-Tracking Code
<!-- BEGIN etracker code ETRC 3.0 --><script
type="text/javascript">document.write(String.fromCharCode(60)+"scr
ipt type=\"text/javascript\" src=\"http"+
("https:"==document.location.protocol?"s":"")+"://code.etracker.com/
t.js?et=b9xpM9\">"+String.fromCharCode(60)+"/script>");</
script><!-- etracker PARAMETER 3.0 --><script
type="text/javascript">var et_pagename = "Suche";var et_areas
= "Suche";</script><!-- etracker PARAMETER END --><script
type="text/javascript">_etc();</script><noscript><p><a
href="www.etracker.com"><img style="border:0px;" alt=""
src="http://www.etracker.com/nscnt.php?et=b9xpM9"
/></a></p></noscript><!-- etracker CODE END -->
Seite 23
Nutzer-Tracking http-request
http://www.etracker.de/cnt.php?
v=3.0&java=y&tc=1306764148699&et_tz=-
120&et=b9xpM9&et_ilevel=1&swidth=1280&sheight=1024&siwidth=1
280&siheight=463&scookie=1&scolor=24&et_pagename=Alle&et_ar
eas=Suche&et_target=,0,0,0,0&et_url=http%3A%2F
%2Fwww.econbiz.de%2Findex.php&slang=de&ref=http%3A%2F
%2Fwww.econbiz.de%2Findex.php%3Fid%3Dresults%26q
%3Dmarketing%26limit%3D10%26keepFilters%3D1%26search
%3Ds_all%26sortBy%3Ddate_sort%26sortDirection%3Ddesc
%26page%3D2%26L%3D0&p=Java%20Deployment%20Toolkit
%206.0.150.3%3BAdobe%20Acrobat%209.4.4%3BShockwave
%20Flash%2010.3%3BJava(TM)%20Platform%20SE
%206%20U11%3BJava(TM)%20Platform%20SE
%206%20U15%201.6.0_15%3BJavascript%201.8
Seite 24
Nutzer-Tracking http-request – Tracking-ID
http://www.etracker.de/cnt.php?
v=3.0&java=y&tc=1306764148699&et_tz=-
120&et=b9xpM9&et_ilevel=1&swidth=1280&sheight=1024&siwidth=1
280&siheight=463&scookie=1&scolor=24&et_pagename=Alle&et_ar
eas=Suche&et_target=,0,0,0,0&et_url=http%3A%2F
%2Fwww.econbiz.de%2Findex.php&slang=de&ref=http%3A%2F
%2Fwww.econbiz.de%2Findex.php%3Fid%3Dresults%26q
%3Dmarketing%26limit%3D10%26keepFilters%3D1%26search
%3Ds_all%26sortBy%3Ddate_sort%26sortDirection%3Ddesc
%26page%3D2%26L%3D0&p=Java%20Deployment%20Toolkit
%206.0.150.3%3BAdobe%20Acrobat%209.4.4%3BShockwave
%20Flash%2010.3%3BJava(TM)%20Platform%20SE
%206%20U11%3BJava(TM)%20Platform%20SE
%206%20U15%201.6.0_15%3BJavascript%201.8
Seite 25
Nutzer-Tracking http-request - Auflösung
http://www.etracker.de/cnt.php?
v=3.0&java=y&tc=1306764148699&et_tz=-
120&et=b9xpM9&et_ilevel=1&swidth=1280&sheight=1024&siwidth=1
280&siheight=463&scookie=1&scolor=24&et_pagename=Alle&et_ar
eas=Suche&et_target=,0,0,0,0&et_url=http%3A%2F
%2Fwww.econbiz.de%2Findex.php&slang=de&ref=http%3A%2F
%2Fwww.econbiz.de%2Findex.php%3Fid%3Dresults%26q
%3Dmarketing%26limit%3D10%26keepFilters%3D1%26search
%3Ds_all%26sortBy%3Ddate_sort%26sortDirection%3Ddesc
%26page%3D2%26L%3D0&p=Java%20Deployment%20Toolkit
%206.0.150.3%3BAdobe%20Acrobat%209.4.4%3BShockwave
%20Flash%2010.3%3BJava(TM)%20Platform%20SE
%206%20U11%3BJava(TM)%20Platform%20SE
%206%20U15%201.6.0_15%3BJavascript%201.8
Seite 26
Nutzer-Tracking http-request - Cookies
http://www.etracker.de/cnt.php?
v=3.0&java=y&tc=1306764148699&et_tz=-
120&et=b9xpM9&et_ilevel=1&swidth=1280&sheight=1024&siwidth=1
280&siheight=463&scookie=1&scolor=24&et_pagename=Alle&et_ar
eas=Suche&et_target=,0,0,0,0&et_url=http%3A%2F
%2Fwww.econbiz.de%2Findex.php&slang=de&ref=http%3A%2F
%2Fwww.econbiz.de%2Findex.php%3Fid%3Dresults%26q
%3Dmarketing%26limit%3D10%26keepFilters%3D1%26search
%3Ds_all%26sortBy%3Ddate_sort%26sortDirection%3Ddesc
%26page%3D2%26L%3D0&p=Java%20Deployment%20Toolkit
%206.0.150.3%3BAdobe%20Acrobat%209.4.4%3BShockwave
%20Flash%2010.3%3BJava(TM)%20Platform%20SE
%206%20U11%3BJava(TM)%20Platform%20SE
%206%20U15%201.6.0_15%3BJavascript%201.8
Seite 27
Nutzer-Tracking http-request – Seitenname / Bereich
http://www.etracker.de/cnt.php?
v=3.0&java=y&tc=1306764148699&et_tz=-
120&et=b9xpM9&et_ilevel=1&swidth=1280&sheight=1024&siwidth=1
280&siheight=463&scookie=1&scolor=24&et_pagename=Alle&et_ar
eas=Suche&et_target=,0,0,0,0&et_url=http%3A%2F
%2Fwww.econbiz.de%2Findex.php&slang=de&ref=http%3A%2F
%2Fwww.econbiz.de%2Findex.php%3Fid%3Dresults%26q
%3Dmarketing%26limit%3D10%26keepFilters%3D1%26search
%3Ds_all%26sortBy%3Ddate_sort%26sortDirection%3Ddesc
%26page%3D2%26L%3D0&p=Java%20Deployment%20Toolkit
%206.0.150.3%3BAdobe%20Acrobat%209.4.4%3BShockwave
%20Flash%2010.3%3BJava(TM)%20Platform%20SE
%206%20U11%3BJava(TM)%20Platform%20SE
%206%20U15%201.6.0_15%3BJavascript%201.8
Seite 28
Nutzer-Tracking http-request –Referer
http://www.etracker.de/cnt.php?
v=3.0&java=y&tc=1306764148699&et_tz=-
120&et=b9xpM9&et_ilevel=1&swidth=1280&sheight=1024&siwidth=1
280&siheight=463&scookie=1&scolor=24&et_pagename=Alle&et_ar
eas=Suche&et_target=,0,0,0,0&et_url=http%3A%2F
%2Fwww.econbiz.de%2Findex.php&slang=de&ref=http%3A%2F
%2Fwww.econbiz.de%2Findex.php%3Fid%3Dresults%26q
%3Dmarketing%26limit%3D10%26keepFilters%3D1%26search
%3Ds_all%26sortBy%3Ddate_sort%26sortDirection%3Ddesc
%26page%3D2%26L%3D0&p=Java%20Deployment%20Toolkit
%206.0.150.3%3BAdobe%20Acrobat%209.4.4%3BShockwave
%20Flash%2010.3%3BJava(TM)%20Platform%20SE
%206%20U11%3BJava(TM)%20Platform%20SE
%206%20U15%201.6.0_15%3BJavascript%201.8
Seite 29
Nutzer-Tracking http-request - Plugins
http://www.etracker.de/cnt.php?
v=3.0&java=y&tc=1306764148699&et_tz=-
120&et=b9xpM9&et_ilevel=1&swidth=1280&sheight=1024&siwidth=1
280&siheight=463&scookie=1&scolor=24&et_pagename=Alle&et_ar
eas=Suche&et_target=,0,0,0,0&et_url=http%3A%2F
%2Fwww.econbiz.de%2Findex.php&slang=de&ref=http%3A%2F
%2Fwww.econbiz.de%2Findex.php%3Fid%3Dresults%26q
%3Dmarketing%26limit%3D10%26keepFilters%3D1%26search
%3Ds_all%26sortBy%3Ddate_sort%26sortDirection%3Ddesc
%26page%3D2%26L%3D0&p=Java%20Deployment%20Toolkit
%206.0.150.3%3BAdobe%20Acrobat%209.4.4%3BShockwave
%20Flash%2010.3%3BJava(TM)%20Platform%20SE
%206%20U11%3BJava(TM)%20Platform%20SE
%206%20U15%201.6.0_15%3BJavascript%201.8
Seite 30
Pfadanalyse - Einstiegsseiten
Grafik: etracker
Seite 31
Pfadanalyse - Ausstiegsseiten
Grafik: etracker
Seite 32
Pfadanalyse - Klickpfade
Grafik: etracker
Seite 33
Trichteranalyse / Erreichen von Zielen Wieviele Nutzerinnen erreichen den jeweiligen und nachfolgenden
Schritt
Ziel (Konversion): Ausleihe / Dokumentlieferung / Download
Seite 34
Nutzer-Tracking: Vorteile Suchmaschinen-Robots laden i.d.R kein JavaScript und keine
Grafiken Höhere Genauigkeit
Browser-Cache, Proxies Identifikation der Nutzer über Cookies
Je nach Nutzerkreis 90%-99% Erfassung der Referer Informationen über die Technik der Nutzer-PC Tools vereinen Erfassung und Analyse
Seite 35
Nutzer-Tracking: technische Grenzen Code muss in Webseiten integriert werden
Erfassung erst dann möglich Hoher Aufwand / Schulung erforderlich
(abhängig von den vorzunehmenden Auswertungen) Nachladen von Teilen der Webseiten (AJAX) keine Protokollierung von HTTP-Fehlern Webbrowser / Software
User-Agent manipulierbar Verwendung paralleler Tabs
Ungenauigkeiten bleiben Offline-Browser
Seite 36
Nutzer-Tracking: Software Google Analytics Yahoo Web Analytics Piwik etracker IVW* …
*IVW = Informationsgemeinschaft zur Feststellung der Verbreitung von WerbeträgernGrafik: http://www.idealobserver.com/tools/web-analyse/wer-nutzt-welches-tool/web-analytics-systeme-der-top-domains-april2011
Vergleich Logfile-Analyse vs. Tracking
Logfile Analyse Tracking
Logfiles automatisch vorhanden Erfassung nach Integration des Codes
Protokollierung von Robots (Nahezu) keine Zugriffe von Robots
Browser-Cache und Proxy-Server
verhindern Zählung aller Zugriffe
Kein Zwischenspeichern des Tracking-
Pixels
Identifikation des Nutzers über die
IP-Adresse ungenau
Identifikation des Nutzers via Tracking-
ID / Cookies relativ genauer
Einfache Generierung von Zahlen
(primär Traffic-Metriken)
Komplexe Auswertung möglich
(Traffic- und Erfolgs-Metriken)
Seite 38
Webanalytics Was wollen Sie messen?
Hypothese Überprüfung an Hand von Reports Trends / Charts Beobachtung von Kennzahlen Ziele / Erfolgskriterien
Wie wollen Sie messen? Reicht ein Tracking-Tool? Ggf. Kombination z.B. mit Application-Logfiles
Welche Konsequenzen wollen Sie ziehen? Layout, Design, Seitenstruktur, Inhalte Strategie, Produkte, Marketing Nutzung Bestandsentwicklung, Dienstleistungen
Seite 39
Webanalytics - Vergleichbarkeit
Kein Tool liefert 100% genaue Zahlen sondern lediglich Trends! Mangelnde Vergleichbarkeit Bsp: Fachportal
Inhalte (Volumen / Fachlich) Seitenstruktur Zielgruppe
Zahlen abhängig vom verwendeten Tool Z.B. Konfiguration, Sessiondauer, Robot Listen / Erkennung Tracking-Lösungen relativ dicht beieinander (z.B. IVW / etracker)
Vergleichbarkeit Repositorien COUNTER (http://www.projectcounter.org/) Open-Access-Statistik (http://www.dini.de/projekte/oa-statistik/)
Seite 40
Webanalytics Verwenden Sie Besuche (Visits) als globalen Maßstab
Pageviews sind kaum aussagekräftig AJAX Seitenstruktur
Verwenden Sie ein Tool mit pixelbasiertem Tracking für die
Erfolgsmessung Werten Sie ohne persönliche oder personenbezogene Daten aus
Problematisches Datum ist die IP-Adresse
Seite 41
Webanalytics Technisch
Application Service Providing (ASP) oder Eigeninstallation Integration in die Webseiten
Organisatorisch Planen Sie Personal ein
Technisches Verständnis Produkt-Affinität Analytisch Kommunikativ Webanalytics ist ein laufender Prozess – Generierung
automatischer Reports löst keine Probleme
Seite 42
Rechtliche Rahmenbedingungen Beschränkung der Betrachtung auf Deutschland
Server / Sitz der Institution in Deutschland Nutzer in Deutschland
Deutsches Recht findet Anwendung
Informationelle Selbstbestimmung (Rechtsprechung BVerfG) Selbstbestimmte Verwendung personenbezogener Daten
Bundesdatenschutzgesetz BSDG Öffentliche Stellen des Bundes, nicht öffentliche Stellen
Landesdatenschutzgesetze Öffentliche Stellen
Telemediengesetz TMG
Seite 43
Bundesdatenschutzgesetz BDSG § 1 Zweck und Anwendungsbereich des Gesetzes
Persönlichkeitsrechte des Einzelnen beim Umgang mit seinen
personenbezogenen Daten schützen § 3 Abs. 1 Personenbezogene Daten
Angaben über bestimmte oder bestimmbare natürliche Person §3a Datenvermeidung und Datensparsamkeit
So wenig personenbezogene Daten wie möglich erheben,
verarbeiten, nutzen Wenn möglich, personenbezogene Daten anonymisieren oder
pseudonymisieren Erstellung anonymer Profile zulässig § 3 Abs. 6 Daten Anonymisierung
Keine Zuordnung der Daten zur Person mehr möglich
Seite 44
Bundesdatenschutzgesetz BDSG § 3 Abs. 6 Anonymisierung
Verändern personenbezogener Daten derart, dass die
Einzelangaben über persönliche oder sachliche Verhältnisse nicht
mehr oder nur mit einem unverhältnismäßig großen Aufwand an
Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbaren
natürlichen Person zugeordnet werden können § 3 Abs. 6a Pseudonymisierung
Ersetzen des Namens und anderer Identifikationsmerkmale durch
ein Kennzeichen zu dem Zweck, die Bestimmung des Betroffenen
auszuschließen oder wesentlich zu erschweren
Seite 45
Bundesdatenschutzgesetz BDSG § 11 Auftragsdatenverarbeitung
10 individuelle vertragliche Regelung bei Datenerfassung durch
Dienstleister oder Erfüllung durch AGB des Dienstleisters
Seite 46
Datenschutzaufsicht in Deutschland Öffentliche Stellen Bund
Bundesdatenschutzbeauftragter Öffentliche Stellen Länder
Landesbeauftragte für den Datenschutz Betrieblicher Datenschutzbeauftragter
Hinwirken auf die Einhaltung des BDSG etc. diesbezüglich Vorschlagsrechte
Kontrolle der Einhaltung des BDSG
Bundesbeauftragte für den Datenschutz und die Informationsfreiheit - http://www.bfdi.bund.deDie Datenschutzbeauftragten der Länder - http://www.bfdi.bund.de/DE/AnschriftenUndLinks/Landesdatenschutzbeauftragte/AnschriftenLandesdatenschutzbeauftragte.html?nn=408930
Seite 47
Telemediengesetz TMG Daten zur Durchführung eines Telemediendienstes § 15 Nutzungsdaten Abs. 1
Erheben und Verwenden personenbezogene Daten eines Nutzers
nur soweit dies erforderlich ist, um die Inanspruchnahme von
Telemedien zu ermöglichen und abzurechnen Nutzungsdaten sind insbesondere
1. Merkmale zur Identifikation des Nutzers,
2. Angaben über Beginn und Ende sowie des Umfangs der
jeweiligen Nutzung und
3. Angaben über die vom Nutzer in Anspruch genommenen
Telemedien
Seite 48
Telemediengesetz TMG § 15 Nutzungsdaten Abs. 3
Pseudonymisierte Verarbeitung zulässig für Marktforschung,
bedarfsgerechte Gestaltung Nutzer hat Widerspruchsrecht Pseudonymisierte Daten dürfen nicht mit anderen Daten
„personifiziert“ werden § 12 Abs. 1
Erhebung und Verwendung personenbezogender Daten zulässig
wenn Nutzer zustimmt
IP-Adresse ein personenbezogenes Datum?
Datenschützer sehen die IP-Adresse als personenbezogenes Datum
Contra-ArgumentePro-Argumente
+ Internet Service Provider kann
die verwendete IP-Adresse
einer Person zuordnen+ Von einer Erfassung muss
ausgegangen werden+ Betreiber kann dies u.U. in
Verbindung mit Sign-In-
Diensten
- Nur der ISP kann die IP-
Adresse einer Person zuordnen
- ISP erfasst u.U. die Identität gar
nicht
Deutschland: Düsseldorfer Kreis http://de.wikipedia.org/wiki/D%C3%BCsseldorfer_Kreis EU: Artikel-29-Datenschutzgruppe http://de.wikipedia.org/wiki/Artikel-29-Datenschutzgruppe
Seite 50
Fazit für die Nutzungsmessung Den Betroffenen ist eine Möglichkeit zum Widerspruch gegen die
Erstellung von Nutzungsprofilen einzuräumen. Derartige
Widersprüche sind wirksam umzusetzen.
Die pseudonymisierten Nutzungsdaten dürfen nicht mit Daten über
den Träger des Pseudonyms zusammengeführt werden. Sie müssen
gelöscht werden, wenn ihre Speicherung für die Erstellung der
Nutzungsanalyse nicht mehr erforderlich ist oder der Nutzer dies
verlangt.
Quelle: Datenschutzkonforme Ausgestaltung von Analyseverfahren zur Reichweitenmessung bei Internet-Angebotenhttp://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssammlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
Seite 51
Fazit für die Nutzungsmessung Auf die Erstellung von pseudonymen Nutzungsprofilen und die
Möglichkeit zum Widerspruch müssen die Anbieter in deutlicher
Form im Rahmen der Datenschutzerklärung auf ihrer Internetseite
hinweisen.
Personenbezogene Daten eines Nutzers dürfen ohne Einwilligung
nur erhoben und verwendet werden, soweit dies erforderlich ist, um
die Inanspruchnahme von Telemedien zu ermöglichen und
abzurechnen. Jede darüber hinausgehende Nutzung bedarf der
Einwilligung der Betroffenen.
Quelle: Datenschutzkonforme Ausgestaltung von Analyseverfahren zur Reichweitenmessung bei Internet-Angebotenhttp://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssammlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
Seite 52
Fazit für die Nutzungsmessung Die Analyse des Nutzungsverhaltens unter Verwendung
vollständiger IP-Adressen (einschließlich einer Geolokalisierung) ist
aufgrund der Personenbeziehbarkeit dieser Daten daher nur mit
bewusster, eindeutiger Einwilligung zulässig. Liegt eine solche
Einwilligung nicht vor, ist die IP-Adresse vor jeglicher Auswertung so
zu kürzen, dass eine Personenbeziehbarkeit ausgeschlossen ist.
Quelle: Datenschutzkonforme Ausgestaltung von Analyseverfahren zur Reichweitenmessung bei Internet-Angebotenhttp://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssammlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
Seite 53
Fazit für die Nutzungsmessung Persönliche / personenbezogene Daten nur nach Einwilligung
erheben Möglichkeiten zum Widerspruch anbieten
Bsp. Opt-Out Anonymisierung der IP-Adresse innerhalb von 7 Tagen
IP Adresse 192.168.1.17 2 bytes löschen 192.168.x.x md5 hash (ip) 82fd59f7976a70014fd7fbe773fe72c1
Unzureichend weil der Adressraum begrenzt ist md5 hash (ip+salt) 393f84a8499cadfcfef054e349beedcd
Unabhängige Landeszentrum für Datenschutz Schleswig-Holstein (ULD): FAQ IP-Adressen und andere Nutzungsdatenhttps://www.datenschutzzentrum.de/ip-adressen/
Seite 54
Fazit für die Nutzungsmessung Datenschutzerklärung, Policy verfassen Datensparsamkeit Vertragliche Regelung mit Dienstleister treffen, wenn AGB nicht
ausreichend
Google Analytics legal nutzbar?
ULD: Derzeit ist Google Analytics in Deutschland nicht legal nutzbar.
Contra-ArgumentePro-Argumente
+ Eigenes Opt-Out könnte
programmiert werden+ Die IP-Adresse kann gekürzt
werden _anonymizeIp()
- Widerspruch/Opt-Out nur durch
Browserspezifisches Plug-In- Die IP-Adresse wird vor einer
Kürzung in die USA übermittelt- Unklar ob gesammelte Daten
gelöscht werden können- (Vertraglich zu regelnde)
UnklarheitenStellungnahme des ULD: Datenschutzrechtliche Bewertung des Einsatzes von Google Analyticshttps://www.datenschutzzentrum.de/tracking/20090123_GA_stellungnahme.pdf
Google Analytics legal nutzbar?
M.M. Maisch: Google Analytics ist in Deutschland legal nutzbar.
Contra-ArgumentePro-Argumente
+ Pixel-Bereitstellung zur
Webanalyse ist ein Dienst
gemäß TMG § 15 Abs. 1+ Nutzungsdaten werden von
Google direkt erhoben
- Website ist der Dienst- Nutzerdaten werden Dritten
zugänglich gemacht, entspricht
Auftragsdatenverarbeitung
gemäß BDSG § 11
Michael Marc Maisch: Datenschutz bei Google Analytics: Kritik an digitalen Fährtenlesern .http://www.lto.de/de/html/nachrichten/2520/datenschutz_bei_google_analytics_kritik_an_digitalen_faehrtenlesern/ ULD: FAQ IP-Adressen und andere Nutzungsdaten https://www.datenschutzzentrum.de/ip-adressen/
Seite 57
Google Analytics legal nutzbar! (Update 19.09.2011) Möglichkeit zum Widerspruch durch Browser-Add-On Letztes Oktett der IP-Adresse löschbar Vertrag zur Auftragsdatenverarbeitung
Quelle: http://www.datenschutz-hamburg.de/news/detail/article/beanstandungsfreier-betrieb-von-google-analytics-ab-sofort-moeglich.html
Seite 58
Beispiel Service Policy / Datenschutzerklärung Anonyme Datenerhebung
Anonyme Nutzung ist möglich Erhebung und Verarbeitung personenbezogener Daten
Freiwillig, z.B. für Newsletter Nutzung und Weitergabe personenbezogener Daten
Mit Einwilligung, Widerruf möglich Bearbeitung der Anfragen ,Werbung, Optimierung des
Angebotes keine Weitergabe an Dritte
Export und Verarbeitung von Daten in Staaten außerhalb des
Europäischen Wirtschaftsraumes Questionpoint (USA, 90 Tage)
Seite 59
Beispiel Service Policy / Datenschutzerklärung Cookies
Zweck, Möglichkeit der Deaktivierung Webanalytics
Marketing- und Optimierung Pseudonyme Nutzungsprofile Keine persönliche Identifikation / Personifizierung Widerspruchsmöglichkeit
http://www.etracker.de/privacy?et=b9xWmg Externe Links
Kein Einfluss auf den Inhalt
EconBiz – Datenschutz http://econbiz.de/index.php?id=privacy
Seite 60
Webanalytics Was wollen Sie messen? Wie wollen Sie messen? Welche Konsequenzen wollen Sie ziehen?
Fragen & Diskussion
Seite 62
Quellen
Gruppe für den Schutz natürlicher Personen bei der Verarbeitung personenbezogender Daten: Privatsphäre im Internet - Ein integrierter EU-Ansatz zum Online-Datenschutz . Brüssel 2000http://ec.europa.eu/justice/policies/privacy/docs/wpdocs/2000/wp37de.pdf
Artikel-29-Datenschutzgruppe: Stellungnahme 4/2007 zum Begriff „personenbezogene Daten“. Brüssel 2007http://ec.europa.eu/justice/policies/privacy/docs/wpdocs/2007/wp136_de.pdf
Düsseldorfer Kreis: Datenschutzkonforme Ausgestaltung von Analyseverfahren zur Reichweitenmessung bei Internet-Angeboten. Stralsund 2009http://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssammlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
Stellungnahme des ULD: Datenschutzrechtliche Bewertung des Einsatzes von Google Analyticshttps://www.datenschutzzentrum.de/tracking/20090123_GA_stellungnahme.pdf
Xamit: Xamit-Studie: Webstatistiken im Test – Welcher Dienst ist in Deutschland legal? Düsseldorf 2010 http://www.xamit-leistungen.de/downloads/XamitStudieWebstatistikenimTest.pdf
Michael Marc Maisch: Datenschutz bei Google Analytics: Kritik an digitalen Fährtenlesern . 2011http://www.lto.de/de/html/nachrichten/2520/datenschutz_bei_google_analytics_kritik_an_digitalen_faehrtenlesern/
Quellen
Artikel-29-Datenschutzgruppe: http://de.wikipedia.org/wiki/Artikel-29-Datenschutzgruppe
AWStats: http://awstats.sourceforge.net/
Bundesbeauftragte für den Datenschutz und die Informationsfreiheit - http://www.bfdi.bund.de
Bundesdatenschutzgesetz: http://www.gesetze.juris.de/bdsg_1990/index.html
Die Datenschutzbeauftragten der Länder: http://www.bfdi.bund.de/DE/AnschriftenUndLinks/Landesdatenschutzbeauftragte/AnschriftenLandesdatenschutzbeauftragte.html?nn=408930
Düsseldorfer Kreis: http://de.wikipedia.org/wiki/D%C3%BCsseldorfer_Kreis
EconBiz – Datenschutz: http://econbiz.de/index.php?id=privacy
Etracker: http://www.etracker.com/de/
Google Analytics: http://www.google.com/intl/de/analytics/
Quellen
http status codes: http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html
IdealObserver: Web-Analytics-Tools der Top-Domains. http://www.idealobserver.com/tools/web-analyse/wer-nutzt-welches-tool/web-analytics-systeme-der-top-domains-april2011
NCSA extended/combined log format: http://httpd.apache.org/docs/current/mod/mod_log_config.html
Telemediengesetz: http://bundesrecht.juris.de/tmg/index.html
Unabhängige Landeszentrum für Datenschutz Schleswig-Holstein (ULD): https://www.datenschutzzentrum.de/
Unabhängige Landeszentrum für Datenschutz Schleswig-Holstein (ULD): FAQ IP-Adressen und andere Nutzungsdaten https://www.datenschutzzentrum.de/ip-adressen/
Webalizer: http://webalizer.com/
Seite 65
Quellen Amthor, Brommund:
Mehr Erfolg durch Webanalytics.
München, 2010
http://www.hanser.de/buch.asp?isbn=978-3-446-42139-4