Datenspuren im Internet13.04.2010
André Martens
André Martens
Belanglose Daten gibt es nicht!
André Martens
Inhalt
�Das Internet in Zahlen
�Für wen sind Daten relevant?
�Datenquellen
�Unfreiwillige Datenweitergabe
�Freiwillige Datenweitergabe
�Schutzmaßnahmen
André Martens
Das Internet in Zahlen (Stand: 2009, Royal Pingdom)
� 90 Billionen Emails/Jahr (81% davon Spam)
� 247 Milliarden Emails/Tag
� 1,4 Milliarden Email-User weltweit
� 243 Millionen Websites (47 Mio mehr als 2008)
� 1,73 Milliarden Internet-User weltweit (18% Wachstum)
� 126 Millionen Blogs (BlogPulse)
� 27,3 Millionen Tweets/Tag
� 350 Millionen User auf Facebook (50% davon loggen sich jeden Tag ein)
� 4 Milliarden Fotos auf Flickr
� 2,5 Milliarden Fotos werden jeden Monat bei Facebook hochgeladen
�30 Milliarden Fotos/Jahr� 1 Milliarde Videos auf YouTube verfügbar
� 148000 neue Computer in Botnetzen/Tag
André Martens
Wer hat Interesse an Daten?
� Personaler
� genereller Eindruck (Freizeitverhalten)
� Religion, Familienstand, Krankheitstage, Schwangerschaft, politische Einstellungen, Streikbeteiligungen
� 28 % der Unternehmen nutzen in 4 von 5 Fällen Social Networks zur Informationsbeschaffung
� Headhunter
� Identifikation von Wissensträgern, Innovatoren und inoffiziellen Führungspersonen
� Unternehmen
� für gezielte Werbung
� Ermittlungsbehörden
� Kommunikation und personelle Netzwerke
� Banken
� Kreditwürdigkeit
� finanzielle Probleme
� Social Scoring
André Martens
Wer hat Interesse an Daten?� Hacker / Eindringlinge
� Social Engineering
� Krankenkassen
� Lebenswandel
� Konsumverhalten
� Drogen- / Medikamentenmissbrauch
� Journalisten
� Fotos
� Hintergrundinformationen
� Der (böse) Nachbar / Kollege
� Eltern
� Bekanntschaften
� Freizeitverhalten
� Lehrer
� Stalker
� Pädophile
� Kontakt (Grooming)
André Martens
Wirklich?
Quelle: heise.de, 4.4.2008
Quelle: e-recht24.de, 13.02.2007
Quelle: n24.de, 29.6.2009
Quelle: telepolis.deQuelle: Winfuture
André Martens
Und dann gibt es noch die Datenschutzpannen
Quelle: e-recht24.de, 8.12.2009
Quelle: e-recht24.de, 12.11.2009
Quelle: rp-online.de, 19.10.2009
Quelle: scienceblogs.de
Quelle: Winfuture
André Martens
Offene Datenquellen
� Blogs
� Twitter / Identi.ca
� Private Websites
� Kommentare in Blogs und Online-Zeitungen
� eBay-Auktionshistorie
� Amazon-Wunschzettel / Hochzeitsliste
� Flickr
� Dooyoo / Ciao
� YouTube / Vimeo
� Newsgroups
� Mailinglisten
� IRC
� last.fm / blip.fm
� Xing / linkedin
� Facebook / StudiVZ / SchülerVZ
� Gowalla / FourSquare
� myspace.com
� Social bookmarking (Mister Wong, Delicious, Digg)
� Yasni / 123people
André Martens
Halböffentliche Datenquellen
� Browser-Historie
�History-Stealing
�Trojaner
� „Private“ Daten bei Facebook
�Zugriff über Apps
� Crawling-DB über Social Networks
� Google-Hacks
� „vertraulich“ filetype:PDF site:www.meinkonkurrent.de
� inurl:“MultiCameraFrame?Mode=Motion“
� live view-axis
André Martens
Unfreiwillige Übermittlung von Daten
André Martens
Datenübermittlung durch den Browser
Browser-Anfrage:GET /.Bugzilla/php/show_map.php HTTP/1.1
Host: cad:1026
User-Agent: "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)"Accept: text/html;q=0.9,text/plain;q=0.8,image/jpeg,image/gif,*/*;q=0.1
Accept-Language: de-DE, de;q=0.80, en;q=0.60, en-US;q=0.40, en-GB;q=0.20
Accept-Encoding: gzip,deflate,compress;q=0.9
Accept-Charset: ISO-8859-1,utf-8;q=0.66,*;q=0.66
Keep-Alive: 300
Connection: keep-alive
Referer: http://cad:1025/
Server-Antwort:HTTP/1.1 200 OK
Server: Apache/1.3.29 (Unix) PHP/4.3.4
Content-Length: 7909
Content-Language: de
Content-Type: text/html
Connection: close
(page content)
André Martens
Logging durch den Webserver/<path to server>/logs/access.log
172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET
http://cad:1026/.Bugzilla/php/show_map.php HTTP/1.1" 200 7909
"http://cad:1025/" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3)
Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)“
172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET
http://cad:1026/.images/micronas_logo_transparent.gif HTTP/1.1" 200 1343
"http://cad:1026/.Bugzilla/php/show_map.php" "Mozilla/5.0 (Windows; U; Windows
NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)"
172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET
http://cad:1026/intranet.css HTTP/1.1" 200 2962
"http://cad:1026/.Bugzilla/php/show_map.php" "Mozilla/5.0 (Windows; U; Windows
NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)"
172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET http://cad:1026/favicon.ico
HTTP/1.1" 200 894 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3)
Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)"
André Martens
Staatliche Datensammlung: VDS
� Vorratsdatenspeicherung vorerst durch das Verfassungsgericht ausgesetzt (Urteil vom 2.3.2010)
� Gesammelte Daten bei Internetnutzung:
� IP-Adresse
�Anfang und Ende der Verbindung
�Email-Header der Korrespondenz (inklusive Subject, Sender, Empfänger)
�Funkzelle (Aufenthaltsort) bei mobiler Kommunikation
� Daten werden 6 Monate lang gespeichert
André Martens
Google Search
� Speicherung der Such-Historie
� Cookie zur Wiedererkennung des Nutzers
André Martens
Google Cache
� Cache für die Suchmaschine
� Indirekte Übermittlung wegen ungewollten Kopierens der eigenen
Inhalte
� Erlaubt auch das Finden längst gelöschter Inhalte
� Erschwert das Löschen von Daten im Netz
André Martens
Google Analytics
� Datensammlung für Website-Statistik:
�Aufenthaltszeit
�Explorationstiefe
�Finden langsamer Seiten
� Wird von 57% der 10000 beliebtesten Websites genutzt.
� Daten: IP-Adresse, aufgerufene Seiten, Aufenthaltszeit, Referrer (bei
Google zentral gespeichert)
� Google wurde in der Vergangenheit schon mehrfach gehackt
André Martens
Google – Ein Datenimperium
� Suchmaschine
� Google Chrome
� Google AdSense
� google-analytics
� YouTube
� Google Wave
� Google Earth
� Google Maps
� Google Streetmap
� Google Docs
� Google Drive
� Google News
� Google Groups
� Google Browser Toolbar
� Google Web Accelerator
� Google Living Stories
� Google Fast Flip
� Google Go
� Google On2
� Google Voice
� Google Search Appliance
� Google Squared
� Google Health
� Google Bandwagon
� Google Wifi (Mountain View)
� Google Energy
� Picasa
� Google Image Labeler
� Google Flu Trends
� Google Mail
André Martens
(Super-) Cookies
� Kleine persistente Text-Dateien, die z.B. eine ID enthalten, um den Nutzer
auch nach Änderung der IP-Adresse wieder zu erkennen.
� Browser-Cookies haben ein Verfallsdatum und können explizit gelöscht
werden.
� Super-Cookies werden durch Flash-Plugins erzeugt und haben kein
Verfallsdatum.
cad TRUE / FALSE 1271203200 userid 0815
André Martens
Web-Bugs
� Unsichtbare Grafiken in der Größe eines Pixels
� Hinterlassen IP-Adresse im Log des cross-referenzierten Servers
� Auch in Spam-Mails zur Überprüfung der Adresse auf Gültigkeit
� Über IP-Geotargeting auch Wohnortermittlung
<img src=http://www.adserver.com/images/pic.gif width="1“ height="1">
André Martens
URL-Verkürzer bit.ly
� Verkürzt URLs auf Adressen im Stil von http://bit.ly/8iQB9s
� Wird oft im Zusammenhang mit Twitter benutzt (140 Zeichen-Limit)
� Klicks auf bit.ly-Links werden von bit.ly protokolliert.
� Aufrufstatistiken können von jedem analysiert werden
André Martens
URL-Verkürzer bit.ly
André Martens
URL-Verkürzer bit.ly
André Martens
Browser-Fingerprinting
� http://panopticlick.eff.org
Daten:
� User Agent
� HTTP_ACCEPT Header
� Browser Plugins
� Time Zone
� Screen Size and Color Depth
� System Fonts
� Cookies enabled?
� Supercookie test
André Martens
Offene WLAN-Netze
�Nutzung offener Netze unterwegs bequem und kostenlos
�Übertragung von Passwörtern (z.B. Mailaccount) im Klartext
�Honey-Pot bzw. Phishing-Gefahr
�Packet Sniffing durch andere Teilnehmer
�ARP-Spoofing
�Man-in-the-Middle-Attacken
André Martens
Freiwillige Übermittlung von Datenund Auswertungsmöglichkeiten
in Social Networks
André Martens
Facebook – Social Network
�350 Millionen User (Ende 2009)
�30 Milliarden neue Fotos pro Jahr
User-Profil
Private Daten
z.B. Fotos
„Freund“
User
Apps
z.B. Spiele
André Martens
Facebook - Friedfinder
� Facebook weiß viel über Nicht-Mitglieder.
� Datenquelle: freiwilliger Upload aller Email-Kontaktdaten
André Martens
Facebook – Spiele: z.B. Farmville
� Aufhebung der Privatsphäre
André Martens
Facebook - Netzwerk
� Gaydar (Studie am MIT, September 2009)
�Versuch der Erkennung von homosexuellen Neigungen durch
Analyse des Freundschaftsnetzwerks
� Politische Einstellung (u. a. durch Einbeziehung des Musikgeschmacks)
� Rasterfahndung
� Datenschutzprobleme
�Facebook legte für 30 Minuten die Mail-Adressen der Mitglieder offen
(31.03.2010)
André Martens
Facebook – Änderung der Datenschutzvereinbarung
� Facebook will Nutzerdaten automatisch weitergeben
�Weitergabe an pre-approved Websites Dritter
�Automatische Übermittlung beim Surfen auf anderen Seiten während
Facebook-Login noch aktiv
�Keine Zustimmung durch Nutzer vorgesehen
�Zitat: Dazu sei das Unternehmen "gezwungen", um seinen Nutzern
"die Möglichkeit zu geben, auch außerhalb von Facebook nützliche
Erfahrungen im sozialen Bereich machen zu können."
(Heise, 27.3.2010)
André Martens
Xing – Netzwerk
�A Practical Attack to De-Anonymize Social Network Users
(Wondracek, Holz, Kirda und Kruegel)
�Nutzung von History-Stealing zum Finden von solchen URLs:
https://www.xing.com/net/[groupID]/forums+
�Erstellung einer Crawling-DB
von Xing
� Identifizierung der User über
Gruppen-Schnittmengen
André Martens
Google Buzz
�Social Network basierend auf den Daten von Google Mail
�Häufige Email-Kontakte wurden automatisch zu „Freunden“
im Network.
�Datenschutzprobleme
�Nutzern wurde erst nachträglich die Bedeutung klar.
�Email-Kontakte wurden für alle sichtbar.
�Arbeitskollegen (auch Chefs) bekamen plötzlich Einblick
in als privat freigegebene Daten.
André Martens
Weitere Risiken von Social Networks
�Erleichterung von Social Engineering
�Malware-Verteilung
�Datendiebstahl über Fake-Accounts
� Identitätsdiebstahl
�Nicknapping
�Social Sentry von Teneros ist ein Service zur Überwachung
von Mitarbeitern in Social Networks. Kosten: 2-8 $/Mitarbeiter
André Martens
StudiVZ - Crawler-Statistik
Quelle: studivz.irgendwo.org
Proof of concept Ende 2006,um auf Sicherheitsmängel bei StudiVZ hinzuweisen
Fast Crawling der gesamten DB mit 10 Rechnern in 4 Stunden
Datenbestand: 1074574 Profile
Nur öffentlich zugängliche Daten
André Martens
StudiVZ - Crawler-Statistik
Quelle: studivz.irgendwo.org
André Martens
StudiVZ - Crawler-Statistik
Quelle: studivz.irgendwo.org
André Martens
� 27,3 Millionen Tweets/Tag (Ende 2009)
� Tweet = Nachricht mit höchstens 140 Zeichen Länge
� „Following“ bestimmt Zusammensetzung der „Timeline“
� Nur Unterscheidung zwischen offenen und geschlossenen Accounts
� Zusammenstellung einer individuellen Timeline durch „follow“-Funktion
� Follower-Status aber nicht entscheidend für Leserechte bei offenen
Accounts
André Martens
Twitter / Gowalla - Aufenthaltsort
André Martens
Twitter - Tagesablauf
André Martens
Twitter - Tagesablauf
André Martens
Twitter - Analysewerkzeuge
Twitter-Listen: Nutzer kategorisieren andere Nutzer
Analyse mit http://twitteranalyzer.com
Aufschlüsselung nach Hashtags, @-replies und Profil-Angaben der Follower
André Martens
Twitter - Analysewerkzeuge
Analyse von Follower-Beziehungen
http://twitter.mailana.com
Analysiert auch Häufigkeit von Kommunikation
http://twitnest.appspot.com
Erlaubt Gruppierung (Clustering) des Netzwerks in einstellbarer Granularität
André Martens
Twitter - Analyse
André Martens
Gegenmaßnahmen
�Datensparsamkeit
�Gezielte Datenstreuung
�Misstrauen
�Mailclient
�Browser-Security-Plugins
�Benutzung von Metager
�Anonymisierung
�Verschlüsselung
André Martens
Datensparsamkeit
� Immer nur so wenig Daten wie möglich angeben.
�Kein Vertrauen in „Privacy“-Einstellungen
André Martens
Gezielte Datenstreuung / Falschinformationen
�Welches Bild möchte ich vermitteln?
�Nicht gefunden zu werden ist in einigen Branchen ein No-Go.
�Einsatz von Phantasiedaten
�Nutzung von trash-mail.com
André Martens
Misstrauen
� Immer hinterfragen:
�Warum ist ein Dienst kostenlos?
�Wodurch finanziert er sich?
�Welche Daten sammelt er?
�Für wen sind sie interessant?
André Martens
Mailclient:
�Abschalten des automatischen Ladens von Grafiken, um
Web Bugs zu unterdrücken.
�Verschlüsselungs-Plugin benutzen
André Martens
Browser
�Firefox benutzen!
�History entweder abstellen oder regelmäßig löschen
�Cookies regelmäßig löschen
�Security-Plugins installieren
André Martens
Browser-Plugin: NoScript
� Black-/White-List von Websites für die Ausführung von Javascript
André Martens
Browser-Plugin: RequestPolicy
� Black-/White-List von erlaubten Cross-Website-Referenzierungen
André Martens
Browser-Plugin: AdBlockPlus
�Blacklisting von Werbesites
André Martens
Browser-Plugin: BetterPrivacy
�Automatisches Löschen von Super Cookies/LSO
André Martens
Suchmaschine: MetaGer
� Meta-Suchmaschine
� Kein individuelles
IP-Logging
� Keine Cookies
für personalisierte
Suche
André Martens
Anonymisierung: Tor
�Onion Routing zur Verschleierung der IP-Adresse
�Privoxy verhindert zusätzlich Cookie- und Fingerprint-Daten
Bild: torproject.org
André Martens
Anonymisierung: JAP
�kommerzieller Anbieter einer Mix-Kaskade
�kostenlose, aber langsame Mix-Kaskaden verfügbar
�Sicherheit gegen Überwachung geringer als bei Tor, da Mix-
Kaskaden fest
�höhere Performance als Tor
André Martens
Anonymisierung: Mixmaster-Remailer
� Anonymisierungsdienst für Mails
� Modifiziert den Nachrichten-Header.
� Entfernt alle Informationen, die auf den Absender schließen lassen.
� Zerhackt Emails in gleichgroße Portionen, um Rückschlüsse auf die
Mailgröße zu verhindern.
� Knoten in Mixmaster-Ketten kommunizieren verschlüsselt.
� Mails werden in Pools zwischengespeichert und zeitlich zufällig
verschickt.
� Risiko aber: Wer betreibt den Remailer?
André Martens
Verschlüsselung: SSH-Tunnel
�Point-to-Point-Verschlüsselung
�Benötigt Server
�Sicheres Nutzen öffentlicher
WLAN-Hotspots
André Martens
Verschlüsselung: GPG
�Email-Verschlüsselung
�Plugins erhältlich
�Für Browser: FireGPG
�Private/Public Key Verfahren
�Keyserver
�Web of Trust
�Open Source
�keine Verwendung vonpatentierten Verfahren
André Martens
Verschlüsselung: TrueCrypt
� Verschlüsselt Container und ganze Platten
� Plausible Deniability
� Zu empfehlen bei Nutzung von Online-Backup
André Martens
Vielen Dank für die Aufmerksamkeit!
Fragen?