Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)Abb. 1: Ci-‐gît Peter Punk | Quelle: Alphamax (1987): Peter Punk, Paris, www.ubka.uni-‐karlsruhe.de (verändert)
Web-‐Suche und Suche in EchtzeitWeb-‐Suche und Suche in Echtzeit
2/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Umfrage: Nutzung des Webs
Abb. 2: Milky Stream | Quelle: Kröyer, Flickr
Textbasiert:
●Weblog (CMS, Wiki)●Microblog (TwiWer, FriendFeed, etc.)
Medienbasiert:
●Youtube, Flickr, LastFM, SlideShare, etc.
Soziale Netzwerke:
●Facebook, MySpace, Digg, Deliciuos, etc.
Mobile Geräte:
●Smartphones (iPhone, BlackBerry, Google/ Android, etc.)
●Augmented Reality
3/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Gliederung
4/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
DefiniOon WWW
WWW
System zum Abrufen von Hypertext und Hypermedia über das Internet
Abb. 3: Einfaches Hypertext-‐System | Quelle: Nelson, T. (1974): Computer Lib/Dream Machines, 2001
5/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
EvoluOon des WWW: Internet, Hypertext, Nelson, Berners-‐Lee, Cerf
Abb. 4: EvoluVon des WWWs | Quelle: Flickr, Wikipedia (verändert)
6/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Gliederung
7/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suchmaschinen
Kategorien ➧Web-‐Kataloge
• Web-‐Suchmaschinen
• Weitere Web-‐Suchdienste
• Wolfram|Alpha
8/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suchmaschinen: Web-‐Kataloge
Abb. 5: DMOZ – Open Directory Project | Quelle: DMOZ.org
9/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suchmaschinen
Kategorien• Web-‐Kataloge (DMOZ, Yahoo!, AllesKlar.de, Web.de)
– Verzeichnisbasierte Suchhilfen
➧Web-‐Suchmaschinen (Google, Yahoo!, Bing)– Indexbasierte Computerprogramme
– Indizierung des Webs erfolgt in regelmässigen Abständen
– Boolsche Ausdrücke (AND, OR, ...) bei Suchanfragen möglich
• Weitere Web-‐Suchdienste
• Wolfram|Alpha
10/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suchmaschinen
Kategorien• Web-‐Kataloge (DMOZ, Yahoo!, AllesKlar.de, Web.de)
– Verzeichnisbasierte Suchhilfen
• Web-‐Suchmaschinen (Google, Yahoo!, Bing)– Indexbasierte Computerprogramme
– Indizierung des Webs erfolgt in regelmässigen Abständen
– Boolsche Ausdrücke (AND, OR, ...) bei Suchanfragen möglich
➧Weitere Web-‐Suchdienste– Meta-‐Suchmaschinen (MetaGer)
– Bezahlte Link-‐Listen (Beschaffung.de)
– P2P-‐Suchmaschinen (YaCy)
• Wolfram|Alpha
11/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suchmaschinen: Wolfram|Alpha
Abb. 6: Wolfram|Alpha Logo | Quelle: Wolfram|Alpha
Wolfram|Alpha ist eine „Entscheidungsmaschine“, die es ermöglicht mit Wissen zu rechnen.
12/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Oder...
Web-‐Suchmaschinen: Wolfram|Alpha
13/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)Abb. 7: Das Elektronengehirn | Walt Disney Co. (1970): Hexenzauber mit Micky und Goofy, LTB Nr. 11, StuW gart, www.ubka.uni-‐karlsruhe.de
Web-‐Suchmaschinen: Wolfram|Alpha
14/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Abb. 8: Wolfram|Alpha | Quelle: Wolfram|Alpha
Web-‐Suchmaschinen: Wolfram|Alpha
15/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Abb. 9: Wolfram|Alpha | Quelle: Wolfram|Alpha (verändert)
Web-‐Suchmaschinen: Wolfram|Alpha
16/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Gliederung
17/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Bewertungskriterien für Webseiten
➧ Beliebtheit von Hyperlinks (Link-‐Popularity)
• Google PageRank
Bewertungskriterien für Webseiten
18/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Bewertungskriterien für Webseiten: Google PageRank
Google PageRank
PR pi =1−dN
d ∑pj∈M pi
PR pj L pj
Dabei gilt:
• sind die betrachteten Seiten
• M(pi) die Seiten, die auf pi verweisen
• L(pj) die Anzahl ausgehendender Hyperlinks auf Seite pj
• N die Anzahl betrachteter Seiten
• d ein Dämpfungsfaktor (i.d.R. 0,85)
• PR (pi) PageRank einer der betrachteten Seiten
• PR (pj) PageRank einer Seite, die auf pi verweist
∑i=1
n
pi
19/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Gliederung
20/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search)
➧ Erzeuger des Datenstroms
• Erweitertes Modell der Web-‐Suche
• KonfekVonieren des Datenstroms
• SemanVk
• Bewerten der Suchergebnisse
• Google (Caffeine)
Web-‐Suche in Echtzeit (Real Time Search)
21/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Erzeuger des Datenstroms
Abb. 10: Erzeuger des Datenstroms
2008 ca. 500 Exabytes an erzeugten Daten/ Jahr Spiegel (2009)
22/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Erzeuger des Datenstroms | Beispiele
Abb. 12: TwiWer Benutzerkonto der London Tower Bridge | Quelle: TwiW er
23/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search)
• Erzeuger des Datenstroms
➧ Erweitertes Modell der Web-‐Suche
• KonfekVonieren des Datenstroms
• SemanVk
• Bewerten der Suchergebnisse
• Google (Caffeine)
Web-‐Suche in Echtzeit (Real Time Search)
24/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Erweitertes Modell der Web-‐Suche
Abb. 13: Erweiterte Web-‐Suche
25/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search)
• Erzeuger des Datenstroms
• Erweitertes Modell der Web-‐Suche
➧ KonfekOonieren des Datenstroms
• SemanVk
• Bewerten der Suchergebnisse
• Google (Caffeine)
Web-‐Suche in Echtzeit (Real Time Search)
26/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): KonfekVonieren des Datenstroms
• Offene ProgrammierschniWstellen (APIs)
• Offene Protokolle (OAuth)
➧ Standardisierte AuthenOsierung(OpenID, Google, Yahoo, Facebook, TwiWer)
KonfekOonieren wird möglich durch:
27/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): KonfekVonieren des Datenstroms
Abb. 14: Dialoge zur Erstellung eines Benutzerkontos ohne und mit standardisierter AuthenV sierung (v.r.n.l.) | Quelle: SlideShare, FriendFeed (verändert)
28/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search)
• Erzeuger des Datenstroms
• Erweitertes Modell der Web-‐Suche
• KonfekVonieren des Datenstroms
➧ SemanOk
• Bewerten der Suchergebnisse
• Google (Caffeine)
Web-‐Suche in Echtzeit (Real Time Search)
29/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): SemanVk | Ansätze
Abb. 15: Verschiedene Ansätze zur SemanV k | Nach Spivack
30/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web 3.0: SemanVk
• Beziehungen von ArVkeln, Inhalten, Autoren, ect. werden erfasst, interpreVert und bewertet
• Struktur des Webs ändert sich grundlegend
=> Verknüpfung von Ideen
Abb. 16: SemanVsche Verknüpfungen | Quelle: TED
31/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search)
• Erzeuger des Datenstroms
• Erweitertes Modell der Web-‐Suche
• KonfekVonieren des Datenstroms
• SemanVk
➧ Bewerten der Suchergebnisse
• Google (Caffeine)
Web-‐Suche in Echtzeit (Real Time Search)
32/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Bewerten der Suchergebnisse
➧ Aggregieren der InformaOonen
• Errechnen von Prognosen
• Bewerten der InformaVonsquelle
Bewerten der Suchergebnisse
33/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Bewerten der Suchergebnisse
• Aggregieren der InformaVonen
➧ Errechnen von Prognosen– Suchanfragen sind häufig saisonalen Trends unterworfen
(z.B. Gesundheit, Essen und Trinken, Reisen)
– Ca. 50% der beliebtesten Suchanfragen 12 Monate voraussehbar (12% Fehlerquote)
• Bewerten der InformaVonsquelle
Bewerten der Suchergebnisse
34/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Bewerten der Suchergebnisse | Bewerten der InformaVonsquelle
Bewerten der InformaOonsquelle
Abb. 17: Soziale Relevanz nach Gruppen geordnet | Nach Iskold
35/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Bewerten der Suchergebnisse | Bewerten der InformaVonsquelle
PR pi =1−dN
d ∑pj∈M pi
PR pj L pj
Abb. 18: Yodas PageRank | Quelle: Pirillo, C.; Fitz, B.; volacci.com
36/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Bewerten der Suchergebnisse | Bewerten der InformaVonsquelle
Bewerten der InformaOonsquelle
Abb. 19: Soziale Relevanz nach Gruppen geordnet | Nach Iskold
37/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Bewerten der Suchergebnisse | Bewerten der InformaVonsquelle
Abb. 20: YouTube Bewertungssystem | Quelle: YouTube (verändert)
38/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search)
• Erzeuger des Datenstroms
• Erweitertes Modell der Web-‐Suche
• KonfekVonieren des Datenstroms
• SemanVk
• Bewerten der Suchergebnisse
➧ Google (Caffeine)
Web-‐Suche in Echtzeit (Real Time Search)
39/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Google (Caffeine)
Abb. 21: Google Ergebnisliste | Quelle: Google
40/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Web-‐Suche in Echtzeit (Real Time Search): Google (Caffeine)
Abb. 22: Koffein | Quelle: mararie, Flickr
• Zeitnahe Ergebnisse
• Bevorzugte Platzierung aktualisierter Webseiten
• Fokus auf Nachrichten und Soziale Medien (TwiWer, Facebook, MySpace)
• Kein Fokus auf Schlagworte in URLs
Google (Caffeine)
41/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Gliederung
42/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche
➧Mobile Web-‐Suche
• SemanVsche Web-‐Suche
• Ausblick
Zukün@ige Websuche
43/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: Mobile Web-‐Suche
Mobile Web-‐Suche ≠ Endgerät + Web-‐Suche
• Einbeziehen der Gerätesensoren
• OrtungsfunkVonen
• SuchfunkVon über Spracheingabe
• Erweiterte Realität (Augmented Reality)
Abb. 24, 25, 26: Layar Reality Browser | Quelle: Techcrunch
44/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche
• Mobile Web-‐Suche
➧ SemanOsche Web-‐Suche
• Ausblick
Zukün@ige Websuche
45/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: SemanVsche Web-‐Suche
Abb. 27: SemanVsche Web-‐Suche | Quelle: Spivack, N.
46/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: SemanVsche Web-‐Suche
Abb. 28: SemanVsche Web-‐Suche | Quelle: Spivack, N.
47/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: SemanVsche Web-‐Suche
Abb. 29: SemanVsche Web-‐Suche | Quelle: Spivack, N.
48/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: SemanVsche Web-‐Suche
Abb. 30: SemanVsche Web-‐Suche | Quelle: Spivack, N.
49/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: SemanVsche Web-‐Suche
Abb. 31: SemanVsche Web-‐Suche | Quelle: Spivack, N.
50/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: SemanVsche Web-‐Suche
Abb. 32: SemanVsche Web-‐Suche | Quelle: Spivack, N.
51/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche
• Mobile Web-‐Suche
• SemanVsche Web-‐Suche
➧ Ausblick
Zukün@ige Websuche
52/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: Ausblick
Abb. 33: Erweiterte Web-‐Suche
53/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: Ausblick
Abb. 34: Virtueller Assistent | Quelle: Lawrence, D.; Ludewijk , M. (1990): De robots van de danderzei, Amsterdam; Adams, D. (1990): Hyperland (verändert)
54/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Abb. 35: Die Intelligenz liegt in den Verknüpfungen | Quelle: Spivack, N.
Zukün@ige Web-‐Suche: Ausblick
55/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Abb. 36: ZukunE der Web-‐Suche | Quelle: Spivack, N.
Zukün@ige Web-‐Suche: Ausblick
56/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zukün@ige Web-‐Suche: Ausblick
Abb. 37: Die Erde aus dem Weltraum | Quelle: Wikipedia
•2007: Komplexität eines menschlichen Gehirns
•2037: Komplexität von 6 Milliarden menschlichen Gehirnen
•Das Web ist das Betriebssystem dieser Maschine
•Komplexes „Immunsystem“
•Einbinden alltäglicher Gegenstände
Eineeinzige
Maschine
Eineeinzige
Maschine
„What we really want to do at google is create an AI“
Larry Page Abb. 38: Trend Microchips | Quelle: Kelly, 1998
57/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Zusammenfassung
Abb. 39: Le signe de Shiva | Quelle: Hé, D. (1985): Le signe de Shiva, Paris, www.ubka.uni-‐karlsruhe.de
58/58Hochschule Augsburg | E-‐Commerce, Sommersemester 2010: Dominik Neuffer, Dipl. WirtschaEsinf. (FH)
Gliederung