Real Time Suche

Post on 25-Jan-2015

208 views 0 download

description

 

transcript

Real Time Suche

Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de

1 | Dirk Lewandowski

Der Real Time Hype

Zugriff auf Real-Time-Informationen

Recherche

Fazit

Agenda

2 | Dirk Lewandowski

Der Real Time Hype

Zugriff auf Real-Time-Informationen

Recherche

Fazit

Agenda

3 | Dirk Lewandowski

Der Real-Time-Hype

•  Proteste im Iran 2009

•  19 Mrd. Suchanfragen/Monat in Twitter? •  Google: 88 Mrd. •  Yahoo: 9,4 Mrd. •  Bing: 4,1 Mrd.

•  Herausforderungen für Suchmaschinen •  Zugriff auf die Inhalte der Real-Time-Dienste •  Nutzer auf den eigenen Suchseiten halten

•  Aktueller Anlass •  Alle großen SM (GYM) haben in den letzten Monaten Real-Time-Lösungen

vorgestellt.

4 | Dirk Lewandowski

„Revolutionen der Geschwindigkeit“

•  Jeweils eigene Indices, die im Ranking in der Universal Search zusammengefasst werden.

•  Jeder Index hat seine eigenen Aktualitätsprobleme.

Web News Blogs Real Time

5 | Dirk Lewandowski

6 | Dirk Lewandowski

Beispiele für Real-Time-Informationen in Suchmaschinen

7 | Dirk Lewandowski

Definition Real-Time-Informationen

Real Time Informationen sind Informationen, die über laufende Kannäle verbreitet werden, im Moment ihrer Aktualisierung für Nutzer relevant werden und deren Informationswert zeitkritisch ist.

1. Informationen sind schon kurz nach ihrer Erstellung über laufend aktualisierte Ticker verfügbar.

2. Für Nutzer ist es bedeutend, diese Informationen sofort zur Kenntnis zu nehmen.

3. Die Informationen veralten (in der Regel) sehr schnell.

8 | Dirk Lewandowski

Der Real Time Hype

Zugriff auf Real-Time-Informationen

Recherche

Fazit

Agenda

9 | Dirk Lewandowski

Zugriff auf Real-Time-Informationen

•  Direkter Abruf eines Feeds •  Vollständiger Feed eines Angebots wird angezeigt •  Suche beschränkt sich auf das Auffinden des geeigneten Feeds

•  Abruf eines gefiltertenFeeds •  Gebündelt aufgrund von Nutzerpräferenzen (explizit oder implizit)

•  Suche in Real-Time-Informationen mit Hilfe einer Suchmaschine •  Ad-Hoc-Recherche •  Ranking

•  nach allgemeinen, für alle Nutzer gültigen Kriterien •  aufgrund des Nutzerprofils (bspw. Abgeleitet aus dem Kontaktnetzwerk)

10 | Dirk Lewandowski

Inhalte der Real-Time-Suche

•  Statusmeldungen

•  Explizite Statusmeldungen: Nutzer gibt etwas bekannt / schreibt eigenen Text

•  Implizite Statusmeldungen: Meldung wird vom System aufgrund Aktivität generiert

11 | Dirk Lewandowski

Formen der Kommunikation in Real-Time-Diensten

•  One-to-one •  Sender möchte einen Empfänger erreichen. •  Private Nachricht in Sozialen Netzwerken

•  One-to-many •  Sender möchte viele Nutzer erreichen. •  Beschränkung des Adressatenkreises höchstens durch das System (alle Mitglieder

des gleichen Netzwerks können die Nachricht lesen)

•  One-to-some •  Sender möchte eine bestimmte Zielgruppe erreichen. •  Beschränkt auf die Kontakte innerhalb eines Sozialen Netzwerks, i.d.R. Kontakte

ersten Grads

12 | Dirk Lewandowski

Rankingfaktoren für Real-Time-Inhalte

•  Textstatistik •  Abgleich Suchanfrage – Dokument •  Gewichtung nach „Volltext“, Hashtag •  Aufgrund der Kürze von Statusmeldungen weitergehende Analyse kaum möglich.

•  Popularität •  Popularität des Autors messen: Anzahl Kontakte/Follower •  Links auf die in der Vergangenheit von diesem Autor verfassten Nachrichten •  Für „Archivrecherchen“ auch Verlinkung

•  Aktualität

•  Lokalität

13 | Dirk Lewandowski

Der Real Time Hype

Zugriff auf Real-Time-Informationen

Recherche

Fazit

Agenda

14 | Dirk Lewandowski

Recherche nach Real-Time-Informationen

Arten von Real-Time-Suchmaschinen (Sullivan 2009)

1. Suchmaschinen für einen einzelnen Datenbestand •  Mehrwert liegt in der Verbesserung der Suchergebnisse

2. Suchmaschinen, die einen Datenbestand auf Basis der in RT-Diensten geposteten Links aufbauen •  Alternativer Datenbestand zu den konventionellen Web-Suchmaschinen

3. Websites, die selbst einen Großteil der Inhalte des RT-Web erstellen •  Bsp. Facebook, Twitter •  Bieten eigene Suche an

Ergänzung 4. Allgemeine Web-Suchmaschinen, die Meldungen aus dem RT-Web in ihre

Ergebnisse integrieren.

15 | Dirk Lewandowski

Recherche direkt in den einzelnen Angeboten

1. Sinnvoll, wenn Inhalte nicht (oder nicht vollständig) an die Aggregatoren weitergegeben werden.

2. Sinnvoll, wenn es um Vollständigkeit und „absolute Aktualität“ geht.

16 |

17 | Dirk Lewandowski

Recherche in Suchmaschinen, die ihren Bestand auf Basis von Links in Statusmeldungen aufbauen

•  Sinnvoll, wenn man eine alternative Sicht (auf das „aktuelle Web“) bekommen möchte.

•  Beispiel www.oneriot.com

18 |

19 | Dirk Lewandowski

Recherche in allgemeinen Web-Suchmaschinen

1. Sinnvoll, wenn primär Web-Inhalte gefunden werden sollen, eine Ergänzung um Meldungen aus dem Real Time Web aber erwünscht ist.

2. Sinnvoll, wenn (auch) alte Meldungen gefunden werden sollen (echte Archivsuche).

20 |

21 |

22 | Dirk Lewandowski

Der Real Time Hype

Zugriff auf Real-Time-Informationen

Recherche

Fazit

Agenda

23 | Dirk Lewandowski

Fazit

•  Real-Time-Informationen sind eine gute Ergänzung •  vor allem bei gerade (sehr) aktuellen Themen •  zum Nachverfolgen von Diskussionen •  zur Trendbeobachtung

•  Real-Time-Suchmaschinen stehen noch ganz am Anfang •  RT-Suche wird sich in den kommenden Monaten wesentlich verändern.

•  Real-Time-Suchmaschinen decken nur einen Teil des RT-Web ab •  Lösung liegt eher in der Integration der Inhalte in der Universal Search als im

Aufbau möglichst vollständiger RT-Suchmaschinen.

Vielen Dank für Ihre Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html

Aktuelles Buch: Handbuch Internet-Suchmaschinen

E-Mail: dirk.lewandowski@haw-hamburg.de