+ All Categories
Home > Documents > Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

Date post: 23-Dec-2016
Category:
Upload: verena
View: 214 times
Download: 0 times
Share this document with a friend
12
WI – AUFSATZ Das Rezept für die perfekte Rezension? Einflussfaktoren auf die Nützlichkeit von Online-Kundenrezensionen Die Strukturierung und Analyse der Einflussfaktoren auf die Nützlichkeit von Online-Kundenrezensionen anhand einer adaptierten Version des Klassifikationsmodells von Wang und Strong (1996) zeigt, dass nützliche Rezensionen zu 9 % aus Adjektiven bestehen, sich durch einen hohen Informationsgehalt auszeichnen, und eine von früheren Rezensionen abweichende Meinung vertreten. Der Produkttyp (Erfahrungs- oder Suchgut) moderiert den Einfluss dieser Faktoren. Auf dieser Basis können Online-Rezensionssysteme Mechanismen zur automatischen Nützlichkeitsbewertung von Rezensionen und Softwareunterstützung für Rezensenten entwickeln. DOI 10.1007/s11576-013-0358-2 Die Autoren Prof. Dr. Michael Scholz Juniorprofessur für E-Commerce Universität Passau Innstr. 43 94032 Passau Deutschland [email protected] Dr. Verena Dorner ( ) Lehrstuhl für Wirtschaftsinformatik II Universität Passau Innstr. 43 94032 Passau Deutschland [email protected] Eingegangen: 2012-07-01 Angenommen: 2013-02-07 Angenommen nach zwei Überarbei- tungen durch Prof. Dr. Spann. Online publiziert: 2013-04-25 This article is also available in English via http://www.springerlink.com and http://www.bise-journal.org: Scholz M, Dorner V (2013) The Recipe for the Perfect Review? An Investiga- tion into the Determinants of Re- view Helpfulness. Bus Inf Syst Eng. doi: 10.1007/s12599-013-0259-3. Zusätzliche Information ist in der Online-Version dieses Beitrags (doi: 10.1007/s11576-013-0358-2) enthalten. © Springer Fachmedien Wiesbaden 2013 1 Einführung Die zunehmende Neigung von Kunden, Produkte – sowohl Erfahrungs- als auch Suchgüter – online zu kaufen, hat den Internethandel zu einem sehr attrakti- ven und gleichzeitig sehr wettbewerb- sintensiven Verkaufskanal werden las- sen. Internethändler versuchen, Kunden zu gewinnen und zu binden, indem sie das Online-Einkaufserlebnis durch inno- vative Webseitenfunktionen verbessern. Eine besonders beliebte Funktionalität sind Online-Rezensionssysteme (ORS), mithilfe derer Kunden ihre Meinungen über die gekauften Produkte austau- schen können. Kundenrezensionen ver- ringern die Kosten der Informationssu- che und Produktevaluation für ande- re Kunden und somit auch den Anreiz, die Website des Händlers zu verlassen, um sich anderweitig Produktinformatio- nen zu suchen. ORS sind mittlerweile auf den Webseiten aller großen Internet- händler (z. B. Amazon.com, Staples.com) verfügbar. Sie haben derart an Bedeu- tung gewonnen, dass Unternehmen wie Epinions.com erfolgreiche Geschäftsmo- delle um die Erstellung, Sammlung und den Verkauf von Kundenrezensionen aufgebaut haben. Doch ORS sind durch ihren Erfolg selbst zu Quellen eines Informations- überangebots geworden. Der E-Book- Reader Amazon Kindle Fire beispiels- weise wurde seit seiner Einführung am 15. November 2011 über 18.000 Mal auf Amazon.com rezensiert. Selbst für alltägliche Produkte wie Mehrzweck- Druckerpapier existieren über 5.000 Re- zensionen (Staples.com). Die grundle- genden Such- und Filtermechanismen von ORS, z. B. nach Erstellungsdatum, stellten sich schnell als unzureichend her- aus, um die Kunden bei der Bewälti- gung dieser Informationsflut zu unter- stützen (Weathers et al. 2007). Die Erwei- terung der Suchparameter um die (sub- jektive) Nützlichkeit, die sog. „Helpful- ness“, erwies sich als besonders popu- lär und ist heute auf allen großen Han- delswebseiten verfügbar. Kunden können für jede Rezension angeben, ob sie ih- nen im Kaufprozess geholfen hat, zu ei- ner Entscheidung über Kauf oder Nicht- kauf eines Produktes zu finden. Aus diesen Bewertungen errechnet das ORS für jede Rezension einen aggregierten Wert, den sog. „Helpfulness Score“ oder Nützlichkeitswert. Die Kunden können sich alle Rezensionen zu einem Pro- dukt sortiert nach ihrer Nützlichkeit im Kaufprozess anzeigen lassen. Rezensio- nen mit hohen Nützlichkeitswerten be- einflussen Produktkäufe besonders stark (Chen et al. 2008). WIRTSCHAFTSINFORMATIK 3|2013 135
Transcript
Page 1: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Das Rezept für die perfekte Rezension?

Einflussfaktoren auf die Nützlichkeit vonOnline-Kundenrezensionen

Die Strukturierung und Analyse der Einflussfaktoren auf die Nützlichkeit vonOnline-Kundenrezensionen anhand einer adaptierten Version des Klassifikationsmodellsvon Wang und Strong (1996) zeigt, dass nützliche Rezensionen zu 9 % aus Adjektivenbestehen, sich durch einen hohen Informationsgehalt auszeichnen, und eine von früherenRezensionen abweichende Meinung vertreten. Der Produkttyp (Erfahrungs- oder Suchgut)moderiert den Einfluss dieser Faktoren. Auf dieser Basis können Online-RezensionssystemeMechanismen zur automatischen Nützlichkeitsbewertung von Rezensionen undSoftwareunterstützung für Rezensenten entwickeln.

DOI 10.1007/s11576-013-0358-2

Die Autoren

Prof. Dr. Michael ScholzJuniorprofessur für E-CommerceUniversität PassauInnstr. 4394032 [email protected]

Dr. Verena Dorner (�)Lehrstuhl für Wirtschaftsinformatik IIUniversität PassauInnstr. 4394032 [email protected]

Eingegangen: 2012-07-01Angenommen: 2013-02-07Angenommen nach zwei Überarbei-tungen durch Prof. Dr. Spann.Online publiziert: 2013-04-25

This article is also available in Englishvia http://www.springerlink.com andhttp://www.bise-journal.org: ScholzM, Dorner V (2013) The Recipe forthe Perfect Review? An Investiga-tion into the Determinants of Re-view Helpfulness. Bus Inf Syst Eng.doi: 10.1007/s12599-013-0259-3.

Zusätzliche Information ist in derOnline-Version dieses Beitrags(doi: 10.1007/s11576-013-0358-2)enthalten.

© Springer Fachmedien Wiesbaden2013

1 Einführung

Die zunehmende Neigung von Kunden,Produkte – sowohl Erfahrungs- als auchSuchgüter – online zu kaufen, hat denInternethandel zu einem sehr attrakti-ven und gleichzeitig sehr wettbewerb-sintensiven Verkaufskanal werden las-sen. Internethändler versuchen, Kundenzu gewinnen und zu binden, indem siedas Online-Einkaufserlebnis durch inno-vative Webseitenfunktionen verbessern.Eine besonders beliebte Funktionalitätsind Online-Rezensionssysteme (ORS),mithilfe derer Kunden ihre Meinungenüber die gekauften Produkte austau-schen können. Kundenrezensionen ver-ringern die Kosten der Informationssu-che und Produktevaluation für ande-re Kunden und somit auch den Anreiz,die Website des Händlers zu verlassen,um sich anderweitig Produktinformatio-nen zu suchen. ORS sind mittlerweileauf den Webseiten aller großen Internet-händler (z. B. Amazon.com, Staples.com)verfügbar. Sie haben derart an Bedeu-tung gewonnen, dass Unternehmen wie

Epinions.com erfolgreiche Geschäftsmo-delle um die Erstellung, Sammlung undden Verkauf von Kundenrezensionenaufgebaut haben.

Doch ORS sind durch ihren Erfolgselbst zu Quellen eines Informations-überangebots geworden. Der E-Book-Reader Amazon Kindle Fire beispiels-weise wurde seit seiner Einführung am15. November 2011 über 18.000 Malauf Amazon.com rezensiert. Selbst füralltägliche Produkte wie Mehrzweck-Druckerpapier existieren über 5.000 Re-zensionen (Staples.com). Die grundle-genden Such- und Filtermechanismenvon ORS, z. B. nach Erstellungsdatum,stellten sich schnell als unzureichend her-aus, um die Kunden bei der Bewälti-gung dieser Informationsflut zu unter-stützen (Weathers et al. 2007). Die Erwei-terung der Suchparameter um die (sub-jektive) Nützlichkeit, die sog. „Helpful-ness“, erwies sich als besonders popu-lär und ist heute auf allen großen Han-delswebseiten verfügbar. Kunden könnenfür jede Rezension angeben, ob sie ih-nen im Kaufprozess geholfen hat, zu ei-ner Entscheidung über Kauf oder Nicht-kauf eines Produktes zu finden. Ausdiesen Bewertungen errechnet das ORSfür jede Rezension einen aggregiertenWert, den sog. „Helpfulness Score“ oderNützlichkeitswert. Die Kunden könnensich alle Rezensionen zu einem Pro-dukt sortiert nach ihrer Nützlichkeit imKaufprozess anzeigen lassen. Rezensio-nen mit hohen Nützlichkeitswerten be-einflussen Produktkäufe besonders stark(Chen et al. 2008).

WIRTSCHAFTSINFORMATIK 3|2013 135

Page 2: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Nützlichkeitsbasierten Sortierungsme-chanismen weisen allerdings zwei kri-tische Schwachstellen auf. Erstens wer-den Rezensionen ohne Kundenbewer-tungen bei der Sortierung implizit wieschlecht bewertete Rezensionen behan-delt und am Ende der Liste angezeigt. Da-durch sinkt die Wahrscheinlichkeit, dasssie überhaupt gelesen und bewertet wer-den, unabhängig von ihrer eigentlichenQualität. Je mehr ungenutzte oder zu-mindest nicht klassifizierte Informatio-nen in einem ORS existieren, desto gerin-ger ist der Nutzen, den Kunden aus demORS ziehen: Such- und Evaluationskos-ten für (nützliche) Rezensionen steigen.Zweitens ist bisher unklar, welche Fakto-ren dazu führen, dass manche Rezensio-nen als nützlich und andere als unnützwahrgenommen werden. Daher gibt es ingängigen ORS bisher keine Möglichkeit,die Nützlichkeit einer neuen Rezensionim Vergleich zu den bereits existierendenRezensionen (automatisch) zu schätzen.Außerdem erschwert diese KenntnislückeRezensenten, ihre Fähigkeiten zu verbes-sern: sie können kaum aus früheren Re-zensionen lernen. Amazon.com gibt bei-spielsweise lediglich grobe Empfehlun-gen, z. B. „detailliert“ zu schreiben undeine Länge zwischen 75 und 300 Wortenanzustreben. Es ist nicht bekannt, inwie-fern diese Angaben auf empirischer Evi-denz beruhen. Tatsächlich existieren eini-ge Studien, die andere Ergebnisse berich-ten. Otterbacher (2008) und Mudam-bi und Schuff (2010) berichten von ei-nem positiven linearen Zusammenhangzwischen Länge und Nützlichkeit vonRezension: daraus ergäbe sich eher dieEmpfehlung „je länger desto besser“.

Für die vorliegende Studie wurdenin einem umfassenden LiteraturreviewFaktoren identifiziert, welche die Nütz-lichkeit von Rezensionen in Amazon-ähnlichen ORS1 beeinflussen könnten –frühere Studien berichten dazu allerdingswidersprüchliche Ergebnisse. Die vorlie-gende Arbeit leistet daher in zweierleiHinsicht einen Beitrag zur aktuellen For-schung zu ORS. Zum einen werden bis-herige Forschungsergebnisse strukturiertaufbereitet und analysiert. Dies erfolgtmithilfe des adaptierten Modells zur kon-textbezogenen Beurteilung von Daten-qualität von Wang und Strong (1996).

Zum anderen wird auf Basis dieses Mo-dells ein Set an Einflussfaktoren aufdie Nützlichkeit von Kundenrezensionenentwickelt und empirisch getestet.

Die Kenntnis um diese Einflussfakto-ren ermöglicht die planvolle Verbesse-rung von ORS. Eine automatische Be-rechnung von Nützlichkeitswerten fürneue Rezensionen würde die Suchkos-ten der Kunden reduzieren. Eine indi-viduelle Unterstützung der Rezensentenbei der Verbesserung ihrer Rezensions-fähigkeiten würde die durchschnittlicheQualität der verfügbaren Rezensionen er-höhen. Kunden hätten somit einen ge-ringeren Anreiz, auf anderen Websei-ten nach Informationen zu suchen undkönnten passende Produkte leichter fin-den, wodurch wiederum Kundenzufrie-denheit und Umsatz positiv beeinflusstwerden (Chen et al. 2008).

Im Folgenden werden Faktoren be-schrieben, deren Einfluss auf die Nütz-lichkeit von Rezensionen in früherenStudien untersucht wurde. Das Modellzur Datenqualität von Wang und Strong(1996) dient, in adaptierter Form, hier-bei als Klassifikations- und Analyserah-men. Abschnitt 3 beschreibt das gewählteForschungsmodell zur Untersuchung derEinflussfaktoren der Nützlichkeit von Re-zensionen. Abschnitt 4 stellt die Ergeb-nisse der empirischen Untersuchung von27.104 Rezensionen auf Amazon.comdar. Implikationen für Forschung undPraxis sowie die Limitationen folgen inAbschn. 5.

2 Literaturreview undtheoretische Fundierung

2.1 Klassifikationsmodell fürEinflussfaktoren auf die Nützlichkeit vonRezensionen

Bisherige Studien aus dem Bereich dertraditionellen (offline) Mundpropagan-da (word-of-mouth) haben eine Viel-zahl von Erklärungen dafür hervor-gebracht, weshalb manche Informatio-nen von Kunden als hilfreicher wahr-genommen werden als andere. Vieledieser Forschungsergebnisse wurden aufden Online-Kontext (electronic word-of-mouth, eWOM) übertragen (Dellarocas

2003). Beispielsweise zeigen Ghose undIpeirotis (2011), dass unter anderem derSchreibstil, die Anzahl an diskutiertenProduktmerkmalen und die Offenlegungder Identität des Autors einer Rezensi-on die Nützlichkeitswahrnehmung be-einflussen. Zu einigen dieser Faktorengibt es jedoch widersprüchliche Ergeb-nisse. Ein strukturierter Ansatz zur Auf-deckung und Erklärung dieser Wider-sprüche fehlt bislang. In der vorliegendenArbeit wird dazu das Modell zur kontext-bezogenen Beurteilung von Datenquali-tät von Wang und Strong (1996) heran-gezogen. Qualitativ hochwertige Rezen-sionen helfen Online-Kunden, das „rich-tige“ Produkt zu kaufen. Dieses Ver-ständnis stimmt mit der von Wang undStrong (1996) vorgeschlagenen Defini-tion für qualitativ hochwertige Datenüberein: „data that are fit for use by dataconsumers“, wobei „fit“ durch die Anfor-derungen eines „Datenkonsumenten“ andie Daten (zur Lösung einer spezifischenAufgabe) determiniert ist.

Alle bislang untersuchten Faktoren zurBestimmung der Nützlichkeit fallen indrei der vier Modelldimensionen: „int-rinsische Qualität“, „kontextuelle Quali-tät“ und „repräsentative Qualität“ (Wangund Strong 1996).2

Anhänge A und B präsentieren die bis-herigen Forschungsergebnisse in struktu-rierter Form auf Basis des Klassifikations-modells (Abb. 1).

2.2 Bisherige Studien zu denEinflussfaktoren auf die Nützlichkeit vonKundenrezensionen

Während Objektivität in Werbebotschaf-ten durchaus wünschenswert ist, daKunden subjektiven Werbeinformatio-nen tendenziell weniger Vertrauen schen-ken als objektiven (Ford et al. 1990), istsie in Online-Kundenrezensionen nichtunbedingt vorteilhaft. Denn Leser vonKundenrezensionen versuchen, aus de-ren Inhalt abzuleiten, inwieweit ihre ei-genen Interessen und Präferenzen sichmit denen des (in der Regel persön-lich unbekannten) Rezensenten deckenund auf dieser Basis abzuschätzen, obsich auch ihre Produktbeurteilungen de-cken würden. Produktbezogene Aussagen

1In „Amazon-ähnlichen“ Rezensionssystemen geben Rezensenten eine numerische Bewertung für das Produkt sowie eine frei formulierte Re-zension (minimale Länge 20 Worte) ab. Das Produkt muss nicht anhand vorgeschriebener standardisierter Kriterien bewertet werden (z. B.TripAdvisor.com).2Zwei Studien zur Nützlichkeit von Rezensionen (Jin und Liu 2010; Chen und Tseng 2011) benutzen Teile dieses Klassifikationsmodells, umQualitätsmaße für Rezensionen abzuleiten.

136 WIRTSCHAFTSINFORMATIK 3|2013

Page 3: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Abb. 1 Klassifikationsmodell der Einflussfaktoren auf die Datenqualität (Wang und Strong 1996)

und Meinungen werden schließlich so-wohl von persönlichen Präferenzen alsauch von „umweltbedingten“ Einflüssenwie der Qualität der Produkteigenschaf-ten beeinflusst (Folkes 1988). Ein hoherGrad an Subjektivität vereinfacht bzw.beschleunigt die Prüfung der Präferenz-Schnittmenge zwischen Leser und Re-zensent. Bisherige Ergebnisse zum Ein-fluss der Objektivität auf die Nützlich-keit einer Rezension sind jedoch nichteindeutig. Zhang und Varadarajan (2006)sowie Liu et al. (2007) berichten, dasssich nützliche und unnütze Rezensionennicht in ihrer Objektivität unterscheiden.Hao et al. (2009) und Ghose und Ipeiro-tis (2011) hingegen führen Evidenz dafüran, dass die Objektivität einen signifikan-ten Einfluss auf die Nützlichkeit hat. Einvon Chen und Tseng (2011) implemen-tierter Klassifikator unterscheidet unterBerücksichtigung der Objektivität bes-ser zwischen nützlichen und unnützenRezensionen.

Auch die Reputation des Autors kannals Signal dafür dienen, dass eine Re-zension wertvolle und wahrheitsgemä-ße Informationen enthält. Reputation istein sog. peripheres Signal, auf das dieKunden zurückgreifen, denen die Moti-vation oder (kognitive) Fähigkeit fehlt,komplizierte Botschaften zu verarbei-ten (Cacioppo und Petty 1984). Rezen-senten können ihre Reputation verbes-sern, indem sie als Experten für be-stimmte Produktkategorien (aufgrundvon Selbsteinschätzung oder Bestätigun-gen/Zertifizierungen von Dritten) auf-treten oder auch indem sie sehr hilf-reiche Rezensionen schreiben. Abgese-hen davon, dass solche peripheren Si-gnale die kognitiven Kosten der Verar-beitung von Rezensionen senken, hel-fen sie auch bei der Einschätzung des

Wahrheitsgehaltes von Rezensionen (Ea-gly und Chaiken 1984). Die Ergebnissevon Liu et al. (2008) sowie Chen undTseng (2011) deuten darauf hin, dass sichdie Reputation (in Kombination mit an-deren Einflussfaktoren) als Klassifikatorfür die Nützlichkeit eignet.

Kunden stellen ganz ähnliche Über-legungen bezüglich der Glaubwürdig-keit einer Rezension, insbesondere fürErfahrungsgüter, an (Jain und Posavac2001). Glaubwürdigkeit bezieht sich hier-bei auf das Ausmaß des Vertrauens in denWahrheitsgehalt einer Rezension. Gerin-ges Vertrauen und mangelnde Glaubwür-digkeit herrschen vor, wenn der Rezen-sent seine wahren Erfahrungen und Mei-nungen nicht preisgibt (Eagly und Chai-ken 1984). Kennen Kunden die Identitätdes Rezensenten, können sie versuchen,die Wahrscheinlichkeit für solches Ver-halten abzuschätzen, z. B. indem sie dieVerbindungen des Rezensenten zur Her-stellerfirma des rezensierten Produktesprüfen. Forman et al. (2008) berichten,dass Rezensionen von Personen, die ih-re Namen bekannt geben, tendenziell alsnützlicher bewertet werden – vor allem,wenn die Rezensionen nicht einseitig po-sitiv oder negativ sind. Die Ergebnissevon Ghose und Ipeirotis (2011) deutenebenfalls darauf hin, dass die Preisgabeder Identität des Rezensenten einen po-sitiven Einfluss auf die wahrgenommeneNützlichkeit hat.

Der Mehrwert einer Rezension gibt an,ob diese, verglichen mit den bereits exis-tierenden Rezensionen, neue Informa-tionen oder eine der bisherigen „Mehr-heitsmeinung“ der Rezensionen wider-sprechende Meinung enthält. Rezensio-nen mit einem hohen Mehrwert gleichen(falls vorhanden) sog. „early reviewer bi-as“ (Li und Hitt 2008) aus und stei-gern das Vertrauen der Kunden in das

ORS, denn es wird eine größere Band-breite an Meinungen angeboten (Schlos-ser 2011). Sind zu einem Produkt bei-spielsweise nur extrem negative (positive)Rezensionen vorhanden, werden Kun-den, die möglichst umfassend informiertsein wollen, eine neue Rezension mit ei-ner positiven (negativen) Meinung alsnützlicher wahrnehmen als eine zusätz-liche negative (positive) Rezension. DieErgebnisse von Danescu-Niculescu-Mizilet al. (2009), Jin und Liu (2010) so-wie Otterbacher (2008) stützen die Ver-mutung, das Rezensionen, welche derbisherigen „Mehrheitsmeinung“ wider-sprechen, einen Mehrwert für Kundenstiften.

Die Informationsmenge in einer Re-zension hat einen positiven Einflussauf die wahrgenommene Nützlichkeit(Zhang und Tran 2011). Mudambi undSchuff (2010) erklären dies damit, dassdas Vertrauen in die eigene Entscheidunggrößer ist, wenn dem Entscheider einegrößere Anzahl an Begründungen da-für geliefert wird (Tversky und Kahne-man 1974) und dass Argumente als um-so überzeugender wahrgenommen wer-den, je mehr Informationen verfügbarsind (Schwenk 1986). Unabhängig vomProdukttyp hat eine größere Informati-onsmenge in einer Rezension anschei-nend einen positiven Einfluss auf das Ver-trauen in die Entscheidung, die Überzeu-gungskraft und die Nützlichkeit einer Re-zension (Korfiatis et al. 2008; Mudam-bi und Schuff 2010; Zhang et al. 2010;Wu et al. 2011).

Die Aktualität einer Rezension be-schreibt, wann sie veröffentlicht wurde,und kann ihre Nützlichkeit auf zwei ver-schiedene Arten beeinflussen. Früh (nachProduktrelease) veröffentlichte Rezensio-nen genießen in der Regel mehr Auf-merksamkeit und werden häufiger (als

WIRTSCHAFTSINFORMATIK 3|2013 137

Page 4: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

nützlich) bewertet. Später veröffentlichteRezensionen werden andererseits als ak-tueller und daher nützlicher wahrgenom-men (Hao et al. 2009). Entsprechend un-einheitlich sind bisherige Ergebnisse zumEinfluss der Aktualität auf die Nützlich-keit: Otterbacher (2008) und Chen undTseng (2011) finden keine Evidenz dafür,dass die Klassifikation von Rezensionendadurch verbessert werden kann. Wanget al. (2011) hingegen stellen Verbesse-rungen in der Nützlichkeitsberechnungfest, wenn die Rezensionen mit einem„Verfallsdatum“ versehen wurden. Panund Zhang (2011) berichten von einemsignifikanten positiven Effekt des Alterseiner Rezension auf ihre Nützlichkeit.

Gute Verständlichkeit erhöht die Wahr-scheinlichkeit, dass ein Kunde einerEmpfehlung folgt (Eagly 1974) oder ei-ne Rezension als nützlich wahrnimmt(Ghose und Ipeirotis 2011; Chen undTseng 2011). Schlechtere Verständlich-keit erfordert einen größeren kogniti-ven Verarbeitungsaufwand, was gleich-zeitig die Wahrscheinlichkeit verringert,dass ein (durchschnittlich gebildeter) Le-ser die Rezension versteht. Einfach ver-ständliche Rezensionen, die einen gerin-gen kognitiven Aufwand beim Lesen ver-ursachen, werden als nützlicher empfun-den (Korfiatis et al. 2008; Ghose undIpeirotis 2011; Wu et al. 2011).

Die Interpretierbarkeit drückt aus, wieleicht die in einer Rezension enthalte-nen Meinungen als positiv oder negativeingeordnet werden können. Je einfacherdies möglich ist, desto nützlicher wirddie Rezension wahrgenommen (Schlos-ser 2011). Rezensionen mit einem ho-hen Anteil an trennscharfen und nach-prüfbaren Informationen helfen Kunden,das besprochene Produkt genau einerkognitiven Kategorie zuzuordnen (zumBeispiel „geringe Qualität“). Die Trenn-schärfe einer Rezension wird direkt durchdie Sternebewertung ausgedrückt. Extre-me Bewertungen erlauben es den Kun-den, das Produkt sehr einfach als „gut“oder „schlecht“ zu klassifizieren. Rezen-sionen mit moderaten Sternebewertun-gen beinhalten wahrscheinlich zweisei-tige Informationen. Solche Rezensionenmüssen mit größerem kognitiven Auf-wand „ausgewertet“ werden und sind da-her von geringerer Nützlichkeit (Formanet al. 2008; Ghose und Ipeirotis 2011). ImWiderspruch dazu stehen die Ergebnis-se von Pan und Zhang (2011), die eine

positive lineare Beziehung zwischen Ster-nebewertung und Nützlichkeit für Such-sowie Erfahrungsgüter aufzeigen. Rezen-sionen von Erfahrungsgütern wurden ge-nerell als weniger nützlich empfunden.Negative Rezensionen von Erfahrungsgü-tern wurden als signifikant weniger nütz-lich empfunden als negative Rezensionenvon Suchgütern. Mudambi und Schuff(2010) berichten, dass der Produkttypeinen moderierenden Effekt auf den Ein-fluss der Extremität der Rezension auf ih-re Nützlichkeit hat. Erfahrungsgüter wei-sen hierbei eine invertiert U-förmige Be-ziehung und Suchgüter eine U-förmigeBeziehung auf. Mudambi und Schuff(2010) argumentieren, dass Kunden vonErfahrungsgütern moderate Rezensionenextremen Rezensionen vorziehen, weil siean einem möglichst ausgeglichenen Mei-nungsbild interessiert sind. Wenn Kun-den in moderaten Rezensionen tatsäch-lich ein höheres Maß an Ausgeglichenheiterwarten, können sie die Sternebewer-tung als peripheres Signal dafür heran-ziehen. Bei Rezensionen von Erfahrungs-gütern ist es für den Kunden schwierigzu erkennen, ob die Meinung des Rezen-senten auf persönliche oder produktbe-zogene Ursachen zurückzuführen ist. Indiesem Fall sind ausgeglichene Rezensio-nen hilfreicher. Bei Suchgütern hingegenkann leicht zwischen persönlichen- undproduktbezogenen Ursachen unterschie-den werden; Kunden bevorzugen daherextreme Rezensionen.

Die Einordnung der bislang identifi-zierten Einflussfaktoren anhand des Mo-dells von Wang und Strong (1996) er-möglicht erstmals einen umfassenden,strukturierten Überblick über den aktu-ellen Forschungsstand. Der folgende Ab-schnitt erläutert die Adaption des Mo-dells von Wang und Strong (1996) aufden hier untersuchten Kontext. Online-Anhang C fast die adaptierten Definitio-nen für alle relevanten Konstrukte derRezensionsqualität zusammen.

2.3 Adaptiertes Klassifikationsmodell

Die Dimension „intrinsische Qualität“beinhaltet all diejenigen Eigenschaften,die sich auf den Inhalt (Objektivität,Fehlerfreiheit) und den Autor (Reputati-on, Glaubwürdigkeit) einer einzelnen Re-zension beziehen. Fehlerfreiheit, wenn-gleich intuitiv wichtig, ist schwierig mess-bar. Voneinander abweichende Meinun-gen über Produktmerkmale weisen nicht

unbedingt auf Fehlurteile, sondern aufverschiedene Präferenzen (Li und Hitt2008) oder Erwartungen der Kunden(Bone 1995) oder sogar Produktionsfeh-ler hin. Der Faktor Fehlerfreiheit wirddaher mangels reliabler Messinstrumenteausgeschlossen.

Die „intrinsische Qualität“ einer Re-zensionen beruht auf einer isolierten Be-trachtung von Rezensionen. Im Gegen-satz dazu beleuchtet die „kontextuelleQualität“ einer Rezension deren Wert inRelation zu Leseranforderungen (Rele-vanz) und anderen Rezensionen (Mehr-wert, Aktualität, angemessene Informati-onsmenge, Vollständigkeit). Im Original-verständnis von Wang und Strong (1996)sind die aufgabenbezogenen Anforde-rungen des Datenkonsumenten zentralfür die Beurteilung der Datenqualität.Die spezifische Aufgabe, zu deren Er-füllung der Leser Rezensionen sucht (z.B. Geburtstagsgeschenk kaufen oder Pro-duktdefekt identifizieren), ist jedoch un-bekannt und die aufgabenzentrierte Per-spektive daher für den vorliegenden Kon-text nicht einnehmbar. Relevanz kann füranonyme Leser und unbekannte Lese-zwecke nicht in das Modell aufgenom-men werden. Viele Studien nehmen (im-plizit) an, dass eine „ideale“ Rezensi-on möglichst alle Produktattribute disku-tiert. Diese Auffassung unterschätzt denWert von Rezensionen, die zwar nurwenige Attribute besprechen, zu diesenaber als Einzige Informationen enthal-ten, systematisch. Wenn Kunden nur In-formationen zu bestimmten Attributensuchen, kann Vollständigkeit sogar ei-ne unerwünschte Eigenschaft sein bzw.zu höheren Suchkosten führen. Geradein ORS mit einer aktiven Rezensenten-Community, die viele und sich ergänzen-de Rezensionen produzieren, ist Vollstän-digkeit zweitrangig und wird hier nichtweiter untersucht.

Die Dimension „repräsentative Quali-tät“ beinhaltet alle Faktoren, die im Zu-sammenhang mit dem Format (Präg-nanz, Einheitlichkeit) sowie dem Ver-fassen (Interpretierbarkeit, Verständlich-keit) einer Rezension stehen. Da ORSin der Regel nur einen bestimmten For-mattyp anbieten, sind sowohl Prägnanzals auch Einheitlichkeit für die Untersu-chung eines spezifischen ORS irrelevant.

Ähnliches gilt für die Dimension Zu-gang.3 Probleme des Datenmanagementswie Datensicherheit und Vertraulich-keit sind plattformabhängig und können

3Das Originalmodell wurde im Kontext des Managements von Unternehmensdatenbanken entwickelt.

138 WIRTSCHAFTSINFORMATIK 3|2013

Page 5: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

nicht durch Rezensenten beeinflusst wer-den. Auch dieses Kriterium wird dahervon der weiteren Untersuchung ausge-schlossen.

Bisher wurden in der For-schung zur Nützlichkeit von Online-Kundenrezensionen drei zentrale Pro-bleme noch nicht adressiert. Erstens un-tersuchten bisherige Studien immer nureinen Teil der im vorliegenden Beitragaufgezeigten Einflussfaktoren, was denErklärungsgehalt der bisher vorgeschla-genen Modelle vermindert. Die einzigeAusnahme stellt Chen und Tseng (2011)Studie zum Vergleich der Eignung ver-schiedener Support-Vector-Machines fürdie Klassifikation von Rezensionen dar.Ihre Ergebnisse bieten aber nur teilweiseErklärungsansätze dafür, weshalb welcheFaktoren die Nützlichkeit beeinflussen.

Zweitens nehmen die meisten Studi-en keine Differenzierung nach Produkt-typen vor. Die wenigen Ausnahmen, ins-besondere Mudambi und Schuff (2010)und Pan und Zhang (2011), stellen je-doch in der Tat einen moderierenden Ef-fekt des Produkttyps auf den Einfluss ver-schiedener Faktoren auf die Nützlichkeitvon Rezensionen fest.

Drittens verwenden viele Studien Stra-tegien zur Datensammlung, die syste-matische Verzerrungen in den Datenba-sen vermuten lassen. Beispielsweise wer-den oft nur Rezensionen von Bestseller-Produkten verwendet (z. B. Mudambiund Schuff 2010; Chen und Tseng 2011;Pan und Zhang 2011). Kunden reagie-ren jedoch unterschiedlich auf Bestsellerund Nischenprodukte (Berger et al. 2010;Dellarocas et al. 2010), sodass die so ge-sammelten Daten einen „bestseller bias“enthalten könnten. Eine weitere Strate-gie, die zu verzerrten Ergebnissen führenkann, ist die Sammlung nur der aktuells-ten Rezensionen (z. B. Chen und Tseng2011). Das Alter einer Rezension kann je-doch deren wahrgenommene Nützlich-keit beeinflussen (Otterbacher 2008; sie-he Abschn. 2.2).

Der folgende Abschn. präsentiert dasForschungsmodell. Es berücksichtigtzwei der erwähnten Probleme durch (i)die Einbeziehung aller in Abschn. 2 iden-tifizierten Einflussfaktoren und (ii) Be-rücksichtigung des Produkttyps. DasProblem verzerrter Datenbasen wird inAbschn. 4 adressiert.

3 Forschungsmodell

Die Dimension „intrinsische Qualität“beinhaltet die Objektivität einer Rezen-

sion sowie die Reputation und Glaub-würdigkeit des Rezensenten (z. B. Parket al. 2007; Hao et al. 2009; Ghose undIpeirotis 2011; Chen und Tseng 2011).

Die bislang vorliegenden widersprüch-lichen Ergebnisse für Objektivität lassensich möglicherweise durch die mangeln-de Unterscheidung zwischen Produktty-pen erklären. Subjektive Rezensionen, diesich auf persönliche Erfahrungen bezie-hen, werden vor allem für Erfahrungs-güter als besonders nützlich wahrgenom-men. Kunden sind bei der Beurteilungvon Erfahrungsgütern darauf angewie-sen, dass Rezensenten auch von ihrenpersönlichen Präferenzen und Erfahrun-gen berichten. Attribute von Suchgüternkönnen hingegen objektiv beschriebenwerden. Es ist daher zu vermuten, dassRezensionen von Suchgütern nützlichersind, wenn diese objektiv verfasst wur-den, da so der Wahrheitsgehalt der Qua-litätsbehauptungen der Produktherstellerbesser beurteilt werden kann.H1a: Objektive Rezensionen von Suchgü-

tern werden als nützlicher wahr-genommen als objektive Rezensio-nen von Erfahrungsgütern. Subjekti-ve Rezensionen sind hingegen nützli-cher für Erfahrungsgüter.

Die Reputation eines Rezensenten ist ab-hängig von der Anzahl an Kunden, dieseine Rezensionen gelesen und als nütz-lich bewertet haben. Rezensenten, die inder Vergangenheit nützliche Rezensio-nen in einer Produktkategorie geschrie-ben haben, werden wahrscheinlich auchzukünftig dazu in der Lage sein. Zu-dem präferieren einige Kunden Meinungund Schreibstil bestimmter Rezensenten(Burton und Khammash 2010) und su-chen daher gezielt nach deren Rezensio-nen. Die Wahrscheinlichkeit, dass ein Re-zensent zukünftig positive Bewertungenfür seine Rezensionen bekommt, steigtdaher mit der Qualität seiner bisherigenRezensionen (d. h. seiner Reputation imORS).H1b: Die wahrgenommene Nützlichkeit

von Rezensionen steigt mit derdurchschnittlichen Nützlichkeit derbisher in der gleichen Produktka-tegorie veröffentlichten Rezensioneneines Rezensenten.

Forman et al. (2008) fanden heraus, dassdie Offenlegung der Identität als Signalfür die Glaubwürdigkeit einer Rezensionfungiert und dadurch die wahrgenom-mene Nützlichkeit der Rezensionen einesnicht anonym agierenden Rezensentensteigt.

H1c: Produktrezensionen von Rezensen-ten, die ihre Identität offenlegen,sind für Kunden nützlicher.

Die relevanten Faktoren aus der Di-mension „kontextuelle Qualität“ sind derMehrwert, die Aktualität, und die Infor-mationsmenge (z. B. Danescu-Niculescu-Mizil et al. 2009; Pan und Zhang 2011;Jin und Liu 2010). Eine Rezension kannMehrwert stiften, indem sie eine zuden bisherigen Rezensionen abweichen-de Meinung präsentiert und die Kun-den dadurch ein breiteres Spektrum anMeinungen zu einem Produkt erhalten(Danescu-Niculescu-Mizil et al. 2009).H2a: Rezensionen, die stark von den bis-

herigen Rezensionen abweichen, ha-ben eine höhere Nützlichkeit als Re-zensionen mit einem hohen Grad anÜbereinstimmung.

Kunden evaluieren die Qualität von Pro-dukten, indem sie einzelne Produktattri-bute evaluieren (Netzer und Srinivasan2011; Scholz et al. 2010). Rezensionen,die viele Attribute diskutieren, oder aberAttribute, die in keiner anderen Rezensi-on besprochen werden, sind für Kundennützlicher.H2b: Die wahrgenommene Nützlichkeit

von Rezensionen steigt mit dem In-formationsgehalt.

Frühe Rezensionen zu einem Produkt er-regen mehr Aufmerksamkeit und erhal-ten daher eine größere Anzahl an po-sitiven Bewertungen (Pan und Zhang2011).H2c: Je früher eine Rezension veröffent-

licht wird, desto nützlicher ist sie fürKunden.

Die dritte Dimension „repräsentativeQualität“ beinhaltet Interpretierbarkeitund Verständlichkeit (z. B. Korfiatis et al.2008; Ghose und Ipeirotis 2011; Wu et al.2011). Rezensionen, die beim Lesen we-niger kognitiven Aufwand verursachen,werden als nützlicher wahrgenommen alsschwer verständliche Rezensionen (Gho-se und Ipeirotis 2011).

In der Wirtschaftsinformatik wurdenbereits zahlreiche Indizes zur mathema-tischen Beschreibung der Lesbarkeit vonTexten entwickelt und angewandt (Kla-re 2000; Ghose und Ipeirotis 2011). Jeniedriger das benötigte Niveau ist, um ei-ne Rezension verstehen zu können, destogrößer ist die Anzahl der Kunden, die sieerfolgreich verarbeiten.H3a: Die wahrgenommene Nützlichkeit

einer Rezension steigt mit ihrer Les-barkeit.

Lesbarkeitsindizes basieren auf den rela-tiven Häufigkeiten von Zeichen, Worten,Sätzen oder Silben. Jedoch würden zwei

WIRTSCHAFTSINFORMATIK 3|2013 139

Page 6: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Abb. 2 Forschungsmodell

kurze Rezensionen mit einfachen Wor-ten den gleichen Lesbarkeitsindex besit-zen, selbst wenn die eine viele Schreib-fehler beinhaltete, welche wiederum dieLesbarkeit beeinträchtigen. Daher solltezur besseren Beurteilung der Verständ-lichkeit von Rezensionen neben der Les-barkeit auch die Anzahl an Schreibfeh-lern herangezogen werden (Klare 2000;Ghose und Ipeirotis 2011).H3b: Die wahrgenommene Nützlichkeit

steigt mit einer geringeren Anzahlan Schreibfehlern.

Die Interpretierbarkeit beschreibt, wieeinfach die Meinung des Rezensentenaus einer Rezension extrahiert werdenkann. Sowohl hoch diagnostische (Mu-dambi und Schuff 2010) als auch „ein-prägsame“ Rezensionen (Feldman undLynch 1988) sind leicht interpretierbarund daher nützlicher. Kunden könnensich einfacher an „einprägsame“ Rezen-sionen erinnern, da sie das Produkt be-sonders anschaulich und provokativ be-schreiben (Herr et al. 1991). Anschau-liche und provokative Produktbeschrei-bungen erfordern insbesondere die Ver-wendung vieler Adjektive und Adverbi-en. Es ist bekannt, dass Adjektive und Ad-verbien besonders gut geeignet sind, umdie Grundstimmung eines Textes zu er-mitteln (Benamara et al. 2007; Xia et al.2011). Allerdings ist es unwahrscheinlich,dass eine maximale Steigerung des An-

teils von Adjektiven und Adverbien zu ei-ner nützlichen Rezension führt, da einübermäßig hoher Anteil an Adjektivenund Adverbien im Verhältnis zu ande-ren Worten (Produktmerkmale, Verbenetc.) Verständlichkeit und Trennschärfeeiner Rezension reduziert. Ein moderathoher Anteil an Adjektiven und Adver-bien verbessert jedoch vermutlich Trenn-schärfe und Einprägsamkeit von Rezen-sionen und beeinflusst ihre Nützlichkeitsomit positiv.H3c: Produktrezensionen mit einem sehr

hohen oder sehr niedrigen Anteil anAdjektiven (Adverbien) weisen einegeringere Nützlichkeit auf, als Re-zensionen mit einem moderat hohenAnteil an Adjektiven (Adverbien).

Kunden können die Sternebewertung ei-nes Rezensenten als peripheres Signal fürdie Ausgeglichenheit der in der Rezensi-on präsentierten Meinungen verwenden.Dies gilt unter der Annahme, dass Re-zensionen mit moderaten Sternebewer-tungen sowohl positive als auch negati-ve Produktattribute diskutieren. Auf Ba-sis des Rezensionstextes darauf zurückzu-schließen, ob der Meinung eines Rezen-senten persönliche oder produktbezoge-ne Ursachen zugrunde liegen, ist schwie-riger für Erfahrungsgüter als für Suchgü-ter. Für die Beurteilung von Suchgüternbevorzugen Kunden daher Rezensionenmit extremen Bewertungen (Mudambiund Schuff 2010).

H3d: Produktrezensionen mit extremenBewertungen sind weniger nützlich alsRezensionen mit moderaten Bewertun-gen, wenn es sich bei dem rezensiertenProdukt um ein Erfahrungsgut handelt.Rezensionen mit extremen Bewertun-gen sind hingegen nützlicher, wenn essich bei dem rezensierten Produkt umein Suchgut handelt.

Abbildung 2 fasst das gesamte For-schungsmodell zusammen. Die empiri-sche Evaluation des Forschungsmodellsbeschreibt Abschn. 4.

4 Empirische Evaluation

4.1 Datenerhebung

Für die empirische Evaluation des imvorangegangenen Abschnitts hergelei-teten Forschungsmodells wurden imMärz 2012 alle verfügbaren Online-Rezensionen für 1006 digitale Kom-paktkameras, 1402 Smartphones, 549Notebooks, 133 Tagesrucksäcken, 1507Brettspiele und 182 Eaux de Toilettegesammelt. Diese sechs Produktkate-gorien wurden ausgewählt, da (i) fürdie Mehrheit der Produkte in diesenKategorien bereits Rezensionen vor-

140 WIRTSCHAFTSINFORMATIK 3|2013

Page 7: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

liegen, (ii) sie sowohl Erfahrungs- alsauch Suchgüter umfassen und (iii) dieProdukte eine breite Preisspanne ab-decken. Um Verzerrungen durch se-lektive Datensammlung zu vermeiden(siehe Abschn. 2.3), wurden alle Rezen-sionen für alle Produkte der gewähltenProduktkategorien erhoben. Der vor-liegende Datensatz zählt damit zu denumfangreichsten bisher erhobenen Da-tensätzen zur Untersuchung der Ein-flussfaktoren auf die Nützlichkeit vonOnline-Rezensionen.

Produkte ohne Rezensionen und Pro-dukte mit identischen Rezensionen (z. B.technisch identische Kameras in verschie-denen Farben) sowie Rezensionen mitweniger als zehn Bewertungen wurdenvon der empirischen Evaluation ausge-schlossen, um Verzerrungen zu vermei-den und eine robuste Approximationder Nützlichkeit zu gewährleisten. Ins-gesamt wurden 27.104 Rezensionen inden sechs Produktkategorien analysiert.Für jede Rezension wurden die Nützlich-keit (als die Anzahl der positiven Be-wertungen/Gesamtanzahl an Bewertun-gen) sowie Sternebewertung, Erstellda-tum, Rezensionstext, Name des Rezen-senten, und Identitätsoffenlegung (binär)durch den Rezensenten erhoben. Abwei-chungen in der Sternebewertung wurdenals Differenz zwischen der Sternebewer-tung einer bestimmten Rezension undder durchschnittlichen Sternebewertungaller zuvor zum gleichen Produkt ver-fassten Rezensionen berechnet. Eine po-sitive Abweichung impliziert, dass spä-tere Käufer zufriedener mit dem Pro-dukt waren als frühe Käufer. Die Repu-tation eines Rezensenten wurde als diedurchschnittliche Nützlichkeit aller frü-heren Rezensionen des Rezensenten inder gleichen Produktkategorie operatio-nalisiert. Die Objektivität einer Rezensi-on bemisst sich am invertierten Anteilan Personal- und Possessivpronomen imRezensionstext.

Aus jeder Rezension wurden Sätze,Worte, Silben und Wortarten extrahiert.Zur Schätzung der Lesbarkeit einer Re-zension wurde das SMOG-Maß verwen-det, welches als sehr robust gilt (Lahiriet al. 2011). Zur Berechnung des SMOG-Maßes werden die Anzahl an Sätzen so-wie die Anzahl an mehrsilbigen Worten(Worte, die aus 3 oder mehr Silben be-stehen) gezählt und wie folgt in Relationgesetzt:

SMOG = 1,043

×(

Anzahl mehrsilbiger Worte

× 30

Anzahl an Sätzen

) 12

+ 3,1291

Für jede der sechs Produktkategorienwurde ein Set an Produktattributen defi-niert.4 Um die in einer bestimmten Re-zension diskutierten Attribute zu iden-tifizieren, wurden alle Substantive undEigennamen mit dem entsprechendenSet verglichen. Auf Basis der identifizier-ten Attribute (Otterbacher 2008; Zhangund Tran 2011) wurde der Informati-onsgehalt einer Rezension mithilfe vonShannon (1948) Entropiemaß berechnet:

−∑

∀ Attribute

p(Attribut) log2

(p(Attribut)

)

wobei p(Attribut) die Wahrscheinlichkeitdafür angibt, dass ein Attribut in ei-ner älteren Rezension bereits diskutiertwurde.

Des Weiteren wurde eine Rechtschreib-prüfung auf Basis der Wortliste vonwiktionary.org für alle Worte außer denEigennamen durchgeführt. Tabelle 1 prä-sentiert die deskriptiven Statistiken füralle Variablen.

Die deskriptiven Statistiken fürErfahrungs- und Suchgüter weisen meh-rere interessante Regelmäßigkeiten auf.Rezensionen von Erfahrungsgütern wur-den durchschnittlich als nützlicher wahr-genommen als Rezensionen von Suchgü-tern. Dieser Unterschied könnte sich dar-auf zurückführen lassen, dass insbeson-dere Brettspiele und Eaux de Toilette nurwenige vordefinierte Attribute besitzen.Dies erschwert die (kognitive) Einord-nung der in den Rezensionen zu diesenProdukten enthaltenen Informationenund erhöht die Unsicherheit vor demKauf (Mudambi und Schuff 2010). ImGegensatz dazu besitzen die untersuchtenSuchgüter viele objektive Attribute, dieauch ohne Rückgriff auf Produktrezen-sionen evaluiert werden können (Nelson1974). Die Rezensionen von Suchgüterndiskutieren im Durchschnitt eine größe-re Anzahl an Attributen, sind länger undweisen ein höheres Maß an Entropie aufals Rezensionen von Erfahrungsgütern.Allerdings sind Rezensionen zu Such-gütern aufgrund der größeren Anzahlan diskutierten Attributen schwerer les-bar, wie aus den höheren SMOG-Wertenersichtlich ist (Tab. 1).

Zwar existiert eine positive, lineare Be-ziehung zwischen Wortanzahl und An-zahl an diskutierten Attributen (p <

0,001), aber gleichzeitig liegt eine um-gekehrt U-förmige Beziehung zwischenWortanzahl und Sternebewertung vor.Moderate Rezensionen (3 Sterne) sindtendenziell „ausgeglichen“, d. h. es wer-den sowohl Vor- als auch Nachteile dis-kutiert, und folglich länger als extremeRezensionen.

4.2 Datenanalyse und Ergebnisse

Die abhängige Variable im vorliegendenModell ist die Wahrscheinlichkeit im In-tervall [0;1], dass eine Rezension nütz-lich ist. Eine logistische Regression istfür binomiale Variablen nur dann zu-lässig, wenn die Anzahl an „Versuchen“und „Erfolgen“ bekannt ist (Wright undLondon 2009, S. 94), d. h. die Anzahlan Kunden, die eine Rezension gelesenund als nützlich bewertet haben. Die-se Anzahl ist im vorliegenden Fall, wieauch Mudambi und Schuff (2010) be-tonen, unbekannt. Die wahre Nützlich-keit einer Rezension kann daher von derdurch die Kundenbewertungen offenbar-ten Nützlichkeit abweichen. Eine Tobit-Regression ist in solchen Fällen robusterals eine logistische Regression – solan-ge die Nützlichkeitswerte der meisten Re-zensionen ungleich der Intervallgrenzen0 und 1 ist. Da 90 % der erhobenen Re-zensionen (24.407 von 27.104) Nützlich-keitswerte ungleich 0 und 1 aufweisen, istkeine systematischen Verzerrung der Er-gebnisse der Tobit-Regression zu vermu-ten (Greene 2012, S. 895). Zur Evaluationdes Forschungsmodells wird die folgendeRegressionsgleichung verwendet.

Nützlichkeit

= α + β1Objektivität

+ β2Objektivität × Produkttyp

+ β3Bisherige Nützlichkeit

+ β4Identitätsoffenlegung

+ β5Abweichung der Sternebewertung

+ β6Entropie + β7 ln(Alter)

+ β8SMOG + β9Schreibfehler

+ β10Adjektive + β11Adjektive2

+ β12Adverbien + β13Adverbien2

+ β14Numerische Bewertung

+ β15Sternebewertung2

+ β16Sternebewertung

4Die Produktattribute wurden aus den Webseiten der Hersteller extrahiert.

WIRTSCHAFTSINFORMATIK 3|2013 141

Page 8: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Tab. 1 Deskriptive Statistiken der erhobenen Variablen [Mittelwert (Standardabweichung)]

Variable Kamera Smartphone Notebook Rucksack Brettspiel Eau de Toilette

Typ Suchgut Suchgut Suchgut Erfahrungsgut Erfahrungsgut Erfahrungsgut

# Produkte 1006 1402 569 133 1507 182

# Rezensionen 8424 13047 1701 64 2607 1261

Worte pro Rezension 243,95 (251,21) 267,18 (297,53) 278,58 (338,07) 114,94 (119,51) 173,68 (208,07) 193,36 (227,69)

Nützlichkeit 0,70 (0,28) 0,62 (0,32) 0,68 (0,30) 0,84 (0,23) 0,76 (0,27) 0,72 (0,28)

Lesbarkeit 9,03 (3,33) 8,64 (3,32) 8,76 (3,51) 7,76 (4,10) 7,74 (2,62) 8,63 (3,51)

Schreibfehler (%) 13,76 (7,20) 13,59 (7,26) 14,22 (6,87) 10,07 (5,30) 10,92 (8,94) 14,14 (7,95)

Adjektive (%) 6,04 (3,11) 5,12 (2,90) 5,27 (2,76) 5,72 (3,61) 5,41 (3,03) 5,47 (3,20)

Adverbien (%) 6,44 (3,59) 6,60 (3,67) 6,73 (3,69) 7,35 (4,24) 5,54 (3,71) 6,80 (3,93)

Sternebewertung 3,77 (1,43) 3,42 (1,59) 3,81 (1,44) 4,19 (1,25) 3,88 (1,38) 3,66 (1,50)

Entropie 2,32 (2,56) 1,83 (2,12) 3,19 (3,45) 0,51 (0,68) 0,74 (0,92) 0,19 (0,39)

Alter in Tagen 1145,84 (803,65) 979,50 (680,88) 664,18 (509,74) 679,23 (392,87) 1904,15 (831,94) 1692,25 (747,89)

Abweichung derSternebewertung

−0,04 (1,97) −0,45 (1,98) 0,44 (2,44) 1,16 (2,69) 0,72 (2,54) −0,26 (1,52)

Objektivität 0,91 (0,10) 0,86 (0,16) 0,86 (0,18) 0,93 (0,08) 0,93 (0,08) 0,91 (0,11)

Bisherige Nützlichkeit 0,25 (0,37) 0,22 (0,34) 0,15 (0,30) 0,03 (0,15) 0,30 (0,39) 0,08 (0,23)

Rezensenten mitfrüheren Rezensionen inder gleichenProduktkategorie (%)

35,92 34,64 21,22 3,13 37,82 11,34

Identitätsoffenlegung (%) 31,17 30,63 25,57 35,94 32,34 38,30

VordefinierteProduktattribute

71 83 75 51 22 16

× Produkttyp

+ β17Sternebewertung2

× Produkttyp

+ β18Produkttyp + ε

Tabelle 2 präsentiert die Ergebnisseder Tobit-Regression. Korrelationen zwi-schen den Variablen von höchstens 0,25deuten auf das Fehlen von Multikolli-nearität hin. Der hoch signifikante Log-Likelihood-Wert (p < 0,001) sowie einPseudo-R2 von 0,671 lassen auf eine sehrhohe Modellgüte schließen.

Die Nützlichkeit von Rezensionen wirdfolglich durch ihre repräsentative, kon-textuelle und intrinsische Qualität beein-flusst.

Intrinsische Qualität ist durch die An-zahl an (Possessiv-)Pronomen in Relati-on zur Länge der Rezension (Objektivi-tät), der bisherigen Nützlichkeit von Re-zensionen des Rezensenten (Reputation)und der Identitätsoffenlegung (Glaub-würdigkeit) operationalisiert. Hinsicht-lich des Einflusses des Produkttyps aufdie Beziehung zwischen Objektivität undNützlichkeit einer Rezension zu tes-ten, zeigte sich in zwei weiteren Tobit-Regressionen (eine für Such- und einefür Erfahrungsgüter), dass Kunden ob-jektive Rezensionen bei Suchgütern und

subjektive Rezensionen bei Erfahrungs-gütern präferieren. Der Produkttyp bie-tet somit eine mögliche Erklärung fürdie widersprüchlichen Ergebnisse frühe-rer Studien, denn diese beschränkten sichzumeist auf einen Produkttyp (z. B. Liuet al. 2007; Hao et al. 2009; siehe Online-Anhang B). Die zusätzlichen Regressio-nen wurden mit der folgenden Gleichungberechnet.

Nützlichkeit

= α + β1Objektivität

+ β2Bisherige Nützlichkeit

+ β3Identitätsoffenlegung

+ β4Abweichung der Sternebewertung

+ β5Entropie + β6 ln(Alter)

+ β7SMOG + β8Schreibfehler

+ β9Adjektive + β10Adjektive2

+ β11Adverbien + β12Adverbien2

+ β13Sternebewertung

+ β14Sternebewertung2 + ε

Die Reputation eines Rezensenten hateinen signifikant positiven Einfluss aufdie Nützlichkeit (H1b), Identitätsoffen-legung (H1c) hingegen nicht. Kunden

scheinen den bewussten Verzicht auf An-onymität durch den Rezensenten nichtals Signal für die Glaubwürdigkeit einerRezension wahrzunehmen.

Kontextuelle Qualitätsfaktoren (Mehr-wert und Informationsmenge in Relationzu älteren Rezensionen sowie Aktualität)haben einen signifikanten Einfluss auf dieNützlichkeit von Rezensionen. Die Ab-weichung der Sternebewertungen (H2a)und die Entropie (H2b) haben einen si-gnifikant positiven Effekt auf die Nütz-lichkeit von Rezensionen. Kunden schät-zen offenbar eine hohe Diversität an Mei-nungen. Die Bestätigung von H2b zeigt,dass Kunden Rezensionen nützlich fin-den, die viele Produktattribute diskutie-ren bzw. solche Attribute diskutieren, diein älteren Rezensionen kaum themati-siert wurden. Das Alter einer Rezension(H2c) korreliert positiv mit der Nützlich-keit: neuere Rezensionen sind wenigernützlich.

Die repräsentative Qualität ist als Les-barkeit, Anzahl an Rechtschreibfehlern(Verständlichkeit), Anteil von Adjektivenund Adverbien am Rezensionstext so-wie Extremität der Sternebewertung (In-terpretierbarkeit) operationalisiert. DieErgebnisse (siehe Tab. 2) deuten dar-auf hin, dass entgegen der Vermutung

142 WIRTSCHAFTSINFORMATIK 3|2013

Page 9: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Tab. 2 Regressionsergebnisse

Variable Schätzwert Standardfehler Hypothese

Konstante 25,246∗∗∗ 0,891

Objektivität −0,592∗∗∗ 0,047 Objektivität H1a (angenommen)

Objektivität × Produkttyp 0,302∗∗∗ 0,048

Bisherige Nützlichkeit 0,081∗∗∗ 0,005 Reputation H1b (angenommen)

Identitätsoffenlegung −0,002 0,003 Glaubwürdigkeit H1c (abgelehnt)

Abweichung derSternebewertung

0,014∗∗∗ 0,001 Mehrwert H2a (angenommen)

Entropie 0,028∗∗∗ 0,001 Informationsmenge H2b (angenommen)

Log(Alter) 0,879∗∗∗ 0,032 Aktualität H2c (angenommen)

SMOG 0,014∗∗∗ 0,001 Lesbarkeit H3a (abgelehnt)

Schreibfehler in % −0,152∗∗∗ 0,023 Schreibfehler H3b (angenommen)

Adjektive in % 1,613∗∗∗ 0,111 Interpretierbarkeit H3c (angenommen)

Adjektive in %2 −9,085∗∗∗ 0,591

Adverbien in % 0,344∗∗∗ 0,092

Adverbien in %2 −3,554∗∗∗ 0,383

Sternebewertung 0,141∗∗∗ 0,018 Extremität H3d (abgelehnt)

Sternebewertung2 −0,013∗∗∗ 0,003

Sternebewertung × Produkttyp −0,065∗∗∗ 0,019

Sternebewertung2 × Produkttyp 0,010∗∗∗ 0,003

Produkttyp −0,302∗∗∗ 0,052

Log-Likelihood −4425,478***

Pseudo-R2 0,673

von H3a5 schlechter lesbare Rezensionen(höhere SMOG-Werte) nützlicher sind.Auf den ersten Blick erscheint dieses Er-gebnis kontraintuitiv, doch bei nähererBetrachtung des SMOG-Maßes ergebensich zwei interessante Erklärungsansätze.SMOG wird auf der Basis des Anteils vonmehrsilbigen Worten zu Sätzen berech-net, Rezensionen mit einem hohen Anteilan mehrsilbigen Worten (schwerer les-bar) also als nützlicher empfunden. Vie-le dieser mehrsilbigen Worte sind Pro-duktattribute, Adjektive oder Adverbien(z. B. Auflösung, Megapixel, technisch).Kunden präferieren also Rezensionen, indenen viele Produktmerkmale diskutiertwerden. Möglicherweise ignorieren Kun-den einfach komplizierte Worte (z. B. At-tribute, deren Funktionalität ihnen un-klar ist) und „addieren“ lediglich die Vor-und Nachteile eines Produktes. Rezen-sionen, die viele Attribute diskutieren,sind für solche Kunden besonders wert-voll. Diese Interpretation wird dadurch

gestützt, dass Entropie (H2b) einen signi-fikant positiven Effekt auf die Nützlich-keit von Rezensionen hat und Lesbarkeitmoderat (aber signifikant) mit Entro-pie korreliert ist (r = 0,17). Die Anzahlan Rechtschreibfehlern (H3b) hat erwar-tungsgemäß einen signifikant negativenEffekt auf die Nützlichkeit.

Der Anteil an Adjektiven und Adver-bien am Text einer Rezension steht ineiner umgekehrt U-förmigen Beziehungzu ihrer Nützlichkeit (H3c). Ein Anteilvon 9 % an Adjektiven und 5 % an Ad-verbien scheint optimal zu sein. Da dieRegressionsanalysen keinen Hinweis aufden Zusammenhang konkreter Adjektiveund Adverbien mit der Nützlichkeit ge-ben, wurde eine Inhaltsanalyse mit demVerfahren von Zhang und Tran (2011)durchgeführt. Zur Prüfung der Vorher-sagegüte und zur Errechnung robusterInformationsmaße wurde eine 10-facheKreuzvalidierung durchgeführt: die Re-zensionen wurden zufällig in 10 gleichgroße Sets geteilt, von denen neun zum

Trainieren und eine zum Vorhersagen ge-nutzt wurde. Die Trainingssets beinhalte-ten die 25 % nützlichsten und 25 % nutz-losesten Rezensionen. Die Analysegütewurde anhand von Precision (53,83 bis73,82 %), Recall (48,47 bis 77,87 %) so-wie F-Maß (58,21 bis 71,64 %) beurteilt(siehe Online-Anhang D).

Negative Worte6 (z. B. schlecht, enttäu-schend) werden vorrangig in unnützenRezensionen verwendet. Positive Wor-te (z. B. schnell, perfekt) kommen so-wohl in nützlichen als auch in unnützenRezensionen vor. Nützliche Rezensionenbeinhalten vor allem produkt- und at-tributbezogene Informationen. Kundenvon Suchgütern nehmen Informationenüber Lieferung oder Kundenservice alsbesonders unnütz wahr (z. B. unfreund-lich, unbeantwortet). Einfache, leicht ver-ständliche Worte (z. B. klein, schnell)scheinen am nützlichsten zu sein, wo-hingegen komplexe und extrem positiveWorte (e.g. ultraleicht, exquisit) unnützeRezensionen charakterisieren.

5Die Regressionen wurden ebenfalls mit anderen Lesbarkeitsmaßen (Flesch-Kincaid Readibility Ease, Flesch-Kincaid Grade Level, Gunning FogIndex, Automated Readability Index und Coleman-Liau Index) durchgeführt. Es konnten keine nennenswerten Veränderungen der Ergebnissefestgestellt werden. Das SMOG-Maß wies die geringsten Werte für das Akaike-Informationskriterium auf.6Die 10 nützlichsten und unnützesten Adjektive und Adverbien für jede Produktkategorie sind in Online-Anhang D aufgelistet.

WIRTSCHAFTSINFORMATIK 3|2013 143

Page 10: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Abb. 3 Beziehung zwischen der Ster-nebewertung und der Nützlichkeit vonRezensionen

Für die Prüfung von H3d wurde diesel-be Regressionsgleichung verwendet wiefür die Prüfung von H1a. Die Nützlich-keit von Rezensionen von Suchgüternhängt linear von der numerischen Be-wertung des Produktes ab. Für Rezen-sionen von Erfahrungsgütern existiert ei-ne umgekehrt U-förmige Beziehung zwi-schen Bewertung und Nützlichkeit, diejedoch im relevanten Intervall von 1bis 5 Sternen einen monotonen Anstiegaufweist (Abb. 3). H3d wurde deshalbverworfen.

Der identifizierte Einfluss der Sterne-bewertung auf die Nützlichkeit weichtvon den Ergebnissen von Ghose undIpeirotis (2011), Mudambi und Schuff(2010) und Forman et al. (2008) ab,deckt sich jedoch mit den Ergebnissenvon Pan und Zhang (2011). Ceteris pa-ribus werden Rezensionen mit positivenProduktbewertungen als nützlicher emp-funden als Rezensionen mit negativenProduktbewertungen.

5 Diskussion

Durch die Strukturierung bisheriger For-schungsergebnisse mittels des Klassifi-kationsmodells von Wang und Strong(1996) konnte eines der bislang um-fangreichsten Sets an Einflussfaktoren aufdie Nützlichkeit von Online-Rezensionen(Hao et al. 2009; Pan und Zhang 2011)entwickelt werden. Faktoren aus drei Di-mensionen – intrinsische, kontextuelleund repräsentative Qualität (Wang undStrong 1996) – haben sich als wichti-ge Determinanten der Nützlichkeit vonRezensionen erwiesen.

Das verwendete Datenset beinhaltetdie Rezensionen aller Produkte aus je-weils drei Kategorien von Such- undErfahrungsgütern und ist damit einesder umfangreichsten. Die Ergebnisseder Datenanalyse liefern interessante

Implikationen für Internethändler undForscher.

5.1 Implikationen für die Praxis

Internethändler können mithilfe der hiervorgestellten Ergebnisse (i) automatischeNützlichkeitswerte für bislang unbewer-tete Rezensionen berechnen und (ii) Re-zensenten mit individuellem Feedbackbeim Verfassen nützlicherer Rezensio-nen unterstützen. Nützliche Rezensionenbesitzen sechs Hauptmerkmale.1. Nützliche Rezensionen beinhalten ei-

ne moderate Anzahl einfacher Ad-jektive (maximal 9 % des Gesamt-texts) und Adverbien (maximal 5 %)(H3c) und diskutieren Produktat-tribute, nicht Servicequalität (sieheOnline-Anhang D)

2. Nützliche Rezensionen diskutierenentweder eine Vielzahl von Produkt-merkmalen oder Produktmerkmale,die in anderen Rezensionen seltenbesprochen werden (H2b).

3. Abweichende Meinungen werdenals besonders wertvoll wahrgenom-men. Rezensenten müssen daher kei-ne Angst haben, für die Äußerungeiner von den bisherigen Rezensio-nen abweichende Meinung bestraft zuwerden (H2a).

4. Rezensionen von Erfahrungsgüternwerden als besonders nützlich wahr-genommen, wenn Rezensenten ihrepersönlichen Erfahrungen mit einemProdukt beschreiben anstatt einen ob-jektiven Bericht über Produktmerk-male zu liefern. Genau das Gegenteilgilt für Suchgüter (H1a).

5. Korrekte Rechtschreibung steigert dieNützlichkeit von Rezensionen, ins-besondere wenn Kunden unter ei-ner großen Anzahl an Rezensionenwählen können (H3b).

6. Rezensionen werden nicht als nütz-licher wahrgenommen, wenn Rezen-senten ihre wahre Identität offenle-gen (H1c).

Hieraus ergeben sich zwei Vorschlägezur Verbesserung von ORS. Erstens kön-nen Internethändler das in dieser Arbeitentwickelte Regressionsmodell verwen-den, um die Nützlichkeit von Rezensio-nen automatisch zu berechnen. Zweitenskann auf dieser Basis Software zur Un-terstützung von Rezensenten beim Ver-fassen nützlicherer Rezensionen entwi-ckelt und in ORS implementiert werden.Beide Maßnahmen würden die Quali-tät der Rezensionen verbessern und das

Auffinden relevanter Informationen er-leichtern, was sich positiv auf Kunden-zufriedenheit, Verweildauer und Umsatzauswirken würde.

Die Realisierung dieser Verbesserungs-potenziale setzt allerdings kundenseitigeAkzeptanz automatischer Nützlichkeits-bewertungen und softwarebasierter Un-terstützung voraus, die maßgeblich vonder Transparenz des verwendeten Be-wertungsmechanismus abhängen dürfte.Zur Beleuchtung dieser Fragestellung istweitere Forschung zu Prozessen der Bil-dung bzw. des Verlustes von kundensei-tigem Vertrauen in Online-Rezensionenund ORS notwendig.

Die Akzeptanz von softwarebasier-ter Unterstützung zum Verfassen vonRezensionen durch Rezensenten wirdinsbesondere davon abhängen, ob siesich durch die Software in ihrer Mei-nungsäußerung eingeschränkt fühlen,sowie von dem Grad an tatsächlichverbesserten Nützlichkeitsbewertun-gen. Die Nutzung der Software solltedaher unbedingt auf freiwilliger Basiserfolgen. Die Entwicklung einer sol-chen Software stellt eine weitere inter-essante Herausforderung für zukünftigeForschung dar.

5.2 Implikationen für die Forschung

Die vorliegende Studie leistet zwei Bei-träge zur Forschung in eWOM, die bei-de sowohl für die verhaltens- als auch diegestaltungsorientierte Forschung in derWirtschaftsinformatik interessant sind.Erstens wurde das Klassifikationsmodellvon Wang und Strong (1996) auf denKontext der Bestimmung von Einfluss-faktoren auf die Nützlichkeit von Online-Rezensionen angepasst. Eine auf die-ser Basis durchgeführte Strukturierungder bisherigen Forschungsarbeiten aufdiesem Gebiet ermöglicht die schnelle-re Identifizierung von Forschungslückenund bietet neue Erklärungsansätze fürwidersprüchliche Ergebnisse. Einer die-ser Erklärungsansätze besteht darin, dassfrühere Studien meist nur einen Teil derrelevanten Einflussfaktoren berücksich-tigten. Ein weiterer Erklärungsansatz istdie fehlende Unterscheidung zwischenProdukttypen, und einen dritten An-satz stellen potenzielle Verzerrungen inden verwendeten Datensätzen dar (z. B.Verwendung nur der Rezensionen vonBestsellern).

Zweitens zeigt die vorliegende Stu-die, dass repräsentative, kontextuelleund intrinsische Qualitätsfaktoren die

144 WIRTSCHAFTSINFORMATIK 3|2013

Page 11: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

wahrgenommene Nützlichkeit einer Re-zension signifikant beeinflussen (sieheAbschn. 4.2 für detaillierte Ergebnis-se). Rezensionen von Such- und Erfah-rungsgüter weisen systematische Unter-schiede auf: Rezensionen von Suchgü-tern sind länger, schwieriger zu lesenund zeichnen sich durch eine höhereInformationsmenge aus.

5.3 Limitationen

Im Unterschied zu den meisten bishe-rigen Studien konnte aufgezeigt werden,dass positive Rezensionen als nützlicherwahrgenommen werden als negative Re-zensionen. Da die verwendeten Datenkeinen Aufschluss über die Ursache die-ses Ergebnisses geben können, ist weitereForschung dazu notwendig.

Wie andere Studien auch basiert dievorliegende Untersuchung auf der An-nahme, dass die Nützlichkeitsbewertun-gen unverzerrt sind und die „wahre“Nützlichkeit einer Rezension gut appro-ximieren. Da allerdings nicht alle Kundengelesene Rezensionen bewerten, ist eineVerzerrung nicht auszuschließen. Bishergibt es keine Evidenz, ob und in welchemAusmaß eine solche Verzerrung vorliegenkönnte.

Auf Basis vorhandener Literatur kön-nen bezüglich der Wirkung automati-scher Nützlichkeitsbewertungen undsoftwarebasierter Unterstützung zwarVermutungen angestellt werden, es fehltjedoch noch die empirische Überprü-fung. Die Implementierung der vor-geschlagenen Software sowie die Eva-luierung hinsichtlich ihrer Effekte aufWahrnehmungen und Verhalten vonKunden sind daher notwendige nächsteSchritte.

Literatur

Benamara F, Cesarano C, Picariello A, Refor-giato D, Subrahmanian VS (2007) Senti-ment analysis: adjectives and adverbs arebetter than adjectives alone. In: Proceed-ings of the 1st international AAAI confer-ence on weblogs and social media, Boul-der, CO

Berger J, Sorensen AT, Rasmussen SJ (2010)Positive effects of negative publicity: whennegative reviews increase sales. MarketingSci 29(5):815–827

Bone PF (1995) Word-of-mouth effects onshort-term and long-term product judg-ments: interpersonal buyer behavior inmarketing. J Bus Res 32(3):213–223

Burton J, Khammash M (2010) Why do peopleread reviews posted on consumer-opinionportals? J Mark Manag 26(3):230–255

Zusammenfassung / AbstractMichael Scholz, Verena Dorner

Das Rezept für die perfekte Rezension?

Einflussfaktoren auf die Nützlichkeit von Online-Kundenrezensionen

Internethändler bieten ihren Kunden vermehrt die Möglichkeit, Online-Rezensionenzu erstellen. Diese reduzieren die Suchkosten anderer Kunden und erhöhen derenVerweildauer im E-Shop. Mittlerweile sind jedoch so viele Rezensionen verfügbar,dass das Auffinden von Produktinformationen und die Einschätzung der Produkt-qualität schwierig geworden sind. Abhilfe sollte die Bewertung der Nützlichkeit derRezensionen durch Leser schaffen. Dieser Mechanismus hat jedoch zwei kritischeSchwachstellen. Zum einen bleiben viele Rezensionen unbewertet, sodass sie bei ei-ner Sortierung nach der Nützlichkeit herausfallen. Zum anderen gibt es keine An-haltspunkte für Rezensenten, wie eine nützliche Rezension aussehen sollte. Zur Ab-leitung von Einflussfaktoren auf die Nützlichkeit von Produktrezensionen wird dasModell von Wang und Strong zur kontextabhängigen Beurteilung von Datenqualitätadaptiert. Eine empirische Analyse von 27.104 Kundenrezensionen auf Amazon.comüber sechs Produktkategorien zeigt, dass die Nützlichkeit einer Rezension nicht nurvon ihren eigenen Attributen abhängt, sondern auch von kontextuellen Faktoren,die sich aus der Gesamtheit aller verfügbaren Rezensionen ergeben. Rezensionen fürErfahrungs- und Suchgüter unterscheiden sich systematisch voneinander. Das vor-geschlagene Modell erlaubt die Berechnung vorläufiger Nützlichkeitswerte für un-bewertete Rezensionen und bildet die Basis für einen Kundenleitfaden zur Erstellungnützlicherer Rezensionen.

Schlüsselwörter: Electronic Commerce, Produktrezensionen, Internethandel, Elek-tronische Mundpropaganda

The Recipe for the Perfect Review?

An Investigation into the Determinants of Review Helpfulness

Online product reviews, originally intended to reduce consumers’ pre-purchasesearch and evaluation costs, have become so numerous that they are now them-selves a source for information overload. To help consumers find high-quality re-views faster, review rankings based on consumers’ evaluations of their helpfulnesswere introduced. But many reviews are never evaluated and never ranked. Moreover,current helpfulness-based systems provide little or no advice to reviewers on how towrite more helpful reviews. Average review quality and consumer search costs couldbe much improved if these issues were solved. This requires identifying the deter-minants of review helpfulness, which we carry out based on an adaption of Wangand Strong’s well-known data quality framework. Our empirical analysis shows thatreview helpfulness is influenced not only by single-review features but also by con-textual factors expressing review value relative to all available reviews. Reviews forexperiential goods differ systematically from reviews for utilitarian goods. Our find-ings, based on 27,104 reviews from Amazon.com across six product categories, formthe basis for estimating preliminary helpfulness scores for unrated reviews and fordeveloping interactive, personalized review writing support tools.

Keywords: Electronic commerce, Product reviews, Internet retailing, Electronicword-of-mouth

WIRTSCHAFTSINFORMATIK 3|2013 145

Page 12: Das Rezept für die perfekte Rezension?; The Recipe for the Perfect Review?;

WI – AUFSATZ

Cacioppo JT, Petty RE (1984) The elabora-tion likelihood model of persuasion. AdvConsum Res 11:673–675

Chen CC, Tseng Y (2011) Quality evalua-tion of product reviews using an informa-tion quality framework. Decis Support Syst50(4):755–768

Chen P, Dhanasobhon S, Smith MD (2008) Allreviews are not created equal: the disag-gregate impact of reviews and reviewersat Amazon.com. SSRN Working Paper.http://ssrn.com/abstract=918083. Abrufam 2013-02-25

Connors L, Mudambi SM, Schuff D (2011)Is it the review or the reviewer? A multi-method approach to determine the an-tecedents of online review helpfulness.In: Proceedings of the 44th Hawaii inter-national conference on systems science(HICSS), Hawaii, USA

Danescu-Niculescu-Mizil C, Kossinets G,Kleinberg JM, Lee L (2009) How opinionsare received by online communities: acase study on Amazon.com helpfulnessvotes. In: Quemada J, León G, Maarek Y,Nejdl W (Hrsg) Proceedings of the 18thinternational conference on world wideweb. ACM, New York

Dellarocas C (2003) The digitization of wordof mouth: promise and challenges ofonline feedback mechanisms. Manag Sci49(10):1407–1424

Dellarocas C, Gao G, Narayan R, (2010) Areconsumers more likely to contribute onlinereviews for hit or Niche products? J Man InfSys 27(2):127–157

Eagly AH (1974) Comprehensibility of persua-sive arguments as a determinant of opinionchange. J Pers Soc Psychol 29(6):758–773

Eagly AH, Chaiken S (1984) Cognitive theo-ries of persuasion. In: Berkowitz L (Hrsg) Ad-vances in experimental social psychology.Academic Press, San Diego, S 267–359

Feldman JM, Lynch JG (1988) Self-generatedvalidity and other effects of measurementon belief, attitude, intention, and behavior.J Appl Psychol 73(3):421–435

Folkes VS (1988) Recent attribution researchin consumer behavior: a review and newdirections. J Consum Res 14(4):548–565

Ford GT, Smith DB, Swasy JL (1990) Consumerskepticism of advertising claims: testing hy-potheses from economics of information. JConsum Res 16(4):433–441

Forman C, Ghose A, Wiesenfeld B (2008) Ex-amining the relationship between reviewsand sales: the role of reviewer identity dis-closure in electronic markets. Inf Syst Res19(3):291–313

Ghose A, Ipeirotis PG (2011) Estimating thehelpfulness and economic impact of prod-uct reviews: mining text and reviewercharacteristics. IEEE Trans Knowl Data Eng23(10):1498–1512

Greene WH (2012) Econometric analysis,7. Aufl. Prentice Hall, Upper Saddle River

Hao Y, Li Y, Zou P (2009) Why some onlineproduct reviews have no usefulness rating?In: Proceedings of the Pacific Asia confer-ence on information systems (PACIS 2009),Hyderabad, Indien, Paper 100

Herr PM, Kardes FR, Kim J (1991) Effects ofword-of-mouth and product-attribute in-formation on persuasion: an accessibility-diagnosticity perspective. J Consum Res17(4):454–462

Jain SP, Posavac SS (2001) Prepurchase at-tribute verifiability, source credibility, andpersuasion. J Consum Psychol 11(3):169–180

Jin J, Liu Y (2010) How to interpret the help-fulness of online product reviews: bridgingthe needs between customers and design-ers. In: Cortizo JC, Carrero FM, Cantador I,Troyano JA, Rosso P (Hrsg) Proceedings ofthe 2nd international workshop on searchand mining user-generated contents. ACM,New York, S 87–94

Kim S, Pantel P, Chklovski T, PennacchiottiM (2006) Automatically assessing reviewhelpfulness. In: Proceedings of the 2006conference on empirical methods in nat-ural language processing. Association forcomputational linguistics. Sydney, Austra-lien, S 423–430

Klare GR (2000) The measurement of readabil-ity: useful information for communicators.ACM J Comput Doc 24(3):11–25

Korfiatis N, Rodríguez D, Sicilia M (2008) Theimpact of readability on the usefulness ofonline product reviews: a case study onan online bookstore. In: Lytras MD, CarrollJM, Damiani E, Tennyson RD (Hrsg) Emerg-ing technologies and information systemsfor the knowledge society. Springer, Hei-delberg, S 423–432

Lahiri S, Mitra P, Lu X (2011) Informational-ity judgement at sentence level and experi-ments with formality score. In: Proceedingsof the 12th international conference oncomputational linguistics and intelligenttext processing, Tokio

Li MX, Huang L, Tan CH, Wei KK (2011) As-sessing the helpfulness of online prod-uct review: a progressive experimental ap-proach. In: Seddon PB, Gregor S (Hrsg)Proceedings of the Pacific Asia conferenceon information systems (PACIS 2011), Bris-bane, Australien, Paper 111

Li X, Hitt LM (2008) Self-selection and infor-mation role of online product reviews. InfSyst Res 19(4):456–474

Liu J, Cao Y, Lin C, Huang Y, Zhou M (2007)Low-quality product review detection inopinion summarization. In: Proceedings ofthe joint conference on empirical meth-ods in natural language processing andcomputational natural language learning(EMN-CoNLL), S 334–342

Liu Y, Huang X, An A, Yu X (2008) HelpMeter:a nonlinear model for predicting the help-fulness of online reviews. In: Proceedingsof the 2008 IEEE/WIC/ACM internationalconference on web intelligence and intelli-gent agent technology, Sydney, Australien,S 793–796

McLaughlin HG (1969) SMOG grading – a newreadability formula. J Read 12(8):639–646

Mudambi SM, Schuff D (2010) What makes ahelpful online review? A study of customerreviews on Amazon.com. MIS Q 34(1):185–200

Nelson P (1970) Information and consumerbehavior. J Polit Econ 78(20):311–329

Netzer O, Srinivasan V (2011) Adaptive self-explication of multiattribute preferences. JMark Res 48(1):140–156

Otterbacher J (2008) Managing informationin online product review communities: twoapproaches. In: Golden W, Acton T, ConboyK, van der Heijden H, Tuunainen VK (Hrsg)Proceedings of the 16th European confer-ence on information systems, S 706–717

Pan Y, Zhang JQ (2011) Born unequal: astudy of the helpfulness of user-generatedproduct reviews. J Retail 87(4):598–612

Park DY, Lee J, Han I (2007) The effect ofon-line consumer reviews on consumerpurchasing intention: the moderating roleof involvement. Int J Electron Commer11(4):125–148

Schindler RM, Bickart B (2012) Perceived help-fulness of online consumer reviews: therole of message content and style. J Con-sum Behav 11:234–243

Schlosser AE (2011) Can including pros andcons increase the helpfulness and persua-siveness of online reviews? The interactiveeffects of ratings and arguments. J ConsumPsychol 21(3):226–239

Scholz SW, Meissner M, Decker R (2010)Measuring consumer preferences for com-plex products: a compositional approachbased on paired comparisons. J Mark Res47(4):685–698

Schwenk CR (1986) Information, cognitivebiases, and commitment to a course ofaction. Acad Manag Rev 11(2):298–310

Sen S, Lerman D (2007) Why are you tellingme this? An examination into negative con-sumer reviews on the web. J Interact Mark21(4):76–94

Shannon CE (1948) A mathematical theory ofcommunication. Bell Syst Tech J 27(3):379–423

Toutanova K, Manning CD (2000) Enrichingthe knowledge sources used in a maximumentropy part-of-speech tagger. In: Proceed-ings of the joint SIGDAT conference on em-pirical methods in natural language pro-cessing and very large corpora, Hong Kong,China

Tversky A, Kahneman D (1974) Judgmentunder uncertainty: heuristics and biases.Science 185(4157):1124–1131

Wang B, Zhu W, Chen L (2011) Improvingthe Amazon review system by exploitingthe credibility and time-decay of publicreviews. Informatica 35(4):463–472

Wang RW, Strong DM (1996) Beyond accu-racy: what data quality means to dataconsumers. J Manag Inf Syst 12(4):5–33

Weathers D, Sharma S, Wood SL (2007) Effectsof online communication practices on con-sumer perceptions of performance uncer-tainty for search and experience goods. JRetail 83(4):393–401

Wright DB, London K (2009) Modern regres-sion techniques using. R. Sage, London

Wu P, van der Heijden H, Korfiatis N (2011)The influences of negativity and reviewquality on the helpfulness of online re-views. In: Galletta DF, Liang T (Hrsg) Pro-ceedings of the international conferenceon information systems, Shanghai, China

Xia L, Bechwati NN (2011) Word of mouse: therole of cognitive personalization in onlineconsumer reviews. J Interactive Advertising9(1):3–13

Xia R, Zong C, Li S (2011) Ensemble of featuresets and classification algorithms for sen-timent classification. Inf Sci 181(6):1138–1152

Zhang JQ, Craciun G, Shin D (2010) Whendoes electronic word-of-mouth matter? Astudy of consumer product reviews. J BusRes 63(12):1336–1341

Zhang R, Tran T (2010) Helpful or unhelpful:a linear approach for ranking product re-views. J Electron Commer Res 11(3):220–230

Zhang R, Tran T (2011) An information gain-based approach for recommending usefulproduct reviews. Knowl Inf Syst 26(3):419–434

Zhang Z, Varadarajan B (2006) Utility scor-ing of product reviews. In: Yu PS, TsotrasV, Fox EA, Liu B (Hrsg) Proceedings of the15th ACM international conference on in-formation and knowledge management,Arlington, Virginia. ACM, New York, S 51

146 WIRTSCHAFTSINFORMATIK 3|2013


Recommended