+ All Categories
Home > Documents > Vorlesung Marktforschung - Fakultät VII Wirtschaft & … · 2011-05-12 · Faktoranalyse. Komplexe...

Vorlesung Marktforschung - Fakultät VII Wirtschaft & … · 2011-05-12 · Faktoranalyse. Komplexe...

Date post: 17-Sep-2018
Category:
Upload: dinhdat
View: 215 times
Download: 0 times
Share this document with a friend
43
TU Berlin, Lehrstuhl Marketing Prof. Dr. V. Trommsdorff, Sekr. WIL-B-3-1, Wilmersdorfer Straße 148, 10585 Berlin, www.marketing-trommsdorff.de Vorlesung Marktforschung Multivariatenanalyse Sommersemester 2010
Transcript

TU Berlin, Lehrstuhl Marketing Prof. Dr. V. Trommsdorff, Sekr. WIL-B-3-1, Wilmersdorfer Straße 148, 10585 Berlin, www.marketing-trommsdorff.de

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Vorlesung Marktforschung

Multivariatenanalyse

Sommersemester 2010

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 2

Agenda

• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software

• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße

• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 3

vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 205; Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. XXVII

Multivariatenanalyse

Analyse von Gruppenunterschieden (Diskriminanzfunktion als „Raster“), Analyse

unterschiedlicher Markenwahrnehmung

Abhängigkeit der Käufertreue vom eigenen Marketing-Mix und von Leistungsmerkmalen

eines Wettbewerbers.Kausalanalyse

Welchen Nutzen, welche Preisbereitschaft bewirkt ein bestimmtes zusätzliches

Servicepaket beim Kunden?Conjoint-Analyse

In welchen Eigenschaften und deren Ausprägungen unterscheiden sich Kunden von

Nicht-Kunden? Diskriminanzanalyse

Hat die Farbe einer Anzeige einen Einfluß auf die Zahl der Personen, die sich an die Werbung

erinnern?Varianzanalyse

Abhängigkeit der Absatzmenge eines Produktes von Preis, Werbeausgaben und Einkommen.Regressionsanalyse

Positionierung von konkurrierenden Produktmarken im Wahrnehmungsraum der

Konsumenten.Multidimensionale

Skalierung

Gibt es bei Zeitschriften verschiedene Lesertypen?Clusteranalyse

Läst sich die Vielzahl der Eigenschaften, die Zielkunden von Autos als wichtig empfinden, auf

wenige Faktoren reduzieren?Faktoranalyse

Komplexe Wirkungsmodelle

Wichtigkeit einzelner Eigenschaften (Neuproduktentwicklung)

Auswertung von Experimenten, Wirkungsanalyse

Basisverfahren, Abhängigkeiten zwischen Variablen (Wirkungsanalyse)

Darstellung von Wahrnehmungsräumen (Ist-Analyse zur Imagepositionierung)

Gruppenbildung (intern homogen, extern heterogen; alle Eigenschaften)

Verdichtung von Items zu Dimensionen (bereitet Regression oder Clusteranalyse vor; Entwicklung

von Skalen)

Name Prinzip Beispiele

Multivariate Analysemethoden und Anwendungsbeispiele

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 4

Einführung

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 5

Multivariatenanalyse

Simultane Untersuchung von mehr als zwei Variablen.

vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 202

• Dependenzanalyse

Je nachdem, ob die zu untersuchende Variablenmenge vor der Analyse in abhängige und unabhängige Variable geteilt wird oder ungeteilt bleibt,

lassen sich die multivariaten Verfahren in zwei Gruppen einteilen:

• Interdependenzanalyse

Multivariatenanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 6

Dependenzanalyse

Bei der Dependenzanalyse wird ein Kausalzusammenhang derart unterstellt,dass eine oder mehrere Variablen (=a.V. oder Kriteriumsvariablen) von anderen Variablen (=u.V. oder Prediktoren) beeinflußt werden

vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 203

Unabhängige Variable “Ursache”

Abhängige Variable “Wirkung”

Preis

Werbung

Verkausförderung

Abverkauf

Multivariatenanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 7

Interdependenzanalyse

Bei der Interdependenzanalyse erfolgt keine Unterscheidung in abhängige und unabhängige Variablen, sondern es werden wechselseitige Beziehungen unterstellt und ohne Richtungzusammenhang analysiert

vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 203

Sparneigung

Vermögen

Einkommen

Multivariatenanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 8

Einteilung der Verfahren

Interdependenzanalysekeine Unterscheidung a.V./u.V.

Struktur- und Zusammenhangsbeschreibung

Dependenzanalyseu.V. a.V.

Erklärung, Abhängigkeiten, Kausalforschung

Clusteranalyse CA Regressionsanalyse RA

Diskriminanzanalyse DA

Faktorenanalyse FA Varianzanalyse VAMehrdimensionale Skalierung MDS Conjoint Measurement CM

Kausale Strukturanalyse LISREL

Kriterien:• Liegen Abhängigkeitshypothesen vor? (a.V. / u.V.)• Zahl der a.V. / u.V.• Messniveau (metrisch/ordinal/nominal) nach a.V. und u.V.• Aussageanspruch (explorativ/konfirmativ)

Multivariatenanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 9

MDSmehrdimensionale

Skalierung

FAFaktorenanalyse

CLUSTClusteranalyse

CMConjoint Modelle

AnovaVarianzanalyse

Input=Merkmalswerte?

Lineare Struktur?

Lineare Transform.u.V.-a.V.?

Mindestens 1 a.V.

>1 a.V.

Nomin. a.V.zulässig?

Metrische u.V.?

LiegenHypothesen

vor

KomplexeKausalstruktur?

Nomin. u.V. zulässig?

Nomin. u.V.zulässig?

CANCORRKanonische Korrelation

MANOVAMultiple ANOVA

KONTIKontingenz-

analyse

DISKDiskriminanz-

analyse

REGRRegressions

analyse

AIDAutomatic Inter-action Detection

LISRELlineare Struktur-

gleichungssysteme

nein

nein

nein

nein

nein

neinnein

nein

nein

nein

nein

ja

ja

ja

ja

ja

ja ja

ja

jaja

ja

MultivariatenanalyseVerfahrensübersicht

Multivariatenanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 10

Wichtige Ablaufschritte einer multivariaten Analyse

1. Define the research objectives and the appropriate approach

2. Develope the analysis plan

3. Evaluate the assumptions underlying the multivariate technique

4. Estimate the multivariate model and assess overall model fit

5. Interpret the results

6. (Validate the model)

vgl. Hair J., Anderson R., Tatham R., Black W., Multivariate Data Analysis, 1998, s.

Multivariatenanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 11

Agenda

• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software

• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße

• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 12

Grundlagen der Clusteranalyse

Ähnliche Objekte zusammenfassen und von unähnlichen abgrenzen

Cluster sollen deutlich strukturiert (intrahomogen, interheterogen) und sinnvoll interpretierbar sein.

Objekte nach Eigenschaften gruppieren

Anforderungen

Prinzip

Ziel

Strategische Gruppen und GeschäftseinheitenUnternehmens-OrganisationstypenKunden-Markt-Segmente, relevanter MarktLebensstile

Beispiele

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 13

Datenstrukturen

Messvariablen

Fälle

= M

esso

bjek

te

Messwerte (Ausprägungen) xij

1 ............ j .......…...... m1

.

. i .

. n

0

d (2,1) 0

d (3,1) d (3,2) .

. . .

. . . . .

d (n,1) d (n,2) . . . 0

Aus den Rohdaten ermittelte Distanzen zwischen Objekten

Rohdatenmatrix Distanzmatrix

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 14

Ablauf des hierarchisch-agglomerativen Clusterverfahren

vgl. Schuchard-Ficher et al. 1980, s. 130

2. Aus der Distanzmatrix werden die beiden Objekte/Cluster gesucht, die sich auf Grund des Distanzwertes am änlichsten sind

3. Die beiden Objekte mit der größten Änlichkeit werden zu einem neuem Cluster zusammengefaßt. Die Zahl der Cluster verringert sich somit um 1. Aus den Merkmalsausprägungen wird durch Mittelwertbildung der dazugehörige Schwerpunkt des neuen Clusters berechnet

4. Die Distanzmatrizen werden wieder um die beiden Objekte/Cluster mit der größten Änlichkeit zu einer Gruppe zusammengefaßt

Die Schritte werden maximal solange wiederholt, bis alle Objekte in einem Cluster zusammengefaßt sind. Die Entscheidung der optimalen Clusterzahl erfolgt nach sachlichen Kriterien oder nach formalen Kriterien (z.B. Innergruppenvarianz)

1. Man beginnt mit der feinsten nur möglichen Gruppierung, d.h. jedes Objekt bildetein eigenes Cluster

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 15

1. Schritt: Suche d*ij = min (dij)Hier ist d*ij = d12 = d21 = 4

2. Schritt: Bilde eine erste Gruppeaus den Objekten i und j,für welche d*ij =min (dij) ist,d.h. G1 = (1,2).

3. Schritt: Berechne die Abstände von G1zu den richtig gruppierten Objekten.Es ergibt sich:d12,3 = min (d13, d23) = d23 = 10d12,4 = min (d14, d24) = d24 = 18d12,5 = min (d15, d25) = d25 = 16

4. Schritt: Bilde die reduzierte DistanzmatrixD1 = [db’j’] (mit i’ = j’ = [12], 3, 4, 5 )

Distanzmatrix1 2 3 4 5

1 0 4 12 20 182 4 0 10 18 163 12 10 0 8 154 20 18 8 0 65 18 16 15 6 0

Reduzierte Distanzmatrix12 3 4 5

12 0 10 18 163 10 0 8 154 18 8 0 65 16 15 6 0

i,j

i,j

Beispiel zur Clustertechnik (1 von 2)

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 16

Zeichnen Sie nun

5. Schritt: Rückkehr zu Schritt 1,d.h. suche d *

i’,j’ = min (d i’,j’) = d45 = d54 = 6.Man bildet nun eine 2. Gruppe G 2 = (4,5)und berechnet die Abstände dieser Gruppezur ersten Gruppe bzw.zum noch nicht klassifizierten Objekt 3.Es ergibt sich :d12,3 = 10d = min (d , d , d , d25) = d25 = 16d 34 = 8Damit ergibt sich einenochmals reduzierte DistanzmatrixD2 = [di’’,j’’] (mit i’’ = j’’ = ([12], 3, [45]):

Nun ist zu prüfen, ob Objekt 3 der erstenoder zweiten Gruppe zuzuordnen ist.Da d*

3j’’ = min (d3j’’) = d3,45 = 8,wird Objekt 3 in g 2 aufgenommen.Als Ergebnis hat man somit folgende zwei Gruppen: G1 = (1,2); G2 = (3,4,5)

Weiter reduzierte Distanzmatrix

12 3 4512 0 10 163 10 0 845 16 8 0

ein Dendogramm

) = d12,45 24 15 14

45,3 = min (d34, d35

Beispiel zur Clustertechnik (2 von 2)

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 17

Dendogramm zur Visualisierung des Cluster-Verschmelzungs-Verlaufs

a b c d e f g

7 „Cluster“

Dis

tanz

zw

isch

en je

zw

ei C

lust

ern

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 18

Dendogramm zur Visualisierung des Cluster-Verschmelzungs-Verlaufs

a b c d e f g

3 Cluster

Dis

tanz

zw

isch

en je

zw

ei C

lust

ern

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 19

Agenda

• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software

• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße

• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 20

• Seit dem 1.1.1999 bildet der Euro die gemeinsame Währung von elf Nationalstaaten. Während die geldpolitischen Kompetenzen von da an bei der Europäischen Zentralbank liegen, verbleibt die Finanz- und Wirtschaftspolitik in nationaler Verantwortung der Mitgliedstaaten

• Damit der Euro trotz unterschiedlicherr Strukturen im Geltungsbereich eine nachhaltig stabile Währung werden kann und übermäßige Spannungen innerhalb des Währungsgebiets vermieden werden, sollen nach dem Maastrichter Vertrag nur solche Länder an der Währungsunion teilnehmen dürfen, die „stabilitäts-konvergent“ sind

• Damit ist gemeint, dass die Länder ähnliche gesamtwirtschaftliche Rahmenbedingungen in die Währungsunion einbringen und wahren sollen

Auswahl der Teilnehmer für die Währungsunion

Fallbeispiel

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 21

• Preisniveaustabilität: Der Mitgliedsstaat soll „eine anhaltende Preisstabilität“ aufweisen: Die Inflationsrate soll im letzten Jahr vor der Prüfung höchstens 1,5% über der Inflationsrate der (maximal) drei preisstabilsten Mitgliedstaaten liegen.

• Defizit des öffentlichen Haushalts: Das Defizit des öffentlichen Haushalts soll das Volumen von 3% des Bruttoinlandsprodukts nicht übersteigen.

• Schuldenstand des öffentlichen Haushalts: Der öffentliche Schuldenstand soll nicht mehr als 60% des Bruttoinlandsprodukts betragen.

• Langfristige Zinssätze: Der durchschnittliche langfristige Nominalzinssatz soll im Jahr vor der Prüfung nicht mehr als 2% über dem entsprechenden Zinssatz der (maximal) drei Mitgliedstaaten mit der höchsten Preisniveaustabilität liegen.

• Wechselkursmechanismus WKM: Das Land soll seit mindestens zwei Jahren ohne Unterbrechung am Wechselkursmechanismus des EWS teilgenommen und die „normalen Bandbreiten“ ohne große Spannungen eingehalten haben.

Konvergenzkriterien

Fallbeispiel

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 22

Kennzahlen zur Beurteilung der Konvergenz Stand März 1998

Fallbeispiel

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 23

• Belgien und Dänemark haben – nach Inflation, Defizit, Schulden, WKM und Zinssätze (quadrierte Euklidischen Distanz) die “Unähnlichkeit” von:D2

B, DK = (1,4 - 1,9)2 + (2,1 - (-0,7))2 + (122,2 - 65,1)2 + (1 - 1)2 + (5,7 - 6,2)2 = 3.268,75

• Um Cluster für die damals 15 Mitgliedstaaten der EU bilden zu können, müssen für alle Staaten-Paare solche Unähnlichkeiten berechnet werden.

• Problem: die Variablen werden in unterschiedlichen Dimensionen gemessen :• Inflationszahlen: (1,4 - 1,9)2 = 0,25• Schuldenstand: (122,2 - 65,1)2 = 3260,41

• Um das zu handhaben, werden die Variablenwerte vor der Berechnung der Distanzen standardisiert. Die übliche Standardisierung berechnet Z-Werte:

• Nach Standardisierung ist D2B, DK = 7,35.

Man kann die Ähnlichkeit von Objekt-Paaren leicht berechnen

Fallbeispiel

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 24

Aus den Distanzwerten ergibt sich ein erster Eindruck der Ähnlichkeit/Unähnlichkeit der Länder. So fällt auf, daß Griechenland (EL) zu beinahe allen anderen Ländern Distanzen über 30 aufweist, während die allermeisten anderen Distanzwerte einstellig sind

Distanzmatrix der Clusteranalyse für die 15 Mitgliedstaaten der EU

Fallbeispiel

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 25

Case 6 Clusters 5 Clusters 4 Clusters 3 Clusters 2 ClustersDeutschland 3 2 1 1 1Spanien 3 2 1 1 1Frankreich 3 2 1 1 1Niederlande 3 2 1 1 1Östereich 3 2 1 1 1Portugal 3 2 1 1 1Finnland 3 2 1 1 1Daenmark 2 2 1 1 1Irland 2 2 1 1 1Belgien 1 1 1 1 1Italien 1 1 1 1 1Schweden 6 5 4 1 1Grossbritannien 6 5 4 1 1Luxemburg 5 4 3 3 1Griechenland 4 3 2 2 2

In die Datei wurden beim Ausführen der Clusteranalyse fünf neue Variablen eingefügt. Diese Variablen geben für jedes der 15 Länder an, welchem Cluster dieses Land zuge-ordnet wird, wenn insgesamt sechs, fünf, vier, drei oder zwei Cluster gebildet werden

Tabelle mit den Cluster-Zuordnungen der 15 EU Länderfür unterschiedliche Agglomerationsstufen

Fallbeispiel

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 26

• Auffällig ist, dass Griechenland in allen vier Einteilungen stets allein ein eigenständiges Cluster bildet. Selbst wenn alle 15 Länder in nur zwei Cluster unterteilt werden, besteht ein Cluster nur aus Griechenland.

• Ohne die Betrachtung der Ausgangsdaten ist aber nicht ersichtlich, ob Griechenland eine viel günstigere oder eine viel ungünstigere Wirtschaftslage vorzuweisen hat als die übrigen 14 Länder.

• Auch Luxemburg bleibt bei sechs, fünf, vier und drei Clustern als eigenständiges Cluster erhalten.

• Werden nun ergänzend die zugrunde liegenden Ausgangsdaten herangezogen, wird deutlich, dass sich Luxemburg im positiven und Griechenland im negativen Sinne von den übrigen Ländern abheben.

• Belgien und Italien bilden bei 6 Clustern und bei 5 Clustern zusammen ein eigenes Cluster. Während die EU-Kommission im Konvergenzbericht die Teilnahme dieser Länder an der Währungsunion vom Starttermin empfahl, hob das Europäische Währungsinstitut die Haushaltsschulden hervor und kam zu einem ganz anderen Ergebnis.

• Großbritannien und Schweden, nicht von Beginn an Teilnehmer der Währungsunion: Deren Position erklärt sich daraus, dass beide Länder nicht die Voraussetzung der Teilnahme am Wechselkursmechanismus - WKS - erfüllten

Interpretation der Ergebnisse

Fallbeispiel

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 27

Variablenwahl • Inhalt• Zahl und Redundanz• Skalenniveau

Ausgangsdaten• Messwertematrix: n Objekte x m Variablen• Ähnlichkeitsmatrix: n Objekte x n Objekte

Ähnlichkeits-kriterium

Wahl des Indikators, nach dem zu entscheiden ist,welche Objekte zusammengehören (siehe Ähnlichkeitsmaße)

Distanzdefinition• Punkt-Cluster-Distanz:

nächster Clusterpunkt: single linkageentferntester Clusterpunkt: complete linkage

• Cluster-Cluster-Distanz:Zentroidverfahren

Clusterprozess• Hierarchisch: divisiv (top-down) / agglomerativ (bottom-up)• simultan• verbesserungsheuristisch (Objekte-Austausch nach erster Lösung)

Entscheidungsprobleme bei der Clusteranalyse

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 28

1. Metrische Distanzmaße

a) Euklid-Distanz

djk= { (x ij - x ik)2}1/2i

b) City-Block-Distanz

djk= { |xij - x ik|1}1/1

i

2. Metrisches Ähnlichkeitsmaß

Produkt-Moment-Korrelation (Pearson-Korrelationskoeffizient r)

j kdjk

j

k

djk

Σ

Σ

Clusteranalyse - einige Ähnlichkeitsmaße

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 29

3. Nichtmetrische Ähnlichkeitsmaße

a) Diverse Assoziationskoeffizientenb) Metrisierung metrische Maßec) Dichotomisierung nominale Maße

Beispiel für Ähnlichkeitskoeffizienten:

An zwei Kraftfahrzeugen soll das Vorhandensein bzw. das Nichtvorhandenseinvon sieben Merkmalen und der Grad der Ähnlichkeit der Objekte festgestellt werden.

1 2 3 4 5 6 71 0 1 1 0 0 1 02 1 1 0 1 0 1 0

Merkmale

Objekte

1 = Merkmal vorhanden

0 = Merkmal nicht vorhanden

TANIMOTO-Koeffizient: T = 2/5 ; Matching-Ähnlichkeits-Koeffizient: M = 4/7

Ähnlichkeitsmaße - Fortsetzung

Clusteranalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 30

Agenda

• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software

• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße

• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 31

metrische u.V.

Einkommen, AlterBilanzindicesWertePersonenmerkmale

nichtmetrische a.V.

KäufergruppenKreditwürdigkeitUrlaubsartVerkäufererfolg

Gruppierung der Fälle nach a.V.Verfahren ermittelt Trennkraft der u.V. hinsichtlich dieser Gruppen

Aus Kenntnis der u.V.-Ausprägungensollen a.V.-Ausprägungen (Gruppen) möglichst gut vorhergesagt werden.

Außerdem soll die Vorhersagekraft der u.V. quantifiziert werden

Die Diskriminanzanalyse analysiert Gruppenunterschiede (nominale a.V.) mit dem Ziel, diese optimal aus mehreren Determinanten (metrische u.V.) zu erklären und daraus die Gruppenzugehörigkeit neuer Fälle vorherzusagen

Diskriminanzanalyse

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 32

Graphische Darstellung des Trennproblems der Diskriminanzanalyse im einfachsten Fall (zwei-Gruppen, zwei-Variablen)

X2: Einkommen

X1: Alter

X2: Einkommen

X1: Alter

Risikoklasse:: Niedrig : Hoch

Beispiel: Entscheidung der Kreditwürdigkeit aus Alter und Einkommen

2211 xbxbynzfunktionDiskrimina

×+×=

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 33

Gesucht ist die Trennfunktion zur optimalen Gruppentrennung, d.h. u.V.-Linearkombination mit maximalem Verhältnis aus Zwischen- und Innergruppenvarianz (zugleich Gütekriterium)

Diskriminanzkoeffizienten

Parameter der Diskriminanzfunktion

Prognostisches Gütekriterium

Anteil der Fehlklassifikationen neuer Fälle beim Einsetzen ihrer Werte a.V., u.V. in die Diskriminanzfunktion

Diskriminanzfunktion

Elemente der Diskriminanzanalyse

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 34

Ablaufschritte einer Diskriminanzanalyse

vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 149

2- Formulierung der Diskriminanzfunktion

3- Schätzung der Diskriminanzfunktion

4- Prüfung der Diskriminanzfunktion

5- Prüfung der Merkmalsvariablen

6- Klassifizierung von neuen Elementen

1- Definition der Gruppen

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 35

1- Definition der Gruppen

Aus dem Anwendungsproblem

Ergebnis einer vorgeschalteten Analyse

Voraussetzungen

•Die Fallzahlen in den Gruppen dürfen nicht zu klein sein. •Die Anzahl der Gruppen darf die Anzahl der Variablen nicht überschreiten. •Die Variablen sind in allen Gruppen multivariat normalverteilt. •Die Kovarianzmatrizen sind in allen Gruppen gleich.

vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 150

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 36

2- Formulierung der Diskriminanzfunktion

Um eine Diskriminanzfunktion formulieren zu können, müssen erst einmal relevante Merkmalsvariablen gewählt werden

Die Diskriminanzfunktion hat allgemein die folgende Form:

JJ2110 Xb...bXbbY ⋅+++⋅+= 2X

Glied Konstantes bj riableMerkmalsva für entnzkoeffiziDiskrimina b

(u.V.) J)1,2,...,(j j riableMerkmalsva X(a.V.) nzvariableDiskrimina Y

0

j

j

=

=

===

vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 151

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 37

3- Schätzung der Diskriminanzfunktion (1)

Die Diskriminanzfunktion (Koeffizienten bj) soll so geschätzt werden,dass sie optimal zwischen den untersuchten Gruppen trennt

Die Unterscheidung zwischen 2 Gruppen ist um so besser möglich, je größer die Distanz ihrer Centroide ist, andererseits aber wird sie erschwert, wenn die Gruppen stark streuen

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 38

3- Schätzung der Diskriminanzfunktion (2)

vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 155-156

Diskriminanzkriterium

w

b

SSSS

Gruppen den in StreuungGruppen den zwischen StreuungΓ ==

( )

( )∑∑

= =

=

−=

G

1g

I

1i

2

ggi

G

1g

2

gg

g

YY

YYIΓ

Die Diskriminanzfunktion wird durch die folgende Optimierung geschätzt:

{ }Γ maxJ1 b,...,b

Kriterium, das die Gruppenunterschiedlichkeit misst

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 39

4- Prüfung der Diskriminanzfunktion (1)

Prüfung der Klassifikation

Vergleich der mit Diskriminanzfunktion bewirkten Klassifizierung der Untersuchungsobjekte mit deren tatsächlicher Gruppenzugehörigkeit

Klassifikationsmatrix

richtige Klassifizierung

falsche KlassifizierungB

falsche Klassifizierung

richtige KlassifizierungA

Tatsächliche Gruppenzugehörigkeit

B A

Prognostizierte Gruppenzugehörigkeit

vgl. Meffert H., Marktforschung, 1986, s.109vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 170

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 40

4- Prüfung der Diskriminanzfunktion (2)

vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 172-173

Prüfung der Diskriminanzkriteriums

Bildet ein Maß für die Trennkraft der Diskriminanzfunktion. hoher Eigenwert viel erklärte Varianz

Eigenwert (Maximalwert des Diskriminanzkriteriums) : γ

Kleinere Werte bedeuten höhere Trennkraft : Inverses Gütemaß.

Wilks’ Lambda :

uungGesamtstreStreuung erklärte nicht

γ11Λ =+

=

Λ

Es lässt sich in eine probabilistische Variable transformieren und erlaubt damit Warscheinlichkeitsaussagen über die Unterschiedlichkeit von Gruppen. Dadurch ist eine statistische Signifikanzprüfung der Diskriminanzfunktion möglich: χ2

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 41

5- Prüfung der Merkmalsvariablen (1)

Ziel :

Univariate Diskriminanzprüfung (Trennfähigkeit) der Merkmalsvariablen

Die Unterschiedlichkeit der Gruppen erklären

Unwichtige Variablen aus der Diskriminanzfunktion entfernen

Diskriminanz

Wilks’ Lambda

F-Wert

Signifikanzvgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 177

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 42

5- Prüfung der Merkmalsvariablen (2)

Diskriminanzkoeffizient (bj)

Drückt die diskriminatorische Bedeutung einer Merkmalsvariable aus

Standardisierter Diskriminanzkoeffizienten (bj*)

Um Skaleneffekte auszuschalten, d.h. die b-Werte vergleichbar zu machen, sind die Diskriminanzkoeffizienten zu standardisieren

j riableMerkmalsva von weichungStandardab :ssb*b

j

jjj ⋅=

Für die Beurteilung der diskriminatorischen Bedeutung spielt das Vorzeichen der Koeffizienten keine Rollevgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 177-178

Diskriminanzanalyse

Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff

Marktforschung – Multivariatenanalyse 43

6- Klassifizierung von neuen Elementen

vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 177-178

Klassifizierungsfunktionen:

Für jede Gruppe wird eine Klassifizierungsfunktion bestimmt, die linear von den gegebenen Merkmalen abhängt. Ein Objekt wird derjenigen Gruppe zugeordnet, deren

Klassifizierungsfunktion den größten Wert liefert

21B

21A

X0,247X3,61410,22FX1,280X1,7286,597F⋅+⋅+−=⋅+⋅+−= Für die Merkmalswerte:

X1 = 6 und X2 = 7FA = 12,7 FB = 13,2

Das Element ist also in die Gruppe B einzuordnen

Die Gruppenzuweisung kann auch nach dem Kriterium „Distanz zur nächsten Gruppe“ oder nach dem Kriterium „Wahrscheinlichkeit der Zugehörigkeit zu den Gruppen“ erfolgen

Diskriminanzanalyse


Recommended