TU Berlin, Lehrstuhl Marketing Prof. Dr. V. Trommsdorff, Sekr. WIL-B-3-1, Wilmersdorfer Straße 148, 10585 Berlin, www.marketing-trommsdorff.de
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Vorlesung Marktforschung
Multivariatenanalyse
Sommersemester 2010
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 2
Agenda
• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software
• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße
• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 3
vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 205; Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. XXVII
Multivariatenanalyse
Analyse von Gruppenunterschieden (Diskriminanzfunktion als „Raster“), Analyse
unterschiedlicher Markenwahrnehmung
Abhängigkeit der Käufertreue vom eigenen Marketing-Mix und von Leistungsmerkmalen
eines Wettbewerbers.Kausalanalyse
Welchen Nutzen, welche Preisbereitschaft bewirkt ein bestimmtes zusätzliches
Servicepaket beim Kunden?Conjoint-Analyse
In welchen Eigenschaften und deren Ausprägungen unterscheiden sich Kunden von
Nicht-Kunden? Diskriminanzanalyse
Hat die Farbe einer Anzeige einen Einfluß auf die Zahl der Personen, die sich an die Werbung
erinnern?Varianzanalyse
Abhängigkeit der Absatzmenge eines Produktes von Preis, Werbeausgaben und Einkommen.Regressionsanalyse
Positionierung von konkurrierenden Produktmarken im Wahrnehmungsraum der
Konsumenten.Multidimensionale
Skalierung
Gibt es bei Zeitschriften verschiedene Lesertypen?Clusteranalyse
Läst sich die Vielzahl der Eigenschaften, die Zielkunden von Autos als wichtig empfinden, auf
wenige Faktoren reduzieren?Faktoranalyse
Komplexe Wirkungsmodelle
Wichtigkeit einzelner Eigenschaften (Neuproduktentwicklung)
Auswertung von Experimenten, Wirkungsanalyse
Basisverfahren, Abhängigkeiten zwischen Variablen (Wirkungsanalyse)
Darstellung von Wahrnehmungsräumen (Ist-Analyse zur Imagepositionierung)
Gruppenbildung (intern homogen, extern heterogen; alle Eigenschaften)
Verdichtung von Items zu Dimensionen (bereitet Regression oder Clusteranalyse vor; Entwicklung
von Skalen)
Name Prinzip Beispiele
Multivariate Analysemethoden und Anwendungsbeispiele
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 4
Einführung
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 5
Multivariatenanalyse
Simultane Untersuchung von mehr als zwei Variablen.
vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 202
• Dependenzanalyse
Je nachdem, ob die zu untersuchende Variablenmenge vor der Analyse in abhängige und unabhängige Variable geteilt wird oder ungeteilt bleibt,
lassen sich die multivariaten Verfahren in zwei Gruppen einteilen:
• Interdependenzanalyse
Multivariatenanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 6
Dependenzanalyse
Bei der Dependenzanalyse wird ein Kausalzusammenhang derart unterstellt,dass eine oder mehrere Variablen (=a.V. oder Kriteriumsvariablen) von anderen Variablen (=u.V. oder Prediktoren) beeinflußt werden
vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 203
Unabhängige Variable “Ursache”
Abhängige Variable “Wirkung”
Preis
Werbung
Verkausförderung
Abverkauf
Multivariatenanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 7
Interdependenzanalyse
Bei der Interdependenzanalyse erfolgt keine Unterscheidung in abhängige und unabhängige Variablen, sondern es werden wechselseitige Beziehungen unterstellt und ohne Richtungzusammenhang analysiert
vgl. Berekoven L., Eckert W., Ellenrieder P., Marktforschung, 2001, s. 203
Sparneigung
Vermögen
Einkommen
Multivariatenanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 8
Einteilung der Verfahren
Interdependenzanalysekeine Unterscheidung a.V./u.V.
Struktur- und Zusammenhangsbeschreibung
Dependenzanalyseu.V. a.V.
Erklärung, Abhängigkeiten, Kausalforschung
Clusteranalyse CA Regressionsanalyse RA
Diskriminanzanalyse DA
Faktorenanalyse FA Varianzanalyse VAMehrdimensionale Skalierung MDS Conjoint Measurement CM
Kausale Strukturanalyse LISREL
Kriterien:• Liegen Abhängigkeitshypothesen vor? (a.V. / u.V.)• Zahl der a.V. / u.V.• Messniveau (metrisch/ordinal/nominal) nach a.V. und u.V.• Aussageanspruch (explorativ/konfirmativ)
Multivariatenanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 9
MDSmehrdimensionale
Skalierung
FAFaktorenanalyse
CLUSTClusteranalyse
CMConjoint Modelle
AnovaVarianzanalyse
Input=Merkmalswerte?
Lineare Struktur?
Lineare Transform.u.V.-a.V.?
Mindestens 1 a.V.
>1 a.V.
Nomin. a.V.zulässig?
Metrische u.V.?
LiegenHypothesen
vor
KomplexeKausalstruktur?
Nomin. u.V. zulässig?
Nomin. u.V.zulässig?
CANCORRKanonische Korrelation
MANOVAMultiple ANOVA
KONTIKontingenz-
analyse
DISKDiskriminanz-
analyse
REGRRegressions
analyse
AIDAutomatic Inter-action Detection
LISRELlineare Struktur-
gleichungssysteme
nein
nein
nein
nein
nein
neinnein
nein
nein
nein
nein
ja
ja
ja
ja
ja
ja ja
ja
jaja
ja
MultivariatenanalyseVerfahrensübersicht
Multivariatenanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 10
Wichtige Ablaufschritte einer multivariaten Analyse
1. Define the research objectives and the appropriate approach
2. Develope the analysis plan
3. Evaluate the assumptions underlying the multivariate technique
4. Estimate the multivariate model and assess overall model fit
5. Interpret the results
6. (Validate the model)
vgl. Hair J., Anderson R., Tatham R., Black W., Multivariate Data Analysis, 1998, s.
Multivariatenanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 11
Agenda
• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software
• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße
• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 12
Grundlagen der Clusteranalyse
Ähnliche Objekte zusammenfassen und von unähnlichen abgrenzen
Cluster sollen deutlich strukturiert (intrahomogen, interheterogen) und sinnvoll interpretierbar sein.
Objekte nach Eigenschaften gruppieren
Anforderungen
Prinzip
Ziel
Strategische Gruppen und GeschäftseinheitenUnternehmens-OrganisationstypenKunden-Markt-Segmente, relevanter MarktLebensstile
Beispiele
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 13
Datenstrukturen
Messvariablen
Fälle
= M
esso
bjek
te
Messwerte (Ausprägungen) xij
1 ............ j .......…...... m1
.
. i .
. n
0
d (2,1) 0
d (3,1) d (3,2) .
. . .
. . . . .
d (n,1) d (n,2) . . . 0
Aus den Rohdaten ermittelte Distanzen zwischen Objekten
Rohdatenmatrix Distanzmatrix
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 14
Ablauf des hierarchisch-agglomerativen Clusterverfahren
vgl. Schuchard-Ficher et al. 1980, s. 130
2. Aus der Distanzmatrix werden die beiden Objekte/Cluster gesucht, die sich auf Grund des Distanzwertes am änlichsten sind
3. Die beiden Objekte mit der größten Änlichkeit werden zu einem neuem Cluster zusammengefaßt. Die Zahl der Cluster verringert sich somit um 1. Aus den Merkmalsausprägungen wird durch Mittelwertbildung der dazugehörige Schwerpunkt des neuen Clusters berechnet
4. Die Distanzmatrizen werden wieder um die beiden Objekte/Cluster mit der größten Änlichkeit zu einer Gruppe zusammengefaßt
Die Schritte werden maximal solange wiederholt, bis alle Objekte in einem Cluster zusammengefaßt sind. Die Entscheidung der optimalen Clusterzahl erfolgt nach sachlichen Kriterien oder nach formalen Kriterien (z.B. Innergruppenvarianz)
1. Man beginnt mit der feinsten nur möglichen Gruppierung, d.h. jedes Objekt bildetein eigenes Cluster
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 15
1. Schritt: Suche d*ij = min (dij)Hier ist d*ij = d12 = d21 = 4
2. Schritt: Bilde eine erste Gruppeaus den Objekten i und j,für welche d*ij =min (dij) ist,d.h. G1 = (1,2).
3. Schritt: Berechne die Abstände von G1zu den richtig gruppierten Objekten.Es ergibt sich:d12,3 = min (d13, d23) = d23 = 10d12,4 = min (d14, d24) = d24 = 18d12,5 = min (d15, d25) = d25 = 16
4. Schritt: Bilde die reduzierte DistanzmatrixD1 = [db’j’] (mit i’ = j’ = [12], 3, 4, 5 )
Distanzmatrix1 2 3 4 5
1 0 4 12 20 182 4 0 10 18 163 12 10 0 8 154 20 18 8 0 65 18 16 15 6 0
Reduzierte Distanzmatrix12 3 4 5
12 0 10 18 163 10 0 8 154 18 8 0 65 16 15 6 0
i,j
i,j
Beispiel zur Clustertechnik (1 von 2)
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 16
Zeichnen Sie nun
5. Schritt: Rückkehr zu Schritt 1,d.h. suche d *
i’,j’ = min (d i’,j’) = d45 = d54 = 6.Man bildet nun eine 2. Gruppe G 2 = (4,5)und berechnet die Abstände dieser Gruppezur ersten Gruppe bzw.zum noch nicht klassifizierten Objekt 3.Es ergibt sich :d12,3 = 10d = min (d , d , d , d25) = d25 = 16d 34 = 8Damit ergibt sich einenochmals reduzierte DistanzmatrixD2 = [di’’,j’’] (mit i’’ = j’’ = ([12], 3, [45]):
Nun ist zu prüfen, ob Objekt 3 der erstenoder zweiten Gruppe zuzuordnen ist.Da d*
3j’’ = min (d3j’’) = d3,45 = 8,wird Objekt 3 in g 2 aufgenommen.Als Ergebnis hat man somit folgende zwei Gruppen: G1 = (1,2); G2 = (3,4,5)
Weiter reduzierte Distanzmatrix
12 3 4512 0 10 163 10 0 845 16 8 0
ein Dendogramm
) = d12,45 24 15 14
45,3 = min (d34, d35
Beispiel zur Clustertechnik (2 von 2)
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 17
Dendogramm zur Visualisierung des Cluster-Verschmelzungs-Verlaufs
a b c d e f g
7 „Cluster“
Dis
tanz
zw
isch
en je
zw
ei C
lust
ern
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 18
Dendogramm zur Visualisierung des Cluster-Verschmelzungs-Verlaufs
a b c d e f g
3 Cluster
Dis
tanz
zw
isch
en je
zw
ei C
lust
ern
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 19
Agenda
• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software
• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße
• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 20
• Seit dem 1.1.1999 bildet der Euro die gemeinsame Währung von elf Nationalstaaten. Während die geldpolitischen Kompetenzen von da an bei der Europäischen Zentralbank liegen, verbleibt die Finanz- und Wirtschaftspolitik in nationaler Verantwortung der Mitgliedstaaten
• Damit der Euro trotz unterschiedlicherr Strukturen im Geltungsbereich eine nachhaltig stabile Währung werden kann und übermäßige Spannungen innerhalb des Währungsgebiets vermieden werden, sollen nach dem Maastrichter Vertrag nur solche Länder an der Währungsunion teilnehmen dürfen, die „stabilitäts-konvergent“ sind
• Damit ist gemeint, dass die Länder ähnliche gesamtwirtschaftliche Rahmenbedingungen in die Währungsunion einbringen und wahren sollen
Auswahl der Teilnehmer für die Währungsunion
Fallbeispiel
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 21
• Preisniveaustabilität: Der Mitgliedsstaat soll „eine anhaltende Preisstabilität“ aufweisen: Die Inflationsrate soll im letzten Jahr vor der Prüfung höchstens 1,5% über der Inflationsrate der (maximal) drei preisstabilsten Mitgliedstaaten liegen.
• Defizit des öffentlichen Haushalts: Das Defizit des öffentlichen Haushalts soll das Volumen von 3% des Bruttoinlandsprodukts nicht übersteigen.
• Schuldenstand des öffentlichen Haushalts: Der öffentliche Schuldenstand soll nicht mehr als 60% des Bruttoinlandsprodukts betragen.
• Langfristige Zinssätze: Der durchschnittliche langfristige Nominalzinssatz soll im Jahr vor der Prüfung nicht mehr als 2% über dem entsprechenden Zinssatz der (maximal) drei Mitgliedstaaten mit der höchsten Preisniveaustabilität liegen.
• Wechselkursmechanismus WKM: Das Land soll seit mindestens zwei Jahren ohne Unterbrechung am Wechselkursmechanismus des EWS teilgenommen und die „normalen Bandbreiten“ ohne große Spannungen eingehalten haben.
Konvergenzkriterien
Fallbeispiel
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 22
Kennzahlen zur Beurteilung der Konvergenz Stand März 1998
Fallbeispiel
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 23
• Belgien und Dänemark haben – nach Inflation, Defizit, Schulden, WKM und Zinssätze (quadrierte Euklidischen Distanz) die “Unähnlichkeit” von:D2
B, DK = (1,4 - 1,9)2 + (2,1 - (-0,7))2 + (122,2 - 65,1)2 + (1 - 1)2 + (5,7 - 6,2)2 = 3.268,75
• Um Cluster für die damals 15 Mitgliedstaaten der EU bilden zu können, müssen für alle Staaten-Paare solche Unähnlichkeiten berechnet werden.
• Problem: die Variablen werden in unterschiedlichen Dimensionen gemessen :• Inflationszahlen: (1,4 - 1,9)2 = 0,25• Schuldenstand: (122,2 - 65,1)2 = 3260,41
• Um das zu handhaben, werden die Variablenwerte vor der Berechnung der Distanzen standardisiert. Die übliche Standardisierung berechnet Z-Werte:
• Nach Standardisierung ist D2B, DK = 7,35.
Man kann die Ähnlichkeit von Objekt-Paaren leicht berechnen
Fallbeispiel
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 24
Aus den Distanzwerten ergibt sich ein erster Eindruck der Ähnlichkeit/Unähnlichkeit der Länder. So fällt auf, daß Griechenland (EL) zu beinahe allen anderen Ländern Distanzen über 30 aufweist, während die allermeisten anderen Distanzwerte einstellig sind
Distanzmatrix der Clusteranalyse für die 15 Mitgliedstaaten der EU
Fallbeispiel
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 25
Case 6 Clusters 5 Clusters 4 Clusters 3 Clusters 2 ClustersDeutschland 3 2 1 1 1Spanien 3 2 1 1 1Frankreich 3 2 1 1 1Niederlande 3 2 1 1 1Östereich 3 2 1 1 1Portugal 3 2 1 1 1Finnland 3 2 1 1 1Daenmark 2 2 1 1 1Irland 2 2 1 1 1Belgien 1 1 1 1 1Italien 1 1 1 1 1Schweden 6 5 4 1 1Grossbritannien 6 5 4 1 1Luxemburg 5 4 3 3 1Griechenland 4 3 2 2 2
In die Datei wurden beim Ausführen der Clusteranalyse fünf neue Variablen eingefügt. Diese Variablen geben für jedes der 15 Länder an, welchem Cluster dieses Land zuge-ordnet wird, wenn insgesamt sechs, fünf, vier, drei oder zwei Cluster gebildet werden
Tabelle mit den Cluster-Zuordnungen der 15 EU Länderfür unterschiedliche Agglomerationsstufen
Fallbeispiel
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 26
• Auffällig ist, dass Griechenland in allen vier Einteilungen stets allein ein eigenständiges Cluster bildet. Selbst wenn alle 15 Länder in nur zwei Cluster unterteilt werden, besteht ein Cluster nur aus Griechenland.
• Ohne die Betrachtung der Ausgangsdaten ist aber nicht ersichtlich, ob Griechenland eine viel günstigere oder eine viel ungünstigere Wirtschaftslage vorzuweisen hat als die übrigen 14 Länder.
• Auch Luxemburg bleibt bei sechs, fünf, vier und drei Clustern als eigenständiges Cluster erhalten.
• Werden nun ergänzend die zugrunde liegenden Ausgangsdaten herangezogen, wird deutlich, dass sich Luxemburg im positiven und Griechenland im negativen Sinne von den übrigen Ländern abheben.
• Belgien und Italien bilden bei 6 Clustern und bei 5 Clustern zusammen ein eigenes Cluster. Während die EU-Kommission im Konvergenzbericht die Teilnahme dieser Länder an der Währungsunion vom Starttermin empfahl, hob das Europäische Währungsinstitut die Haushaltsschulden hervor und kam zu einem ganz anderen Ergebnis.
• Großbritannien und Schweden, nicht von Beginn an Teilnehmer der Währungsunion: Deren Position erklärt sich daraus, dass beide Länder nicht die Voraussetzung der Teilnahme am Wechselkursmechanismus - WKS - erfüllten
Interpretation der Ergebnisse
Fallbeispiel
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 27
Variablenwahl • Inhalt• Zahl und Redundanz• Skalenniveau
Ausgangsdaten• Messwertematrix: n Objekte x m Variablen• Ähnlichkeitsmatrix: n Objekte x n Objekte
Ähnlichkeits-kriterium
Wahl des Indikators, nach dem zu entscheiden ist,welche Objekte zusammengehören (siehe Ähnlichkeitsmaße)
Distanzdefinition• Punkt-Cluster-Distanz:
nächster Clusterpunkt: single linkageentferntester Clusterpunkt: complete linkage
• Cluster-Cluster-Distanz:Zentroidverfahren
Clusterprozess• Hierarchisch: divisiv (top-down) / agglomerativ (bottom-up)• simultan• verbesserungsheuristisch (Objekte-Austausch nach erster Lösung)
Entscheidungsprobleme bei der Clusteranalyse
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 28
1. Metrische Distanzmaße
a) Euklid-Distanz
djk= { (x ij - x ik)2}1/2i
b) City-Block-Distanz
djk= { |xij - x ik|1}1/1
i
2. Metrisches Ähnlichkeitsmaß
Produkt-Moment-Korrelation (Pearson-Korrelationskoeffizient r)
j kdjk
j
k
djk
Σ
Σ
Clusteranalyse - einige Ähnlichkeitsmaße
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 29
3. Nichtmetrische Ähnlichkeitsmaße
a) Diverse Assoziationskoeffizientenb) Metrisierung metrische Maßec) Dichotomisierung nominale Maße
Beispiel für Ähnlichkeitskoeffizienten:
An zwei Kraftfahrzeugen soll das Vorhandensein bzw. das Nichtvorhandenseinvon sieben Merkmalen und der Grad der Ähnlichkeit der Objekte festgestellt werden.
1 2 3 4 5 6 71 0 1 1 0 0 1 02 1 1 0 1 0 1 0
Merkmale
Objekte
1 = Merkmal vorhanden
0 = Merkmal nicht vorhanden
TANIMOTO-Koeffizient: T = 2/5 ; Matching-Ähnlichkeits-Koeffizient: M = 4/7
Ähnlichkeitsmaße - Fortsetzung
Clusteranalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 30
Agenda
• Multivariatenanalyse• Dependenz und Interdependenz• Die Verfahren: Einteilung / Übersicht / Beispiele• Ablaufschritte einer Multivariatenanalyse• Software
• Clusteranalyse• Grundlagen• Beispiel der Clustertechnik• Dendogramm• Fallbeispiel• Entscheidungsprobleme• Ähnlichkeitsmaße
• Diskriminanzanalyse• Grundlagen• Graphische Darstellung• Ablaufschritte einer Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 31
metrische u.V.
Einkommen, AlterBilanzindicesWertePersonenmerkmale
nichtmetrische a.V.
KäufergruppenKreditwürdigkeitUrlaubsartVerkäufererfolg
Gruppierung der Fälle nach a.V.Verfahren ermittelt Trennkraft der u.V. hinsichtlich dieser Gruppen
Aus Kenntnis der u.V.-Ausprägungensollen a.V.-Ausprägungen (Gruppen) möglichst gut vorhergesagt werden.
Außerdem soll die Vorhersagekraft der u.V. quantifiziert werden
Die Diskriminanzanalyse analysiert Gruppenunterschiede (nominale a.V.) mit dem Ziel, diese optimal aus mehreren Determinanten (metrische u.V.) zu erklären und daraus die Gruppenzugehörigkeit neuer Fälle vorherzusagen
Diskriminanzanalyse
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 32
Graphische Darstellung des Trennproblems der Diskriminanzanalyse im einfachsten Fall (zwei-Gruppen, zwei-Variablen)
X2: Einkommen
X1: Alter
X2: Einkommen
X1: Alter
Risikoklasse:: Niedrig : Hoch
Beispiel: Entscheidung der Kreditwürdigkeit aus Alter und Einkommen
2211 xbxbynzfunktionDiskrimina
×+×=
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 33
Gesucht ist die Trennfunktion zur optimalen Gruppentrennung, d.h. u.V.-Linearkombination mit maximalem Verhältnis aus Zwischen- und Innergruppenvarianz (zugleich Gütekriterium)
Diskriminanzkoeffizienten
Parameter der Diskriminanzfunktion
Prognostisches Gütekriterium
Anteil der Fehlklassifikationen neuer Fälle beim Einsetzen ihrer Werte a.V., u.V. in die Diskriminanzfunktion
Diskriminanzfunktion
Elemente der Diskriminanzanalyse
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 34
Ablaufschritte einer Diskriminanzanalyse
vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 149
2- Formulierung der Diskriminanzfunktion
3- Schätzung der Diskriminanzfunktion
4- Prüfung der Diskriminanzfunktion
5- Prüfung der Merkmalsvariablen
6- Klassifizierung von neuen Elementen
1- Definition der Gruppen
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 35
1- Definition der Gruppen
Aus dem Anwendungsproblem
Ergebnis einer vorgeschalteten Analyse
Voraussetzungen
•Die Fallzahlen in den Gruppen dürfen nicht zu klein sein. •Die Anzahl der Gruppen darf die Anzahl der Variablen nicht überschreiten. •Die Variablen sind in allen Gruppen multivariat normalverteilt. •Die Kovarianzmatrizen sind in allen Gruppen gleich.
vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 150
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 36
2- Formulierung der Diskriminanzfunktion
Um eine Diskriminanzfunktion formulieren zu können, müssen erst einmal relevante Merkmalsvariablen gewählt werden
Die Diskriminanzfunktion hat allgemein die folgende Form:
JJ2110 Xb...bXbbY ⋅+++⋅+= 2X
Glied Konstantes bj riableMerkmalsva für entnzkoeffiziDiskrimina b
(u.V.) J)1,2,...,(j j riableMerkmalsva X(a.V.) nzvariableDiskrimina Y
0
j
j
=
=
===
vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 151
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 37
3- Schätzung der Diskriminanzfunktion (1)
Die Diskriminanzfunktion (Koeffizienten bj) soll so geschätzt werden,dass sie optimal zwischen den untersuchten Gruppen trennt
Die Unterscheidung zwischen 2 Gruppen ist um so besser möglich, je größer die Distanz ihrer Centroide ist, andererseits aber wird sie erschwert, wenn die Gruppen stark streuen
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 38
3- Schätzung der Diskriminanzfunktion (2)
vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 155-156
Diskriminanzkriterium
w
b
SSSS
Gruppen den in StreuungGruppen den zwischen StreuungΓ ==
( )
( )∑∑
∑
= =
=
−
−=
G
1g
I
1i
2
ggi
G
1g
2
gg
g
YY
YYIΓ
Die Diskriminanzfunktion wird durch die folgende Optimierung geschätzt:
{ }Γ maxJ1 b,...,b
Kriterium, das die Gruppenunterschiedlichkeit misst
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 39
4- Prüfung der Diskriminanzfunktion (1)
Prüfung der Klassifikation
Vergleich der mit Diskriminanzfunktion bewirkten Klassifizierung der Untersuchungsobjekte mit deren tatsächlicher Gruppenzugehörigkeit
Klassifikationsmatrix
richtige Klassifizierung
falsche KlassifizierungB
falsche Klassifizierung
richtige KlassifizierungA
Tatsächliche Gruppenzugehörigkeit
B A
Prognostizierte Gruppenzugehörigkeit
vgl. Meffert H., Marktforschung, 1986, s.109vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 170
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 40
4- Prüfung der Diskriminanzfunktion (2)
vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 172-173
Prüfung der Diskriminanzkriteriums
Bildet ein Maß für die Trennkraft der Diskriminanzfunktion. hoher Eigenwert viel erklärte Varianz
Eigenwert (Maximalwert des Diskriminanzkriteriums) : γ
Kleinere Werte bedeuten höhere Trennkraft : Inverses Gütemaß.
Wilks’ Lambda :
uungGesamtstreStreuung erklärte nicht
γ11Λ =+
=
Λ
Es lässt sich in eine probabilistische Variable transformieren und erlaubt damit Warscheinlichkeitsaussagen über die Unterschiedlichkeit von Gruppen. Dadurch ist eine statistische Signifikanzprüfung der Diskriminanzfunktion möglich: χ2
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 41
5- Prüfung der Merkmalsvariablen (1)
Ziel :
Univariate Diskriminanzprüfung (Trennfähigkeit) der Merkmalsvariablen
Die Unterschiedlichkeit der Gruppen erklären
Unwichtige Variablen aus der Diskriminanzfunktion entfernen
Diskriminanz
Wilks’ Lambda
F-Wert
Signifikanzvgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 177
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 42
5- Prüfung der Merkmalsvariablen (2)
Diskriminanzkoeffizient (bj)
Drückt die diskriminatorische Bedeutung einer Merkmalsvariable aus
Standardisierter Diskriminanzkoeffizienten (bj*)
Um Skaleneffekte auszuschalten, d.h. die b-Werte vergleichbar zu machen, sind die Diskriminanzkoeffizienten zu standardisieren
j riableMerkmalsva von weichungStandardab :ssb*b
j
jjj ⋅=
Für die Beurteilung der diskriminatorischen Bedeutung spielt das Vorzeichen der Koeffizienten keine Rollevgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 177-178
Diskriminanzanalyse
Technische Universität BerlinLehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Multivariatenanalyse 43
6- Klassifizierung von neuen Elementen
vgl. Backhaus K., Erichson B., Plinke W., Weiber R., Multivariate Analysemethoden, 2000, s. 177-178
Klassifizierungsfunktionen:
Für jede Gruppe wird eine Klassifizierungsfunktion bestimmt, die linear von den gegebenen Merkmalen abhängt. Ein Objekt wird derjenigen Gruppe zugeordnet, deren
Klassifizierungsfunktion den größten Wert liefert
21B
21A
X0,247X3,61410,22FX1,280X1,7286,597F⋅+⋅+−=⋅+⋅+−= Für die Merkmalswerte:
X1 = 6 und X2 = 7FA = 12,7 FB = 13,2
Das Element ist also in die Gruppe B einzuordnen
Die Gruppenzuweisung kann auch nach dem Kriterium „Distanz zur nächsten Gruppe“ oder nach dem Kriterium „Wahrscheinlichkeit der Zugehörigkeit zu den Gruppen“ erfolgen
Diskriminanzanalyse