Post on 05-Apr-2015
transcript
Datentabelle für 2 Merkmale
Kontingenztafel der absoluten Häufigkeiten
XY
Kontingenztafel der relativen Häufigkeiten
XY
X: Art des Betriebes 1 = Handelsbetriebe2 = Freie Berufe (Leistungsbetriebe)3 = Fertigungsbetriebe
Y: Art der hinterzogenen Steuer1 = Lohnsteuer2 = Einkommenssteuer3 = Umsatzsteuer4 = Sonstiges
Betriebe und hinterzogene SteuerKontingenztabelle
Kontingenztafel Streudiagramm
Korrelationsrechnung
G. Gelbrich: Statistik für Anwender. Shaker
Kovarianz
Merkmal
Datensatz
Merkmal
Datensatz
Korrelationskoeffizientnach Bravais-Pearson
Eigenschaften
X und Y unabhängig
X größer Y größer
X größer Y kleiner
Positiver strikter Zusammenhang
Negativer strikter Zusammenhang
Korrelationskoeffizientbei verschiedenen Konstellationen
von Ausprägungen
Korrelationskoeffizient: 0.905Korrelationskoeffizient: 1.00
Korrelationskoeffizient: 0.19Korrelationskoeffizient: 0.52
Korrelationskoeffizient: -0.14Korrelationskoeffizient: 0.00
Vorsicht beim Gebrauch des Korrelationskoeffizienten!
Fibonacci-Zahlen
Störche und Geburten
RegressionsrechnungLineare Regression
Datentabelle für 2 Merkmale
Mögliche Funktionenklassenfür die
Regressionsrechnung
Lineare FunktionenLineare Funktionen
Polynome
Exponentialfunktionen(Exponentielles Wachstum; x ist die Zeit)
Gompertz-Kurven
Logistische Funktionen
Approximation durch eine Gerade
Prinzip der kleinsten Quadrate(Kleinst-Quadrat-Schätzung)
Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrate minimiert wird:
Bestimme f, so dass
minimal !!
Aufgaben der Regressionsrechnung
Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die „Zukunft“extrapolieren. Man erstellt eine „Prognose“.Dazu bedient man sich der gefundenen Funktion f, um für eine „Zeit“ x der “Zukunft“ den Wert y = f(x)zu schätzen.
1. Extrapolation
2. Interpolation
Man interessiert sich für den Wert von y = f(x)für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachtetenWerten liegen:
Wieder bedient man sich der Funktion f, um eine Interpolation der Werte
durchzuführen.
Lineare RegressionFinde reelle Zahlen a und b,so dass der Wert von
minimal wird!
ihr Minimum annimmt!
Mit anderen Worten: Finde den „Punkt“ (a ,b), an dem die Funktion
Steigung der Regressionsgeraden
Schnitt der Regressionsgeraden mit der y-Achse bei
BestimmtheitsmaßMaß für die Güte der Anpassung der Daten an die Regressionsfunktion
Dabei ist
In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind:
X: Werbeausgaben in 1000 EuroY: Umsatzsteigerung in 10 000 Euro
Demonstrationsbeispiel Lineare Regression
Mittelwerte Varianzen
Kovarianz
Steigung der Regressionsgeraden
Schnitt der Regressionsgeraden mit der y-Achse bei