+ All Categories
Home > Documents > Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben; Representativity of...

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben; Representativity of...

Date post: 23-Dec-2016
Category:
Upload: andreas
View: 212 times
Download: 0 times
Share this document with a friend
15
AStA Wirtsch Sozialstat Arch (2013) 7:105–119 DOI 10.1007/s11943-013-0132-3 ORIGINALVERÖFFENTLICHUNG Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben Siegfried Gabler · Andreas Quatember Eingegangen: 11. Februar 2013 / Angenommen: 31. Oktober 2013 / Online publiziert: 12. November 2013 © Springer-Verlag Berlin Heidelberg 2013 Zusammenfassung Der Begriff „repräsentative Stichprobe“ findet sich in praktisch allen Berichten über Umfragen. Im Allgemeinen wird darunter vage verstanden, dass die Stichprobe ein verkleinertes Abbild der Grundgesamtheit sei. Eine wissenschaft- liche Definition des Begriffes aber sollte alle wesentlichen Qualitätskriterien einer Stichprobenerhebung beinhalten. In diesem Aufsatz wird eine solche Definition dis- kutiert. Diese berücksichtigt neben theoretischen Aspekten des Stichprobendesigns wie Stichprobenverfahren und Schätzmethode auch die sogar in Populationserhebun- gen auftretenden praktischen Faktoren wie Antwortausfälle und Falschantworten. Ist dieses Stichprobensystem gegeben, dann bestimmt der gewählte Stichprobenumfang den Stichprobenfehler der Erhebung. Die Frage des für eine gewünschte Genauig- keit notwendigen Stichprobenumfangs wird diskutiert. Darauf aufbauend findet eine Auseinandersetzung mit der in der Praxis der Umfragen häufig auftretenden Frage- stellung der bei geschichteten Zufallsstichproben benötigten Stichprobenumfänge in einzelnen Subgruppen statt. Diese sollen Repräsentativität in jeder einzelnen Sub- gruppe gewährleisten. Die Lösung dieses Problems liefert eine konvexe Minimie- rungsaufgabe mit unteren und oberen Schranken und linearen Ungleichungen als Ne- benbedingungen. Ein numerisches Beispiel veranschaulicht ganz konkret die vorge- schlagene Vorgehensweise. Schlüsselwörter Stichprobenerhebung · Schwankungsbreite · Designeffekt · konvexe Minimierung JEL Klassifikationen C83 PD Dr. S. Gabler (B ) GESIS – Leibniz-Institut für Sozialwissenschaften B 1, 2, 68159 Mannheim, Deutschland e-mail: [email protected] Dr. A. Quatember IFAS – Institut für Angewandte Statistik, Johannes Kepler Universität Linz, Altenberger Straße 69, 4040 Linz, Österreich e-mail: [email protected]
Transcript

AStA Wirtsch Sozialstat Arch (2013) 7:105–119DOI 10.1007/s11943-013-0132-3

O R I G I NA LV E RÖ F F E N T L I C H U N G

Repräsentativität von Subgruppen bei geschichtetenZufallsstichproben

Siegfried Gabler · Andreas Quatember

Eingegangen: 11. Februar 2013 / Angenommen: 31. Oktober 2013 /Online publiziert: 12. November 2013© Springer-Verlag Berlin Heidelberg 2013

Zusammenfassung Der Begriff „repräsentative Stichprobe“ findet sich in praktischallen Berichten über Umfragen. Im Allgemeinen wird darunter vage verstanden, dassdie Stichprobe ein verkleinertes Abbild der Grundgesamtheit sei. Eine wissenschaft-liche Definition des Begriffes aber sollte alle wesentlichen Qualitätskriterien einerStichprobenerhebung beinhalten. In diesem Aufsatz wird eine solche Definition dis-kutiert. Diese berücksichtigt neben theoretischen Aspekten des Stichprobendesignswie Stichprobenverfahren und Schätzmethode auch die sogar in Populationserhebun-gen auftretenden praktischen Faktoren wie Antwortausfälle und Falschantworten. Istdieses Stichprobensystem gegeben, dann bestimmt der gewählte Stichprobenumfangden Stichprobenfehler der Erhebung. Die Frage des für eine gewünschte Genauig-keit notwendigen Stichprobenumfangs wird diskutiert. Darauf aufbauend findet eineAuseinandersetzung mit der in der Praxis der Umfragen häufig auftretenden Frage-stellung der bei geschichteten Zufallsstichproben benötigten Stichprobenumfänge ineinzelnen Subgruppen statt. Diese sollen Repräsentativität in jeder einzelnen Sub-gruppe gewährleisten. Die Lösung dieses Problems liefert eine konvexe Minimie-rungsaufgabe mit unteren und oberen Schranken und linearen Ungleichungen als Ne-benbedingungen. Ein numerisches Beispiel veranschaulicht ganz konkret die vorge-schlagene Vorgehensweise.

Schlüsselwörter Stichprobenerhebung · Schwankungsbreite · Designeffekt ·konvexe Minimierung

JEL Klassifikationen C83

PD Dr. S. Gabler (B)GESIS – Leibniz-Institut für Sozialwissenschaften B 1, 2, 68159 Mannheim, Deutschlande-mail: [email protected]

Dr. A. QuatemberIFAS – Institut für Angewandte Statistik, Johannes Kepler Universität Linz, Altenberger Straße 69,4040 Linz, Österreiche-mail: [email protected]

106 S. Gabler, A. Quatember

Representativity of subgroups in stratified random samples

Abstract The concept of a representative sample can be found in nearly every surveydescription. In general, this means that the sample is a miniature of the population.A scientific definition of the term should include all important aspects of a samplesurvey. In this paper such a definition is discussed. Besides the theoretical aspectsof the sample design such as the sampling method and the estimation technique, itcomprises practical aspects occurring also in population surveys such as nonresponseand untruthful answering. Given this sample design, the chosen sample number de-termines the survey’s sampling error. The question of the necessary sample numberfor a certain efficiency of the estimator is discussed. Based on that, the question onthe sample numbers in subgroups of a stratified random sample, relevant in practice,is considered. These sample numbers have to allow for representativeness in eachsubgroup. The solution of this problem can be described by a convex minimizationprogram under box constraints and linear inequality constraints. A numerical exam-ple illustrates the proposed procedure.

Keywords Sample Survey · Band width · Design effect · Convex minimization

1 Einleitung

Stichprobenerhebungen sind in unserer Wissensgesellschaft als eine Quelle objekti-ver Informationen zu interessierenden Fragestellungen unterschiedlichster Wertigkeitnicht mehr wegzudenken. Tagtäglich berichten verschiedenste Medien von diesbe-züglichen Ergebnissen, stützen sich Entscheidungen unterschiedlichster Tragweiteauf deren Resultate und werden neue Erhebungen in Auftrag gegeben und durchge-führt. Dabei stellt sich natürlich die Frage nach der Qualität der auf der Basis vonStichprobenerhebungen gezogenen Rückschlüsse auf Populationen. Es sind unter-schiedlichste Aspekte einer Stichprobenerhebung, die sich auf diese Qualität auswir-ken können. Dazu gehören solche wie das gewählte Stichprobenverfahren oder derStichprobenumfang, die den Stichprobenfehler beeinflussen, und auch solche wie dieAntwortbereitschaft oder die Antreffbarkeit der Befragten, die sich als Nichtstichpro-benfehler auch bei einer Vollerhebung auf die Qualität der erhobenen Daten auswir-ken können.

Im Abschn. 2 soll deshalb am Begriff der Repräsentativität zuerst verdeutlichtwerden, dass der Stichprobenumfang einer Erhebung ein wesentlicher, jedoch nichtder einzige Aspekt ist, der die Qualität von Rückschlüssen von Stichproben auf Popu-lationen durch Punkt- oder Intervallschätzung beeinflusst. Der darauf folgende Ab-schn. 3 beschäftigt sich mit der Frage der erforderlichen Stichprobenumfänge fürverschiedene Stichprobenverfahren. Der zentrale Abschn. 4 setzt sich mit der in derPraxis der Umfragen häufig auftretenden Fragestellung der bei geschichteten Zufalls-stichproben benötigten Stichprobenumfänge in den einzelnen Subgruppen auseinan-der, die Repräsentativität in diesen gewährleisten. Ein abschließendes numerischesBeispiel veranschaulicht die vorgeschlagene Prozedur.

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben 107

2 Diskussion über die Repräsentativität einer Stichprobe

Der Begriff der Repräsentativität einer Stichprobe ist ein in Hinblick auf die Qua-lität von Stichprobenerhebungen häufig gebrauchter Terminus. In Zeitungen liestman von „repräsentativen Umfragen“, „Resultaten einer repräsentativen Stichpro-be“ oder „Ergebnissen einer Repräsentativstudie“. Dabei bleibt der Inhalt des Be-griffes zumindest vage – wie dies auch etwa in Gabler (1996) festgehalten wird.So wird im Allgemeinen wohl darunter verstanden, dass die Zusammensetzung ei-ner erhobenen Stichprobe jener der Grundgesamtheit in Bezug auf als wesentlichempfundene Merkmale ähnlich ist und die Stichprobenergebnisse deshalb auf diePopulation übertragbar sind (vgl. etwa den Überblick über seine Verwendung in:Kruskal und Mosteller 1979a, 1979b, 1979c, 1980). Manche exaktere Definitions-versuche wie beispielsweise: „Eine Stichprobe ist repräsentativ, wenn jedem Ele-ment der Grundgesamtheit die gleiche, berechenbare und von Null verschiedeneAuswahlchance zugeordnet werden kann und die einzelnen Stichprobenelemente zu-fällig ausgewählt werden“ (ADM-Arbeitskreis Arbeitkreis Deutscher Markt- undSozialforschungsinstitute e.V.; AG.MA Arbeitsgemeinschaft Media-Analyse e.V.,1999, S. 28), erweisen sich hingegen als ungeeignet. Nach der zitierten Auffas-sung wäre eine große nationale Stichprobenerhebung wie die Stichprobe des Zen-sus 2011 oder Telefonstichproben per definitionem nicht repräsentativ für die be-treffenden Populationen. Probleme mit dem Begriff der Repräsentativität haben un-ter anderen Quatember (1996a), Schnell (1997) oder Von der Lippe und Kladro-ba (2002) aufgezeigt. Gerade in letzter Zeit ist erfreulicherweise eine verstärk-te Diskussion um den Inhalt dieses Begriffes feststellbar (vgl. etwa Bosch 2012;Gabler und Quatember 2012).

Eine wissenschaftliche Auseinandersetzung mit dem Repräsentativitätsbegriffsollte jene Faktoren beinhalten, welche den durch diesen Begriff in Bezug auf Stich-probenergebnisse suggerierten Qualitätsnachweis beeinflussen. Aufbauend auf Krei-enbrock (1989), Bortz und Döring (1995), Quatember (1996a) und Gabler und Qua-tember (2012) wird folgende – im oben genannten Sinne umfassende – Begriffsbe-stimmung vorgeschlagen:

Eine Stichprobe (oder ein Stichprobenergebnis) ist für eine Population hinsichtlicheiner interessierenden Verteilung oder eines diese Verteilung charakterisierenden Pa-rameters repräsentativ, wenn diese Verteilung oder der Parameter damit (zumindestnäherungsweise) unverzerrt geschätzt werden können und bei dieser Schätzung aucheine gewünschte Genauigkeit eingehalten wird.

Diese im Nachfolgenden zu diskutierende inhaltliche Erklärung des Begriffesbesteht in ihrem Kern aus dem statistischen Konzept der Unverzerrtheit und ei-ner gleichzeitig einzuhaltenden Genauigkeitsanforderung. Dadurch hat sie all jeneAspekte zu umfassen, die die Qualität von Stichprobenergebnissen in dieser Hinsichtbeeinflussen können. Es ist dieser gesamte Stichprobenprozess, der die Repräsentati-vität einer Stichprobe bestimmt.

Zu diesem Prozess gehören natürlich das verwendete Stichprobenverfahren, dieeingesetzte Schätzmethode und – nicht zuletzt – der Stichprobenumfang. DieseAspekte verstehen sich demnach als Instrumente der Repräsentativität einer Stich-probe. Ein Beispiel für einen weiteren Aspekt, der sich auf die diesbezügliche Da-tenqualität auswirkt, ist ein nichtperfekter Auswahlrahmen, also eine nicht mit jener

108 S. Gabler, A. Quatember

Population, über die man tatsächlich Informationen einholen möchte, übereinstim-mende Liste von Erhebungseinheiten, aus welcher die Stichprobe tatsächlich gezo-gen wird. Um bei Mängeln in dieser Hinsicht dennoch repräsentative Stichprobenerhalten zu können, ist dies in den Schätzprozeduren zu berücksichtigen (vgl. etwaSärndal et al. 1992, 543f; Särndal und Lundström 2006, Kap.14).

Antwortausfälle und Falschantworten sind in der Praxis von Stichprobenerhebun-gen regelmäßig auftretende Probleme, die durch die gegebene Inhaltsbestimmungselbstverständlich ebenfalls in den Repräsentativitätsbegriff einfließen. Techniken zuihrer Vermeidung (bzw. Reduzierung) sind einerseits Gegenstand der empirischenSozialforschung mit ihren Untersuchungen zur diesbezüglichen Auswirkung vonÜberzeugungsbriefen, von mehrmaligen Kontaktversuchen, der Datenerhebungstech-nik, der Fragebogengestaltung oder von finanziellen oder auch nichtmonetären An-reizen (siehe etwa: Groves et al. 2004, 189ff). Andererseits setzt sich auch die statis-tische Methodik zum Beispiel in Form von randomisierten Befragungsdesigns damitauseinander (vgl. etwa: Chaudhuri 2011). Deren Ziel ist es, dass die Antwortendeninsbesondere bei heiklen Themen durch einen zur direkten Befragung alternativenBefragungsansatz einen erhöhten Schutz der Privatsphäre erfahren und ihre Koope-rationsbereitschaft dadurch zunimmt.

Können Antwortausfälle bei einer Erhebung nicht vernachlässigbar gering gehal-ten werden, dann müssen auch sie auf Basis von erklärenden Modellen (siehe dazuetwa: Little und Rubin 2002, 11f) in die Schätzung mit einbezogen werden. Gewich-tungsanpassung und Datenimputation sind auf solchen Modellen basierende Metho-den zur Kompensation von Antwortausfällen (vgl. ebd., Kap. 3 und 4). Selbstver-ständlich nehmen aber auch so grundsätzliche Dinge wie die Fragenformulierungenoder zum Beispiel die Wahl der vorgegebenen Antwortalternativen auf die Qualitätder erhobenen Informationen in Hinblick auf die Verteilungen der interessierendenVariablen massiven Einfluss.

Alle diese genannten Faktoren wirken sich auf den sogenannten Nichtstichpro-benfehler einer Erhebung aus, der – wie der Name schon sagt – nicht durch dieErhebung einer Stichprobe an Stelle der Zielpopulation entsteht, sondern selbst beiVollerhebungen auftreten kann. Kann dieser Fehlertyp nicht vernachlässigbar kleingehalten werden, dann dürfen Stichproben auch nicht als repräsentativ für die Popu-lationsverhältnisse gelten und zwar völlig unabhängig davon, welches Stichproben-und Schätzverfahren verwendet wurde und wie groß der gewählte Stichprobenum-fang der Erhebung war. Man denke etwa an das berühmte „Literary-Digest-Desaster“der Meinungsforschung zur amerikanischen Präsidentschaftswahl im Jahr 1936 beieinem Stichprobenumfang von mehr als 2,3 Millionen (vgl. Squire 1988).

Weitere Voraussetzung für das Erfüllen der Forderung nach der zumindest appro-ximativen Unverzerrtheit der Schätzung ist bei Verwendung designbasierter oder mo-dellunterstützter Schätzmethoden die Bestimmbarkeit der benötigten Auswahlwahr-scheinlichkeiten für alle Elemente der Stichprobe und somit die Ziehung einer Zu-fallsstichprobe (vgl. etwa Lohr 2010, Kap. 2.1). Modellbasierte Schätzungen könnendie Unverzerrtheitsforderung nur bei Zutreffen des zu Grunde liegenden Modells er-füllen. So hängt etwa die Qualität der Schätzung eines Mittelwerts basierend auf demHorvitz-Thompson-Schätzer für eine Merkmalssumme bei Verwendung des Quoten-verfahrens als Auswahlmethode vom eher unwahrscheinlichen Zutreffen des Modells

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben 109

einer durch die Interviewer realisierten echten zufälligen Auswahl der Erhebungsein-heiten auf Basis der vorgegebenen Quoten ab (vgl. dazu etwa Quatember 1996b).

Der Stichprobenfehler einer statistischen Erhebung wird schließlich bestimmtdurch das Stichprobenverfahren, die Schätzmethode und den Stichprobenumfang. Eslassen sich zum Beispiel bei der Schätzung von Merkmalssummen Stichprobenver-fahren wie die proportional geschichtete einfache Zufallsmethode und Schätzproze-duren wie die Regressionsschätzung verwenden, die den Stichprobenfehler im Ver-gleich zu anderen Stichprobenverfahren und Schätzmethoden wie die einfache Zu-fallsauswahl und die Horvitz-Thompson-Schätzung verringern können.

Bei gegebenem Stichprobenverfahren und festgelegter Schätzmethode ist esschließlich der Stichprobenumfang, der die für die Repräsentativität einer Stichprobezusätzlich noch geforderte Einhaltung vorgegebener Genauigkeitsanforderungen andie Stichprobenergebnisse bestimmt. Diese Genauigkeitsanforderung wird im Fol-genden durch die erlaubte maximale Breite eines den interessierenden Parameterschätzenden Konfidenzintervalls festgelegt. Eine Stichprobenstrategie bestehend ausStichprobenmethode, Schätzverfahren und Stichprobenumfang, die zum Beispiel beinäherungsweiser unverzerrten Schätzung eine für die Einhaltung der Genauigkeits-anforderung nötige geringe Varianz gewährleisten kann, wird in diesem Sinne also(bei gleichzeitiger Vernachlässigbarkeit der Nichtstichprobenfehler) Repräsentativi-tät gewährleisten können.

Sind Stichproben- und Schätzverfahren festgelegt, so gilt es, den für die Einhal-tung der geforderten Genauigkeit nötigen Stichprobenumfang zu bestimmen. Aufdiese höchst praxisrelevante Frage, die sich auch direkt auf die Kosten einer Erhe-bung auswirkt, wird in den nachfolgenden beiden Abschnitten eingegangen. Die ver-wendeten Formeln in den Abschnitten 3 und 4 sind etwa in dem Buch von Särndal etal. (1992) zu finden.

3 Erforderliche Stichprobenumfänge

3.1 Bei einer einfachen Zufallsauswahl

Für eine endliche Population seien ein beliebiges Zufallsstichprobenverfahren P

und die zumindest näherungsweise unverzerrte Schätzfunktion θ (zum Beispiel derHorvitz-Thompson- oder der Regressionsschätzer) für einen Parameter θ (zum Bei-spiel ein Mittelwert) gegeben. Ferner wird im Nachfolgenden vorausgesetzt, dassNichtstichprobenfehler nur in einem vernachlässigbaren Maß auftreten. Der erforder-liche Stichprobenumfang einer Erhebung wird dann bei annähernd normaler Stich-probenverteilung eines designbasierten oder modellunterstützten Schätzers θ und ge-gebener Varianz VP (θ) von θ beim Stichprobenverfahren P folgendermaßen defi-niert: Er sei jener Mindeststichprobenumfang nmin, bei dem das approximative Kon-fidenzintervall zur Sicherheit 1 − α unter Normalverteilungsannahme,

θ ± z1−α/2 ·√

VP (θ),

(z1−α/2 := das (1−α/2)-Quantil der Standardnormalverteilung) nicht breiter als 2 ·bist:

b ≥ z1−α/2 ·√

VP (θ).

110 S. Gabler, A. Quatember

Die halbe Breite b ist in diesem Zusammenhang die vorgegebene Mindestgenauig-keitsanforderung an den Schätzer θ . Dieser darf also mit der ebenfalls vorgegebenenSicherheit 1−α um höchstens den Wert b symmetrisch um den Parameter θ schwan-ken. Das ist die sogenannte „maximale Schwankungsbreite von Stichprobenergebnis-sen“.

Der Mindeststichprobenumfang nmin ist also eine Funktion von vier Faktoren:nmin = f (P, θ , α, b).

Betrachten wir als Beispiel die herkömmliche Mittelwertschätzung in einer ein-fachen Zufallsauswahl ohne Zurücklegen (SI). Mit der vorgegebenen Genauigkeit inForm der Schwankungsbreite b lässt sich aus

b ≥ z1−α/2 ·√

(1 − f ) · S2

n

mit S2 = 1N−1

∑Ni=1(yi − y)2, der so definierten Varianz der y-Werte in der Gesamt-

heit mit Populationsmittelwert y, und dem Auswahlsatz f = n/N (N := Umfang derPopulation, n := Stichprobenumfang) der erforderliche Mindeststichprobenumfangn

(SI)min bei einer SI-Stichprobe bestimmen:

n(SI)min =

⌈z2

1−α/2 · S2

b2 + 1N

· z21−α/2 · S2

(�x� := die kleinste ganze Zahl ≥ x). Da S2 im Allgemeinen nicht bekannt ist, istman auf diesbezügliche Ergebnisse aus früheren Erhebungen oder von „Pretests“ zuraktuellen Untersuchung angewiesen. Auch lässt sich S2 manchmal durch eine be-gründete oder rechnerische Obergrenze S2

max limitieren. So gilt etwa für binär ko-dierte Merkmale (0/1-Variable) mit dem Anteil p an Elementen, die die Ausprägung“1” aufweisen: S2 = N

N−1 · p · (1 − p). Für große Grundgesamtheiten gilt demnach:

S2max ≈ 0,25. Damit errechnet sich bei der Erhebung von interessierenden Anteilen in

SI-Stichproben:

n(SI)min =

⌈z2

1−α/2

4 · b2

⌉.

Für b = 0,04 und α = 0,05 entspricht dies n(SI)min = 601. Eine solche Vorgehensweise

empfiehlt sich beispielsweise bei Mehrthemenumfragen zu verschiedenen Einstel-lungen, um die gewünschte Genauigkeit für jedes einzelne binär kodierte Erhebungs-merkmal zu gewährleisten.

3.2 Bei einer geschichteten einfachen Zufallsauswahl

Häufig sind Populationen in H Schichten zerlegt. So sind ein Staat beispielsweise inseine Bundesländer, eine Universität in ihre unterschiedlichen Fakultäten und ein Be-trieb in seine verschiedenen Abteilungen geschichtet. Es sei Nh die Größe der h-tenSchicht in der Population (h = 1,2, . . . ,H). Hat man die relativen Stichprobenum-fänge nh/n für jede Schicht h festgelegt (z.B. mit nh/n = Nh/N proportional zu dentatsächlichen Schichtgrößen oder durch die varianzoptimale Neyman-Tschuprow-Allokation mit nh/n = Nh ·Sh/

∑Nh ·Sh), dann kann zum Beispiel bei geschichteter

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben 111

einfacher Zufallsauswahl (STSI) für eine Mittelwertschätzung ySTSI aus der Schätzer-varianz V (ySTSI) bei einem vorgegebenen Genauigkeitsanspruch b der erforderlicheStichprobenumfang n

(STSI)min folgendermaßen bestimmt werden (fh = nh/Nh):

V (ySTSI) =H∑

h=1

(Nh

N

)2

· (1 − fh) · S2h

nh

=H∑

h=1

(Nh

N

)2

· S2h

nh

−H∑

h=1

(Nh

N

)2

· S2h

Nh

= 1

H∑h=1

(Nh

N

)2

· S2h

nh/n−

H∑h=1

(Nh

N

)2

· S2h

Nh

und aus

b ≥ z1−α/2 ·√√√√1

H∑h=1

(Nh

N

)2

· S2h

nh/n−

H∑h=1

(Nh

N

)2

· S2h

Nh

ergibt sich:

n(STSI)min =

⌈z2

1−α/2 · ∑Hh=1(

Nh

N)2 · S2

h

nh/n

b2 + z21−α/2 · ∑H

h=1(Nh

N)2 · S2

h

Nh

Um diesen Stichprobenumfang errechnen zu können, müssen akzeptable Schätzun-gen der einzelnen Schichtvarianzen S2

h vorliegen.

3.3 Bei einer geschichteten einfachen Zufallsauswahl mit Nebenbedingungen

Bei der Neyman-Tschuprow-Aufteilung kann es nun allerdings vorkommen, dassdie mit Gleichung nh = Nh · Sh · n

(STSI)min /

∑h Nh · Sh bestimmten Schichtstichpro-

benumfänge nh in einer oder mehreren Schichten größer als die Umfänge Nh dieserSchichten in der Population oder als eine fixierte Obergrenze Mh ≤ Nh ausfallen(h = 1,2, . . . ,H). Zusätzlich liegen in der Praxis in den Schichten häufig auch Min-deststichprobenumfänge mh vor, um für schichtspezifische Schätzer ebenfalls einebestimmte Mindestgenauigkeit zu gewährleisten. Dies hat etwa bei Mittelwertschät-zungen ySTSI in STSI-Stichproben zur Folge, dass man deren Schätzervarianz

V (ySTSI) =H∑

h=1

(Nh

N

)2

· (1 − fh) · S2h

nh

unter sogenannten „box-constraints“ der Form mh ≤ nh ≤ Mh, h = 1,2, . . . ,H , beigegebenem Gesamtstichprobenumfang zu minimieren hat (0 < mh ≤ Mh ≤ Nh). Ei-ne explizite Lösung eines ähnlichen Problems, die im deutschen Zensus 2011 ange-wendet wurde, präsentieren Gabler et al. (2012).

112 S. Gabler, A. Quatember

Das Repräsentativitätsproblem lässt sich ähnlich formulieren: Minimiere die Sum-me n = ∑H

h=1 nh unter den H box-constraints mh ≤ nh ≤ Mh, h = 1,2, . . . ,H , undder zusätzlichen Nebenbedingung

b ≥ z1−α/2 ·√√√√ H∑

h=1

(Nh

N

)2

· S2h

nh

−H∑

h=1

Nh

N2· S2

h.

Es gilt also, eine lineare Minimierungsaufgabe unter H box-constraints und einernichtlinearen Ungleichung als Nebenbedingungen zu lösen. Setzt man βh = 1/nh,so lässt sich das folgende äquivalente konvexe Minimierungsproblem formulieren:Minimiere die konvexe Funktion n = f (β1, . . . , βH ) = ∑H

h=11βh

unter den Neben-

bedingungen 1Mh

≤ βh ≤ 1mh

, h = 1,2, . . . ,H , und

b ≥ z1−α/2 ·√√√√

H∑h=1

(Nh

N

)2

· βh · S2h −

H∑h=1

Nh

N2· S2

h.

Quadriert man die letzte Ungleichung erhält man eine lineare Ungleichung bezüglichder βh.

Die Lösung dieser Aufgabe führt zu einer Stichprobe, die eine Repräsentativitätder Gesamtstichprobe nach der in Abschn. 2 gegebenen Definition mit einer Reprä-sentativitätsbedingung gewährleistet.

4 Das Problem der Repräsentativität in Subgruppen

Eine in der Praxis der Stichprobenerhebungen häufig anzutreffende Fragestellung be-trifft die Repräsentativität der Stichprobe in Subgruppen der Population. Ist eine Ge-samtheit nach mindestens zwei Variablen geschichtet, dann erhält man ein Schichtta-bleau (siehe Tab. 1). Bei vielen Bevölkerungsumfragen sind das etwa Kreuztabellenvon Gemeinden im Format H × K nach Kreise × BIK-Regionen, einer Größenklas-sensystematik, die Gemeinden gemäß der Einwohnerzahl ihrer Stadtregion (Struktur-typ 1–3) und ihrem Strukturtyp in zehn Größenklassen einteilt (siehe: Aschpurwis +Behrens GmbH 2001). An Universitäten können die Studierenden einerseits nach Fa-kultätszugehörigkeit und andererseits nach ihrem Geschlecht, in großen Firmen Be-schäftigte einerseits nach Region und andererseits nach Position klassifiziert werden

Tab. 1 Schichttableau der Umfänge in den Schichten der Population

Region Position

P1 . . . PK Summe

R1 N11 . . . N1K N1.

.

.

....

RH NH1 . . . NHK NH.

Summe N.1 . . . N.K N..

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben 113

und so fort. Aus den H · K Schichten wird uneingeschränkt zufällig ausgewählt. Essei nun erwünscht, dass Repräsentativität für mehrere Repräsentativitätsbedingungen,zum Beispiel für die Region (R1, . . . ,RH ) und die Position (P1, . . . ,PK), vorliegt.

Allgemein findet man den Ansatz zu notwendigen Stichprobenumfängen in Sub-gruppen bei Schichtung als konvexes Minimierungsproblem mit Nebenbedingungenin dem Buch von Särndal et al. (1992, Kap. 12), allerdings ohne Angabe eines expli-ziten Lösungsweges und ohne Beispiel. Im Nachfolgenden werden die Repräsentati-vitätsbedingungen auf ein konvexes Minimierungsproblem unter Nebenbedingungenzurückgeführt. Dies wurde bisher zumindest im deutschsprachigen Raum unseres Er-achtens nicht explizit ausgeführt. Ähnliche lineare und konvexe Optimierungsansätzein unterschiedlichem Kontext, die allerdings nicht mit dem Begriff der Repräsenta-tivität verbunden sind, findet man auch in Choudry et al. (2012). Im Zusammen-hang mit Nebenbedingungen an Variationskoeffizienten seien Bethel (1989), Bene-detti et al. (2008), als R-Programme seien De Meo (2013) und Barcaroli et al. (2013)genannt.

Schematisch lässt sich dies in Tab. 1 veranschaulichen.Um für eine Population nach Tab. 1 bei Mittelwertschätzungen in STSI-Stichpro-

ben Repräsentativität zeilen- und spaltenweise zu erreichen, müssen alle oder einbewusst ausgewählter Teil der Repräsentativitätsbedingungen

b ≥ z1−α/2 ·√√√√

H∑h=1

(Nhk

N.k

)2

· S2hk

nhk

−H∑

h=1

Nhk

N2.k

· S2hk für k = 1, . . . ,K

b ≥ z1−α/2 ·√√√√ K∑

k=1

(Nhk

Nh.

)2

· S2hk

nhk

−K∑

k=1

Nhk

N2h.

· S2hk für h = 1, . . . ,H

beziehungsweise für βhk = 1/nhk

b ≥ z1−α/2 ·√√√√

H∑h=1

(Nhk

N.k

)2

· βhk · S2hk −

H∑h=1

Nhk

N2.k

· S2hk für k = 1, . . . ,K

b ≥ z1−α/2 ·√√√√

K∑k=1

(Nhk

Nh.

)2

· βhk · S2hk −

H∑h=1

Nhk

N2h.

· S2hk für h = 1, . . . ,H

gelten. Darin ist Nh. die Summe der Schichtumfänge in Region h über alle K

Positionen, N.k bezeichnet die Summe der Schichtumfänge von Position k überalle H Regionen. Quadrierung auf beiden Seiten ergeben lineare Ungleichungenin den βhk . Berücksichtigt man außerdem Ober- und Untergrenzen für die Stich-probenumfänge in den Schichten und fasst die Faktoren βhk im Vektor βt =(β11, . . . , β1K, . . . , βH1, . . . , βHK) zusammen, dann lässt sich das Repräsentativitäts-problem für gegebene Repräsentativitätsbedingungen mathematisch wie folgt formu-lieren: Minimiere die konvexe Funktion n = f (β) = ∑H

h=1∑K

k=11

βhkunter den box-

constraints 1Mhk

≤ βhk ≤ 1mhk

, h = 1,2, . . . ,H ; k = 1, . . . ,K und A ·β ≤ c. Der Über-gang von den nhk zu den βhk ist sinnvoll, da dadurch alle Nebenbedingungen linear

114 S. Gabler, A. Quatember

und dafür Lösungsalgorithmen vorhanden sind. Die obigen und weiteren Überlegun-gen sind analog zu den Ausführungen bei Särndal et al. (1992, Kap. 12.7).

Um A zu bestimmen, definieren wir zunächst eine I × (H · K)-IndikatormatrixE = (eij ) mit eij = 1, wenn das entsprechende βhk in die geforderte i-te Repräsen-tativitätsbedingung eingeht, und eij = 0 sonst (i = 1, . . . , I ; j = 1, . . . ,H · K). Wei-terhin seien γ der analog zu β angeordnete H · K-Vektor bestehend aus den Werten

N2hk · S2

hk , δ der analog zu β angeordnete H · K-Vektor bestehend aus den Werten

Nhk ·S2hk und ε der analog zu β angeordnete H ·K-Vektor bestehend aus den Werten

Nhk .Dann ist A = (aij ) = ( A1

A2

) = E · Dγ (Dγ := Diagonalmatrix mit Diagonalvektorγ ) eine I × (H · K)-Matrix, mit aij = eij · γj . In A1 gehen die geforderten I1 Re-präsentativitätsbedingungen zum Beispiel für die Regionen und in A2 die I2 für diePositionen ein. Zudem gilt c = ( b

z1−α/2)2 · (E · ε) · ∗(E · ε) + E · δ (·∗ kennzeichnet

komponentenweise Multiplikation). Offensichtlich liegt für H = 1 oder K = 1 das inAbschn. 3.3 beschriebene Repräsentativitätsproblem vor.

5 Ein numerisches Beispiel

Im Folgenden soll ein Mindeststichprobenumfang für das Repräsentativitätsproblemmit mehreren Repräsentativitätsbedingungen berechnet werden. Dazu nehmen wir ineinem Beispiel bei einer Mitarbeiterumfrage zur Zufriedenheit von Beschäftigten an,dass die 16.000 Mitarbeiter einer Firma regional in 4 Regionen bzw. 6 Unterregionenund 2 Positionen (etwa leitende Position, nicht leitende Position) klassifiziert werden(Tab. 2).

Nehmen wir an, dass man sich auf das übliche Signifikanzniveau von α = 0,05und eine Schwankungsbreite von b = 0,04 festgelegt hat. Gefordert sei Repräsenta-tivität für die 6 Regionen R1, R2,R3,R41, R42, R4 und die beiden Positionen P1 undP2. Nehmen wir ferner an, dass in der Umfrage nur binär kodierte Merkmale erhobenwerden, so dass wir S2

hk,max ≈ 0,25 setzen können. Es gibt also 8 Repräsentativitäts-bedingungen und es gilt:

Tab. 2 Schichttableau der Zahl der Mitarbeiter (Population)

Region Position

P1 P2 Summe

R1 100 1000 1100

R2 200 1000 1200

R3 300 2000 2300

R4

R41 50 3000 3050

R42 100 3000 3100

R43 250 5000 5250

Summe 1000 15000 16000

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben 115

E =

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

1 1 0 0 0 0 0 0 0 0 0 00 0 1 1 0 0 0 0 0 0 0 00 0 0 0 1 1 0 0 0 0 0 00 0 0 0 0 0 1 1 0 0 0 00 0 0 0 0 0 0 0 1 1 0 00 0 0 0 0 0 1 1 1 1 1 11 0 1 0 1 0 1 0 1 0 1 00 1 0 1 0 1 0 1 0 1 0 1

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

,

γ =

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

25002500001000025000022500

1000000625

2250002500

22500015625625000

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

, δ = 1

4· ε = 1

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

1001000200

1000300

200050

3000100

3000250

5000

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

.

Die konvexe Minimierungsaufgabe für das Repräsentativitätsproblem mit 8 Reprä-sentativitätsbedingungen lautet somit: Minimiere n = ∑6

h=1∑2

k=11

βhkunter den

box-constraints 1Nhk

≤ βhk ≤ 1, h = 1,2, . . . ,6; k = 1,2 und A · β ≤ c. Die Matrix Aist gegeben durch

A =

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

2500 250000 0 0 0 0 0 00 0 10000 250000 0 0 0 00 0 0 0 22500 1000000 0 00 0 0 0 0 0 625 22500000 0 0 0 0 0 0 00 0 0 0 0 0 625 2250000

2500 0 10000 0 22500 0 625 00 250000 0 250000 0 1000000 0 2250000

0 0 0 00 0 0 0

2500 2250000 0 02500 2250000 15625 6250002500 0 15625 0

0 2250000 0 625000

⎞⎟⎟⎟⎟⎟⎟⎠

und der Vektor c durch.

116 S. Gabler, A. Quatember

c =(

b

z1−α/2

)2

· (E · ε) · ∗(E · ε) + E · δ = 0,000417 ·

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

12100001440000529000093025009610000

1299600001000000

225000000

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

+

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

27530057576377528502503750

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

=

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

778,9752899,77212778,32964637,06974777,646156979,4362666,5084

97464,3978

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

.

Für β0 = 1/ε, d.h. wenn die Komponenten von β0 gerade die Inversen der Umfängein den Gesamtheiten sind, sind alle Nebenbedingungen trivialerweise erfüllt. Daherkann dieser Vektor als Startvektor für numerische Optimierungsprogramme verwen-det werden.

Die Prozedur „sqpSolve“ in GAUSS liefert die folgende Lösung:

β =

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

β11β12β21β22β31β32β41β42β51β52β61β62

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

=

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

0,0213171280,0029027300,0111274820,0031539890,0089401040,0025771770,0559154840,0020453880,0280869970,0020921900,0125199210,007578957

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠

.

Daraus resultieren die Mindeststichprobenumfänge in Tab. 3.Von den 16.000 Mitarbeitern der Firma müssten also insgesamt 2.534 Mitarbeiter

gemäß Tab. 3 geschichtet ausgewählt werden, um sicherzustellen, dass eine Reprä-sentativität für die gegebenen 8 Repräsentativitätsbedingungen gewährleistet ist. Mitdiesen Stichprobenumfängen ergeben sich die folgenden maximalen 8 Schwankungs-breiten b (Tab. 4).

Bei obigem Beispiel handelt es sich nicht um ein Lehrbuchbeispiel, sondern umein konkretes von mehreren Beispielen (nur mit anderen Zahlen) von Mitarbeiter-befragungen bei großen Unternehmen. Z.B. war für die Region R43 tatsächlich kei-ne „Repräsentativität“ gefordert, da zu wenig Mitarbeiter in dieser Region beschäf-tigt waren. Die Fragen aus einem umfangreichen Fragenkatalog sind meist Likert-skaliert, wobei in die Auswertung nur „JA“-Statistiken kamen (s. Borg und Gabler

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben 117

Tab. 3 Mindeststichprobenumfänge in den Schichten

Position Region

P1 P2 Summe

R1 47 345 392

R2 90 318 408

R3 112 389 501

R4 R41 18 489 507

R42 36 478 514

R43 80 132 212

Summe 383 2.151 2.534

Tab. 4 Maximale Schwankungsbreiten

Repräsentativitätsbedingung Schwankungsbreite

1 (R1) 0,03995

2 (R2) 0,03992

3 (R3) 0,03994

4 (R41) 0,03999

5 (R42) 0,03999

6 (R4) 0,03999

7 (P1) 0,03991

8 (P2) 0,03119

2002). Die Prozentsätze in der Stichprobe waren erwartungsgemäß von Item zu Itemverschieden und lagen teilweise (in den Schichten) auch um die 50 %. Daher erscheintuns hier diese Obergrenze bei der Berechnung der notwendigen Stichprobenumfängedurchaus als sinnvoll. Es ist zudem zu berücksichtigen, dass im Planungsprozess beider Festlegung der Stichprobenumfänge noch keine Daten vorliegen und ein konser-vatives Vorgehen durchaus angebracht erscheint. Hat man aus früheren ErhebungenKenntnisse über die Anteile in den Schichten, kann man diese in die Abschätzung derS2

hk leicht einbauen.

6 Schlussbemerkungen

In diesem Aufsatz wurde der komplexe Begriff der Repräsentativität einer Stichprobemöglichst breit diskutiert und sein praktischer Einsatz im Speziellen bei geschichte-ten Populationen unter den Nebenbedingungen der Repräsentativität in Subgruppengezeigt. Die Aufgabe lässt sich durch ein konvexes Minimierungsproblem mit „box-constraints“ und linearen Nebenbedingungen beschreiben. Sind in einigen Zellen desSchichttableaus Vollerhebungen vorgesehen, lässt sich dies einfach in die box cons-traints einbauen. Bei bekannten, in den einzelnen Zellen konstanten Ausfallwahr-scheinlichkeiten, müssen in der Planungsphase der Stichprobenerhebung die Brutto-

118 S. Gabler, A. Quatember

stichprobenumfänge durch Division der Nettostichprobenumfänge mit den Ausfall-wahrscheinlichkeiten ermittelt werden. Müssen die ermittelten Stichprobenumfängein einer Zeile oder Spalte weiter unterteilt werden, etwa in Altersklassen oder Ge-schlecht oder regionale Untergliederungen, so wird der Stichprobenumfang propor-tional auf diese Klassen aufgeteilt. Zu beachten ist, dass der Gesamtstichprobenum-fang und damit die Kosten für die Erhebung mit der Zahl der Repräsentativitäts-bedingungen wachsen. Die vorgenommenen Berechnungen beruhen auf der Annah-me der Normalverteilung, zumindest näherungsweise, der Schätzer. Diese Annahmekann nach Münnich (2008) problematisch sein, wenn etwa seltene Ereignisse oderdie Existenz von Ausreißern vorliegen. Derartige Fälle müssten in weitergehendenArbeiten behandelt werden.

Danksagung Die Autoren bedanken sich bei den Gutachtern und Herausgebern für ihre wertvollenKommentare und Vorschläge.

Literatur

ADM-Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V.; AG.MA ArbeitsgemeinschaftMedia-Analyse e.V. (Hrsg) (1999) Stichproben-Verfahren in der Umfrageforschung: Eine Darstel-lung für die Praxis. Leske + Budrich, Opladen

Aschpurwis + Behrens GmbH (2001) Markt-, Media- und Regionalforschung 2001: BIK Regionen.http://www.bik-gmbh.de/texte/BIK-Regionen2000.pdf.Gesehen8.8.2013

Barcaroli G, Pagliuca D, Willighagen E (2013) R-Package SamplingStrata. www.r-project.orgBenedetti R, Espa G, Lafratta G (2008) A tree-based approach to forming strata in multipurpose business

surveys. Surv Methodol 34:195–203Bethel JW (1989) Sample allocation in multivariate surveys. Surv Methodol 15:47–57Borg I, Gabler S (2002) Zustimmungsanteile und Mittelwerte von Likert-skalierten Items. Nachr - Zent

Umfr Methoden Anal 50:7–25Bortz J, Döring N (1995) Forschungsmethoden und Evaluation, 2. Aufl. Springer, BerlinBosch V (2012) Repräsentativität von Stichproben. http://www.marktforschung.de/marktforschungdossier/

maerz-2012/repraesentativitaet-von-stichproben.Gesehen8.8.2013Chaudhuri A (2011) Randomized response and indirect questioning techniques in surveys. Chapman &

Hall, Boca RatonChoudry H, Rao JNK, Hidiroglou M (2012) On sample allocation for efficient domain estimation. Surv

Methodol 38:23–29De Meo M (2013) R-Package bethel. www.r-project.orgGabler S (1996) Repräsentativität von Stichproben. In: Goebl H et al (Hrsg) Kontaktlinguistik: Ein inter-

nationales Handbuch zeitgenössischer Forschung. De Gruyter, New York, S 733–737Gabler S, Quatember A (2012) Das Problem mit der Repräsentativität von Stichprobenerhebungen. In:

Verband Schweizer Markt- und Sozialforschung. Jahrbuch 2012. vsms, Zürich, S 17–19Gabler S, Ganninger M, Münnich R (2012) Optimal allocation of the sample size to strata under box

constraints. Metrika 75:151–161Groves RM, Fowler FJ Jr, Couper MP, Lepkowski JM, Singer E, Tourangeau R (2004) Survey methodolo-

gy. Wiley, HobokenKreienbrock L (1989) Einführung in die Stichprobenverfahren. Oldenbourg, MünchenKruskal W, Mosteller F (1979a) Representative sampling. I. Non-scientific literature. Int Stat Rev 47:13–

24Kruskal W, Mosteller F (1979b) Representative sampling. II. Scientific literature, excluding statistics. Int

Stat Rev 47:111–127Kruskal W, Mosteller F (1979c) Representative sampling. III. The current statistical literature. Int Stat Rev

47:245–265Kruskal W, Mosteller F (1980) Representative sampling. VI. The history of the concept in statistics, 1895–

1939. Int Stat Rev 48:169–195

Repräsentativität von Subgruppen bei geschichteten Zufallsstichproben 119

Little RJA, Rubin DB (2002) Statistical analysis with missing data, 2. Aufl. Wiley, HobokenLohr S (2010) Sampling: design and analysis, 2. Aufl. Brooks/Cole, BostonMünnich R (2008) Varianzschätzung in komplexen Erhebungen. Aust J Stat 37:319–334Quatember A (1996a) Das Problem mit dem Begriff Repräsentativität. Allg Stat Arch 80:236–241Quatember A (1996b) Das Quotenverfahren. Universitätsverlag Rudolf Trauner, LinzSärndal C-E, Lundström S (2006) Estimation in surveys with nonresponse. Wiley, ChichesterSärndal C-F Swensson B, Wretman J (1992) Model assisted survey sampling. Springer, New YorkSchnell R (1997) Nonresponse in Bevölkerungsumfragen: Ausmaß, Entwicklung und Ursachen. Leske +

Budrich, OpladenSquire P (1988) Why the 1936 literary digest poll failed. Public Opin Q 52:125–133Von der Lippe P, Kladroba A (2002) Repräsentativität von Stichproben. Marketing ZFP 24:139–145


Recommended