Date post: | 05-Apr-2015 |
Category: |
Documents |
Upload: | friederike-hemp |
View: | 106 times |
Download: | 0 times |
Entscheidung bei Infomationsdefizit: Simultane optimale Alternativensuche und Nutzenpräzisierung
o.Univ. Prof. Dkfm. Dr. Wolfgang Janko, WU
Grundmodell der Entscheidungstheorie
Handlungsalternativen Umweltzustände
z1 z2 … zm
Konsequenzen
a1 x11 x12 … x1m
a2 x21 x22 … x2m
… … … … …
an xn1 xn2 … xnm
Umweltzustände
z1 z2 … zm
Handlungsalternativen
a1 u(x11) u(x12) … u(x1n)
a2 u(x21) u(x22) … u(x2n)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
am u(xm1) u(xm2) … u(xmn)
Nutzenmatrix
Informationssystem:
Umweltzustände
Nachrichten
y1 y2 … yk
Wahrscheinlichkeiten
z1 w(y1│z1) w(y2│z1) … w(yk│z1)
z2 w(y1│z2) w(y2│z2) … w(yk│z2)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
zm w(y1│zm) w(y2│zm) … w(yk│zm)
Bayes‘sches Theorem:
m
i
iijj zwzywyw0
)()()(
n
i
iij
iijji
zwzyw
zwzywyzw
0
)()(
)()()(
Auch mit Dichten und subjektiven Wahrscheinlichkeiten zu rechnen!
Informationsbeschaffung
a. Einstufigb. mehrstufig (sequentielle Beschaffungsmodelle)
Alternativensuchmodelle
+viele andere Modelle
bzw. ordinaler Nutzen bzw. Geldnutzen
Optimale Politik bei einfacher Alternativensuche und bekannter Verteilung des (Geld-)Nutzens
F(u) mit Dichte f(u):Ermittlung von v* = erwarteter Wert bei optimaler Fortsetzung der SucheStoppen wenn u ≥ v*!Ermittlung:
Wir erhalten v* als Nullstelle: TF(v)-c =0
Bsp.: Für N(0,1) gilt: TF(v)=f(v)-v(1-F(v))
Für Gvtlg in [0,1] gilt: TF(v)=(v²+1)/2-v und v* = 1-√(2cs )
(cs < ½)
s
v
s
vv
s
v
v
s
v
s
cduufvuv
cduufuduufvvcduufuvvF
cduufuduuvf
cvuEv
)()(
)()()()(
)()(
,max
TF(v)
s
Konjugierte Familie: a priori Verteilung = a posteriori Verteilung , Beispiele:
Parameter Konjugierte Familie
Bernoulli-Verteilung Beta-Verteilung
NormalverteilungGamma-Verteilung
Normal
Poisson-Verteilung Gamma-Verteilung
Negative Binomialverteilung Beta-Verteilung
Gleichverteilung Pareto-Verteilung
Multinomialverteilung Dirichlet-Verteilung
mehrdimensionale Normalverteilung Wishart-Verteilung ua
Sequentielle Alternativensuche mit Datenpräzisierung
Bekannt: 3-dimensionale Verteilung der ZV X = (x1, x2, x3)
Entscheider kann: X1 mit Suchkosten c1 beobachten,
X2 mit Testkosten c2 beobachten.
Er kann in jedem Fall akzeptieren oder mit der Suche fortfahren.
Den wahren Wert X3 kennt er erst nach Akzeptanz!
Wir nehmen an X ist multivariat normalverteilt mit den Parametern =(m m1, m2, m3) und der Korrelationsmatrix M.
Der Such- und Testprozess
Verwerfen
Verwerfen
X1 Suchen (X) X2 Testen (Y)
c1c2
Akzeptieren
X3 (V)
Optimale Politik
Es muss zunächst untersucht werden für die 3-dimensionale ZV (X,Y,V), ob Testen überhaupt sinnvoll ist. Man ermittelt den Wert
v0 und ermittelt T(v0 , v0) ≤ (Fall a) bzw. > (Fall b) v0 . Gilt Fall a) so wird überhaupt
nicht getestet und der Erwartungswert der Politik ist v* ( = v0). v0 wird rückgerechnet auf x0.
In Fall a) gilt bei einem Wert x von X: Istx < x0 wird abgelehnt, ist
x0 ≤ x so wird angenommen.
Im Fall b) kommt es zur Festlegung von Wertenx*, y* und v*
einer optimalen Politik beim Testen:
Vorgangsweise nach Aufsuchen einer Alternative mit Wert x von X :1. Gilt x<x* so wird diese abgelehnt und aufs Neue gesucht, gilt y* ≤ x wird gestoppt (akzeptiert)2. Gilt x*≤ x < y*, so wird getestet; der Test ergibt den Wert y von Y , wir untersuchen
a. gilt y < v* weitersuchen
b. v* ≤ y stoppen und akzeptieren.
Tabelle 1: The influence of search costs c1 on the optimal policyr13 r23 r12 m1 m2 m3 s1 s2 s3 c2
0.4 0.6 0.4 10 10 10 10 10 10 1
c1 x* y* v* x0 v0
0.01 30,065 41,262 20,2650.05 24,957 36,152 18,2220.1 21,865 33,063 16,9860.2 18,828 30,024 15,7700.5 13,708 24,905 13,7230.7 11,563 22,763 12,8661.0 9,051 20,249 11,8601.3 7,053 18,248 11,0591.5 5,854 17,053 10,5821.7 4,805 16,004 10,1622.0 3,334 14,532 9,5732.2 2,437 13,636 9,2152.5 1,169 12,368 8,7084.0 -4,193 6,563 7,005
Tabelle 2: The influence of testing costs on the optimal policyr13 r23 r12 m1 m2 m3 s1 s2 s3 c1
0.6 0.6 0.4 10 10 10 10 10 10 0.1
c2 x* y* v* x0 v0
0,01 15,535 47,098 22,787 - -0,05 18,792 42,883 22,505 - -0,1 20,352 40,776 22,333 - -0,2 21,846 38,169 22,005 - -
0,35 23,011 36,629 21,593 - -0,5 23,785 33,83 21,284 - -0,7 24,523 31,947 20,947 - -1, 25,51 29,861 20,611 - -1,5 27,027 27,478 20,352 - -1,7 - - - 27,3724 20,4242, - - - 27,373 20,4242,2 - - - 27,3739 20,42432,5 - - - 27,3748 20,4249
y*-x* = konstant
-10.000
0.000
10.000
20.000
30.000
40.000
50.000
x*y*v*
0.010.05 0.1 0.2
0.35 0.5 0.7 1 1.5 1.7 2 2.2 2.50.000
5.000
10.000
15.000
20.000
25.000
30.000
35.000
40.000
45.000
50.000
x*y*v*x0v0
Tabelle 3: The influence of the ratio c 1 /c 2 on the optimal policyr13 r23 r12 m1 m2 m3 s1 s2 s3 c1 + c2
0.6 0.8 0.4 10 10 10 10 10 10 0.4
c1 c2 c1/c2 x* y* v*
0,005 0,395 0,01266 29,195 52,205 28,4130,01 0,39 0,0256 28,417 51,559 27,9930,05 0,35 0,1428 23,155 47,367 25,1630,1 0,3 0,3333 20,291 46,022 23,891
0,15 0,25 0,6 17,095 45,381 22,9870,18 0,22 0,8182 16,360 45,020 22,4180,2 0,2 1,0 15,582 45,136 22,215
0,22 0,18 1,222 14,797 45,296 22,0270,25 0,15 1,667 13,584 45,669 21,7700,3 0,1 3,0 11,267 46,775 21,416
0,35 0,05 7,0 8,100 49,079 21,1560,39 0,01 39,0 2,336 54,194 21,0140,395 0,005 79,0 0,483 56,347 21,010
Tabelle 4: The influence of the mean value m1 of x1 on the optimal policyr13 r23 r12 m2 m3 s1 s2 s3 c1 c2
0.6 0.6 0.4 10 10 10 10 10 0.1 0.2
m1 x* y* v* x0 v0
3 14,846 31,169 22,005 - -5 16,846 33,169 22,005 - -10 21,846 38,169 22,005 - -15 26,846 43,169 22,005 - -20 31,846 48,169 22,005 - -
0.0050.01
0.05 0.10.15
0.18 0.20.22
0.25 0.30.35
0.390.395
0.0
10.0
20.0
30.0
40.0
50.0
60.0
70.0
80.0
90.0
c2c1/c2x*y*v*
Hohe Testkosten c2 weniger Einfluss als hohe Suchkosten c1
3 5 10 15 200.000
10.000
20.000
30.000
40.000
50.000
60.000
x*y*v*
Erwarteter Ertrag v* bleibt gleich bei unverändertem Rest Testbereich verschiebt sich exakt um Mittelwertverschiebung
Tabelle 5: The influence of the mean value m2 of x2 on the optimal policyr13 r23 r12 m1 m3 s1 s2 s3 c1 c2
0.6 0.6 0.4 10 10 10 10 10 0.1 0.2
m2 x* y* v* x0 v0
5 21,846 38,169 22,005 - -10 21,846 38,169 22,005 - -20 21,846 38,169 22,005 - -
Tabelle 6: The influence of the mean value m3 of x3 on the optimal policyr13 r23 r12 m1 m2 s1 s2 s3 c1 c2
0.6 0.8 0.6 10 10 10 10 10 0.2 1.0
m3 x* y* v* x0 v0
0 20,873 30,980 9,547 - -5 20,819 30,960 14,535 - -10 20,831 30,958 19,538 - -12 20,817 30,957 21,533 - -15 20,817 30,957 24,533 - -20 20,825 30,963 29,536 - -
5 10 200.0005.000
10.00015.00020.00025.00030.00035.00040.00045.000
x*y*v*
Kein Einfluss bei sonst gleichen Werten
0 5 10 12 15 200.000
5.000
10.000
15.000
20.000
25.000
30.000
35.000
x*y*v*
V* steigt mit m3 gleichmäßig parallel
Tabelle 7: The influence of s1 the standard deviation of x1 on the optimal policyr13 r23 r12 m1 m2 m3 s2 s3 c1 c2
0.6 0.8 0.6 10 10 10 10 10 0.2 1.0
s1 x* y* v* x0 v0
5 15,415 20,483 19,539 - -7 17,582 24,676 19,539 - -10 20,831 30,966 19,539 - -13 24,079 37,256 19,539 - -15 26,246 41,450 19,539 - -20 31,661 51,934 19,539 - -
Tabelle 8: The influence of s2 the standard deviation of x2 on the optimal policyr13 r23 r12 m1 m2 m3 s1 s3 c1 c2
0.6 0.8 0.6 10 10 10 10 10 0.2 1.0
s2 x* y* v* x0 v0
5 20,830 30,967 19,539 - -10 20,830 30,967 19,539 - -15 20,830 30,967 19,539 - -
5 7 10 13 15 200.000
10.000
20.000
30.000
40.000
50.000
60.000
x*y*v*
s1 kein Einfluss auf Ertrag, Testbereich wächst mit steigenden s1
5 10 150.000
10.000
20.000
30.000
x*y*v*
s2 hat keinen Einfluss auf Testbereich und vx.
Tabelle 9: The influence of s3 the standard deviation of x3 on the optimal policyr13 r23 r12 m1 m2 m3 s1 s2 c1 c2
0.6 0.8 0.6 10 10 10 10 10 0.2 1.0
s3 x* y* v* x0 v0
2,5 - - - 17,404 11,1105 20,501 21,834 13,350 - -7 20,432 26,270 15,607 - -10 20,831 30,966 19,539 - -13 21,454 34,518 24,029 - -15 21,717 36,296 27,106 - -20 22,187 39,667 35,116 - -
Tabelle 10: The influence of the correlation r13 of x1 and x3 on the optimal policyr23 r12 m1 m2 m3 s1 s2 s3 c1 c2
0.4 0.4 10 10 10 10 10 10 0.1 0.2
r13 x* y* v* x0 v0
0,2 13,316 54,855 14,817 - -0,3 17,683 40,568 15,738 - -0,4 20,677 34,351 17,077 - -0,5 23,364 31,643 18,751 - -0,6 25,249 30,061 20,593 - -0,7 26,778 29,239 22,605 - -0,8 27,928 28,809 24,695 - -0,9 - - - 28,978 27,081
2.5 5 7 10 13 15 200.0005.000
10.00015.00020.00025.00030.00035.00040.00045.000
x*y*v*x0v0
Mit abnehmendem s3 wird nicht mehr getestet!Mit zunehmendem s3 erweitert sich der Testbereich; v*steigt mit s3.
0.2 0.3 0.4 0.5
0.600000000000001
0.700000000000001 0.8 0.90.000
10.00020.00030.00040.00050.00060.000
x*y*v*x0v0
Testbereich wird kleiner mit wachsendem r13 bis kein Test mehr;Wert der Politik steigt (Testkosten relativ klein)
The influence of testing cost in the transition from testing to not testingr23 r12 m1 m2 m3 s1 s2 s3 c1
0.4 0.4 10 10 10 10 10 10 0.1
r13 c2 x* y* v* x0 v0
0,4 0,5 22,847 29,679 16,504 - -0,6 0,5 26,594 28,046 20,393 - -0,8 0,5 - - - 28,522 24,8180,4 1,0 25,177 25,628 16,161 - -0,6 1,0 - - - 27,370 20,4220,8 1,0 - - - 28,506 24,8050,4 2,0 - - - 25,687 16,2750,6 2,0 - - - 27,373 20,4240,4 3,0 - - - 25,687 16,2750,6 3,0 - - - 27,376 20,425
The influence of r13 in the extreme situation of r23 = 1 with r12 = 0,4r23 r12 m1 m2 m3 s1 s2 s3 c1 c2
1.0 0.4 10 10 10 10 10 10 0.1 0.2
r13 x* y* v* x0 v0
0,1 -18,782 333,50 24,740 - -0,2 2,723 169,664 25,232 - -0,3 9,039 114,361 25,560 - -0,4 12,423 86,948 25,876 - -0,5 14,926 70,987 26,479 - -0,6 16,931 60,712 27,293 - -0,7 18,701 53,721 28,343 - -0,8 20,178 48,668 29,537 - -0,9 21,467 44,888 30,855 - -1 22,678 42,033 32,333 - -
0 2 4 6 8 10 120.000
5.000
10.000
15.000
20.000
25.000
30.000
35.000
x*y*v*x0v0
Größe der Testkosten zu v* bestimmend für Testbereich;c2 groß führt zum reinen Suchen.
-50.000
0.000
50.000
100.000
150.000
200.000
250.000
300.000
350.000
400.000
x*y*v*
v* wächst mit r13;Testintervall wird mit zunehmendem r13 kleiner.
The influence of r13 with r23 = 0 and variable r13
r23 r12 m1 m2 m3 s1 s2 s3 c1 c2
0 0.4 10 10 10 10 10 10 0.1 0.2
r13 x* y* v* x0 v0
0,1 - - - 19,016 10,9020,3 21,930 27,686 14,447 - -0,5 23,364 31,643 18,753 - -0,7 24,117 33,925 23,315 - -
The influence of r13 on the optimal policy with highly correlated variables x1 and x2
r23 r12 m1 m2 m3 s1 s2 s3 c1 c2
0.4 0.9 10 10 10 10 10 10 0.1 0.2
r13 x* y* v*
0,1 -3,941 211,868 19,3910,2 11,334 79,123 16,9530,3 17,816 39,915 15,6590,4 24,557 26,560 16,2230,5 25,091 27,745 18,2080,6 22,855 35,152 21,4020,7 21,229 42,088 25,1620,8 20,231 48,342 29,429
From this results the conclusion that it seems reasonable that we require f < 0.
f = r12r13 - r23 Testbereich
-0,31 215,800-0,22 67,800-0,13 22,100-0,04 2,0000,05 2,6540,14 12,3000,23 20,8600,32 28,110
0.0005.000
10.00015.00020.00025.00030.00035.00040.000
x*y*v*x0v0
Ergebnis nicht verständlich! Wozu testen wenn Korr(1,3) immer größer wird ?
-0,3
1
-0,2
2
-0,1
3
-0,0
4
0,05
0,14
0,23
0,32
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8-50.000
0.000
50.000
100.000
150.000
200.000
250.000
x*y*v*Testbereich
Nicht plausibel für f > 0f=r13r12-r23
Tabelle 11: The influence of r12 on the optimal policy r12 ≠ 1) according to the preconditionsr13 r23 m1 m2 m3 s1 s2 s3
0.6 0.8 10 10 10 10 10 10
r12 x* y* v*
0,10 17,802 55,896 26,1040,20 18,265 53,131 25,4180,40 19,169 48,713 24,3620,60 19,766 45,484 23,3790,80 20,032 44,724 23,4300,95 17,869 55,497 26,0060,98 14,901 74,862 30,934
37,60159,961
Testbereich
38,09434,86629,54425,71824,702
0.10 0.20 0.40 0.60 0.80 0.95 0.980.000
10.000
20.000
30.000
40.000
50.000
60.000
70.000
80.000
x*y*v*Testbereich
Nicht plausibel, da für große r 12 ein Testen nicht sinnvoll erscheint.
Tabelle 12: An investigation into the role of f and r12r23 - r13 on the optimal policyr13 x* y* v* x0 v0
0,20 11,334 79,123 16,953 - -0,30 17,816 39,915 15,659 - -0,32 19,168 35,780 15,593 - -0,34 20,571 32,524 15,626 - -0,35 21,257 31,153 15,671 - -0,37 22,614 28,883 15,827 - -0,39 23,945 27,207 16,074 - -0,41 25,125 26,035 16,388 - -0,43 - - - 25,994 16,8770,44 - - - 26,185 17,0790,444 - - - 26,129 17,1610,45 - - - 26,185 17,2830,47 26,034 26,123 17,557 - -0,49 25,406 27,144 17,975 - -
Tabelle 13: The influence of r23 on the optimal policyr13 r12 m1 m2 m3 s1 s2 s3 c1 c2
0.6 0.4 10 10 10 10 10 10 0.1 0.2
r23 x* y* v* x0 v0
0,28 - - - 27,367 20,4200,3 27,079 27,522 20,380 - -0,4 25,249 30,061 20,593 - -0,6 21,846 38,169 22,005 - -0,8 19,169 48,713 24,362 - -0,9 18,017 54,575 25,775 - - 1,0 16,931 60,712 27,293 - -
0.200.30
0.320.34
0.350.37
0.390.41
0.430.44
0.440.45
0.470.49
0.000
10.000
20.000
30.000
40.000
50.000
60.000
70.000
80.000
90.000
x*y*v*x0v0
0.28 0.3 0.4 0.6 0.8 0.9 10.000
10.000
20.000
30.000
40.000
50.000
60.000
70.000
x*y*v*x0v0
MacQueen (1964) zeigt ua, daß eine Interpretation dieser Lösung als 2facher Test möglich ist und1)aus einer großen Anzahl von Möglichkeiten genau N app. optimal unter Einhaltung eines Testbudgets von C gewählt werden können und2) die optimale Ausschöpfung eines beschränkten Budgets B für wiederholte derartige Sequentialtests ohne Beschränkung von deren Anzahl zur Maximierung der Summe der Werte approx. möglich ist.
DeGroot, M.,Optimal Statistical Decisions, McGraw-Hill Company,N.Y., 1970
Ferschl, F., Nutzen- und Entscheidungstheorie, Köln-Opladen,Westdeutscher Verlag,1975
MacQueen, J.B.,Optimal Policies for a Class of Search and Evaluation Problems, Management Science, Vol. 10, No.4,pp. 746 ff
Man kann zeigen: Diese Probleme lassen sich vermeiden, wenn r12r23 - r13 ≤ 0 und r12r13-r23 ≤ 0 erfüllt wird !!