Entscheidung bei Infomationsdefizit: Simultane optimale Alternativensuche und Nutzenpräzisierung...

Entscheidung bei Infomationsdefizit: Simultane optimale Alternativensuche und Nutzenpräzisierung

o.Univ. Prof. Dkfm. Dr. Wolfgang Janko, WU

Grundmodell der Entscheidungstheorie

Handlungsalternativen Umweltzustände

z1 z2 … zm

Konsequenzen

a1 x11 x12 … x1m

a2 x21 x22 … x2m

… … … … …

an xn1 xn2 … xnm

Umweltzustände

z1 z2 … zm

Handlungsalternativen

a1 u(x11) u(x12) … u(x1n)

a2 u(x21) u(x22) … u(x2n)

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

am u(xm1) u(xm2) … u(xmn)

Nutzenmatrix

Informationssystem:

Umweltzustände

Nachrichten

y1 y2 … yk

Wahrscheinlichkeiten

z1 w(y1│z1) w(y2│z1) … w(yk│z1)

z2 w(y1│z2) w(y2│z2) … w(yk│z2)

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

zm w(y1│zm) w(y2│zm) … w(yk│zm)

Bayes‘sches Theorem:

m

i

iijj zwzywyw0

)()()(

n

i

iij

iijji

zwzyw

zwzywyzw

0

)()(

)()()(

Auch mit Dichten und subjektiven Wahrscheinlichkeiten zu rechnen!

Informationsbeschaffung

a. Einstufigb. mehrstufig (sequentielle Beschaffungsmodelle)

Alternativensuchmodelle

+viele andere Modelle

bzw. ordinaler Nutzen bzw. Geldnutzen

Optimale Politik bei einfacher Alternativensuche und bekannter Verteilung des (Geld-)Nutzens

F(u) mit Dichte f(u):Ermittlung von v* = erwarteter Wert bei optimaler Fortsetzung der SucheStoppen wenn u ≥ v*!Ermittlung:

Wir erhalten v* als Nullstelle: TF(v)-c =0

Bsp.: Für N(0,1) gilt: TF(v)=f(v)-v(1-F(v))

Für Gvtlg in [0,1] gilt: TF(v)=(v²+1)/2-v und v* = 1-√(2cs )

(cs < ½)

s

v

s

vv

s

v

v

s

v

s

cduufvuv

cduufuduufvvcduufuvvF

cduufuduuvf

cvuEv

)()(

)()()()(

)()(

,max

TF(v)

s

Konjugierte Familie: a priori Verteilung = a posteriori Verteilung , Beispiele:

Parameter Konjugierte Familie

Bernoulli-Verteilung Beta-Verteilung

NormalverteilungGamma-Verteilung

Normal

Poisson-Verteilung Gamma-Verteilung

Negative Binomialverteilung Beta-Verteilung

Gleichverteilung Pareto-Verteilung

Multinomialverteilung Dirichlet-Verteilung

mehrdimensionale Normalverteilung Wishart-Verteilung ua

Sequentielle Alternativensuche mit Datenpräzisierung

Bekannt: 3-dimensionale Verteilung der ZV X = (x1, x2, x3)

Entscheider kann: X1 mit Suchkosten c1 beobachten,

X2 mit Testkosten c2 beobachten.

Er kann in jedem Fall akzeptieren oder mit der Suche fortfahren.

Den wahren Wert X3 kennt er erst nach Akzeptanz!

Wir nehmen an X ist multivariat normalverteilt mit den Parametern =(m m1, m2, m3) und der Korrelationsmatrix M.

Der Such- und Testprozess

Verwerfen

Verwerfen

X1 Suchen (X) X2 Testen (Y)

c1c2

Akzeptieren

X3 (V)

Optimale Politik

Es muss zunächst untersucht werden für die 3-dimensionale ZV (X,Y,V), ob Testen überhaupt sinnvoll ist. Man ermittelt den Wert

v0 und ermittelt T(v0 , v0) ≤ (Fall a) bzw. > (Fall b) v0 . Gilt Fall a) so wird überhaupt

nicht getestet und der Erwartungswert der Politik ist v* ( = v0). v0 wird rückgerechnet auf x0.

In Fall a) gilt bei einem Wert x von X: Istx < x0 wird abgelehnt, ist

x0 ≤ x so wird angenommen.

Im Fall b) kommt es zur Festlegung von Wertenx*, y* und v*

einer optimalen Politik beim Testen:

Vorgangsweise nach Aufsuchen einer Alternative mit Wert x von X :1. Gilt x<x* so wird diese abgelehnt und aufs Neue gesucht, gilt y* ≤ x wird gestoppt (akzeptiert)2. Gilt x*≤ x < y*, so wird getestet; der Test ergibt den Wert y von Y , wir untersuchen

a. gilt y < v* weitersuchen

b. v* ≤ y stoppen und akzeptieren.

Tabelle 1: The influence of search costs c1 on the optimal policyr13 r23 r12 m1 m2 m3 s1 s2 s3 c2

0.4 0.6 0.4 10 10 10 10 10 10 1

c1 x* y* v* x0 v0

0.01 30,065 41,262 20,2650.05 24,957 36,152 18,2220.1 21,865 33,063 16,9860.2 18,828 30,024 15,7700.5 13,708 24,905 13,7230.7 11,563 22,763 12,8661.0 9,051 20,249 11,8601.3 7,053 18,248 11,0591.5 5,854 17,053 10,5821.7 4,805 16,004 10,1622.0 3,334 14,532 9,5732.2 2,437 13,636 9,2152.5 1,169 12,368 8,7084.0 -4,193 6,563 7,005

Tabelle 2: The influence of testing costs on the optimal policyr13 r23 r12 m1 m2 m3 s1 s2 s3 c1

0.6 0.6 0.4 10 10 10 10 10 10 0.1

c2 x* y* v* x0 v0

0,01 15,535 47,098 22,787 - -0,05 18,792 42,883 22,505 - -0,1 20,352 40,776 22,333 - -0,2 21,846 38,169 22,005 - -

0,35 23,011 36,629 21,593 - -0,5 23,785 33,83 21,284 - -0,7 24,523 31,947 20,947 - -1, 25,51 29,861 20,611 - -1,5 27,027 27,478 20,352 - -1,7 - - - 27,3724 20,4242, - - - 27,373 20,4242,2 - - - 27,3739 20,42432,5 - - - 27,3748 20,4249

y*-x* = konstant

-10.000

0.000

10.000

20.000

30.000

40.000

50.000

x*y*v*

0.010.05 0.1 0.2

0.35 0.5 0.7 1 1.5 1.7 2 2.2 2.50.000

5.000

10.000

15.000

20.000

25.000

30.000

35.000

40.000

45.000

50.000

x*y*v*x0v0

Tabelle 3: The influence of the ratio c 1 /c 2 on the optimal policyr13 r23 r12 m1 m2 m3 s1 s2 s3 c1 + c2

0.6 0.8 0.4 10 10 10 10 10 10 0.4

c1 c2 c1/c2 x* y* v*

0,005 0,395 0,01266 29,195 52,205 28,4130,01 0,39 0,0256 28,417 51,559 27,9930,05 0,35 0,1428 23,155 47,367 25,1630,1 0,3 0,3333 20,291 46,022 23,891

0,15 0,25 0,6 17,095 45,381 22,9870,18 0,22 0,8182 16,360 45,020 22,4180,2 0,2 1,0 15,582 45,136 22,215

0,22 0,18 1,222 14,797 45,296 22,0270,25 0,15 1,667 13,584 45,669 21,7700,3 0,1 3,0 11,267 46,775 21,416

0,35 0,05 7,0 8,100 49,079 21,1560,39 0,01 39,0 2,336 54,194 21,0140,395 0,005 79,0 0,483 56,347 21,010

Tabelle 4: The influence of the mean value m1 of x1 on the optimal policyr13 r23 r12 m2 m3 s1 s2 s3 c1 c2

0.6 0.6 0.4 10 10 10 10 10 0.1 0.2

m1 x* y* v* x0 v0

3 14,846 31,169 22,005 - -5 16,846 33,169 22,005 - -10 21,846 38,169 22,005 - -15 26,846 43,169 22,005 - -20 31,846 48,169 22,005 - -

0.0050.01

0.05 0.10.15

0.18 0.20.22

0.25 0.30.35

0.390.395

0.0

10.0

20.0

30.0

40.0

50.0

60.0

70.0

80.0

90.0

c2c1/c2x*y*v*

Hohe Testkosten c2 weniger Einfluss als hohe Suchkosten c1

3 5 10 15 200.000

10.000

20.000

30.000

40.000

50.000

60.000

x*y*v*

Erwarteter Ertrag v* bleibt gleich bei unverändertem Rest Testbereich verschiebt sich exakt um Mittelwertverschiebung


0.6 0.6 0.4 10 10 10 10 10 0.1 0.2

m2 x* y* v* x0 v0

5 21,846 38,169 22,005 - -10 21,846 38,169 22,005 - -20 21,846 38,169 22,005 - -


0.6 0.8 0.6 10 10 10 10 10 0.2 1.0

m3 x* y* v* x0 v0

0 20,873 30,980 9,547 - -5 20,819 30,960 14,535 - -10 20,831 30,958 19,538 - -12 20,817 30,957 21,533 - -15 20,817 30,957 24,533 - -20 20,825 30,963 29,536 - -

5 10 200.0005.000

10.00015.00020.00025.00030.00035.00040.00045.000

x*y*v*

Kein Einfluss bei sonst gleichen Werten

0 5 10 12 15 200.000

5.000

10.000

15.000

20.000

25.000

30.000

35.000

x*y*v*

V* steigt mit m3 gleichmäßig parallel

Tabelle 7: The influence of s1 the standard deviation of x1 on the optimal policyr13 r23 r12 m1 m2 m3 s2 s3 c1 c2

0.6 0.8 0.6 10 10 10 10 10 0.2 1.0

s1 x* y* v* x0 v0

5 15,415 20,483 19,539 - -7 17,582 24,676 19,539 - -10 20,831 30,966 19,539 - -13 24,079 37,256 19,539 - -15 26,246 41,450 19,539 - -20 31,661 51,934 19,539 - -


0.6 0.8 0.6 10 10 10 10 10 0.2 1.0

s2 x* y* v* x0 v0

5 20,830 30,967 19,539 - -10 20,830 30,967 19,539 - -15 20,830 30,967 19,539 - -

5 7 10 13 15 200.000

10.000

20.000

30.000

40.000

50.000

60.000

x*y*v*

s1 kein Einfluss auf Ertrag, Testbereich wächst mit steigenden s1

5 10 150.000

10.000

20.000

30.000

x*y*v*

s2 hat keinen Einfluss auf Testbereich und vx.


0.6 0.8 0.6 10 10 10 10 10 0.2 1.0

s3 x* y* v* x0 v0

2,5 - - - 17,404 11,1105 20,501 21,834 13,350 - -7 20,432 26,270 15,607 - -10 20,831 30,966 19,539 - -13 21,454 34,518 24,029 - -15 21,717 36,296 27,106 - -20 22,187 39,667 35,116 - -

Tabelle 10: The influence of the correlation r13 of x1 and x3 on the optimal policyr23 r12 m1 m2 m3 s1 s2 s3 c1 c2

0.4 0.4 10 10 10 10 10 10 0.1 0.2

r13 x* y* v* x0 v0

0,2 13,316 54,855 14,817 - -0,3 17,683 40,568 15,738 - -0,4 20,677 34,351 17,077 - -0,5 23,364 31,643 18,751 - -0,6 25,249 30,061 20,593 - -0,7 26,778 29,239 22,605 - -0,8 27,928 28,809 24,695 - -0,9 - - - 28,978 27,081

2.5 5 7 10 13 15 200.0005.000

10.00015.00020.00025.00030.00035.00040.00045.000

x*y*v*x0v0

Mit abnehmendem s3 wird nicht mehr getestet!Mit zunehmendem s3 erweitert sich der Testbereich; v*steigt mit s3.

0.2 0.3 0.4 0.5

0.600000000000001

0.700000000000001 0.8 0.90.000

10.00020.00030.00040.00050.00060.000

x*y*v*x0v0

Testbereich wird kleiner mit wachsendem r13 bis kein Test mehr;Wert der Politik steigt (Testkosten relativ klein)

The influence of testing cost in the transition from testing to not testingr23 r12 m1 m2 m3 s1 s2 s3 c1

0.4 0.4 10 10 10 10 10 10 0.1

r13 c2 x* y* v* x0 v0

0,4 0,5 22,847 29,679 16,504 - -0,6 0,5 26,594 28,046 20,393 - -0,8 0,5 - - - 28,522 24,8180,4 1,0 25,177 25,628 16,161 - -0,6 1,0 - - - 27,370 20,4220,8 1,0 - - - 28,506 24,8050,4 2,0 - - - 25,687 16,2750,6 2,0 - - - 27,373 20,4240,4 3,0 - - - 25,687 16,2750,6 3,0 - - - 27,376 20,425

The influence of r13 in the extreme situation of r23 = 1 with r12 = 0,4r23 r12 m1 m2 m3 s1 s2 s3 c1 c2

1.0 0.4 10 10 10 10 10 10 0.1 0.2

r13 x* y* v* x0 v0

0,1 -18,782 333,50 24,740 - -0,2 2,723 169,664 25,232 - -0,3 9,039 114,361 25,560 - -0,4 12,423 86,948 25,876 - -0,5 14,926 70,987 26,479 - -0,6 16,931 60,712 27,293 - -0,7 18,701 53,721 28,343 - -0,8 20,178 48,668 29,537 - -0,9 21,467 44,888 30,855 - -1 22,678 42,033 32,333 - -

0 2 4 6 8 10 120.000

5.000

10.000

15.000

20.000

25.000

30.000

35.000

x*y*v*x0v0

Größe der Testkosten zu v* bestimmend für Testbereich;c2 groß führt zum reinen Suchen.

-50.000

0.000

50.000

100.000

150.000

200.000

250.000

300.000

350.000

400.000

x*y*v*

v* wächst mit r13;Testintervall wird mit zunehmendem r13 kleiner.

The influence of r13 with r23 = 0 and variable r13

r23 r12 m1 m2 m3 s1 s2 s3 c1 c2

0 0.4 10 10 10 10 10 10 0.1 0.2

r13 x* y* v* x0 v0

0,1 - - - 19,016 10,9020,3 21,930 27,686 14,447 - -0,5 23,364 31,643 18,753 - -0,7 24,117 33,925 23,315 - -

The influence of r13 on the optimal policy with highly correlated variables x1 and x2

r23 r12 m1 m2 m3 s1 s2 s3 c1 c2

0.4 0.9 10 10 10 10 10 10 0.1 0.2

r13 x* y* v*

0,1 -3,941 211,868 19,3910,2 11,334 79,123 16,9530,3 17,816 39,915 15,6590,4 24,557 26,560 16,2230,5 25,091 27,745 18,2080,6 22,855 35,152 21,4020,7 21,229 42,088 25,1620,8 20,231 48,342 29,429

From this results the conclusion that it seems reasonable that we require f < 0.

f = r12r13 - r23 Testbereich

-0,31 215,800-0,22 67,800-0,13 22,100-0,04 2,0000,05 2,6540,14 12,3000,23 20,8600,32 28,110

0.0005.000

10.00015.00020.00025.00030.00035.00040.000

x*y*v*x0v0

Ergebnis nicht verständlich! Wozu testen wenn Korr(1,3) immer größer wird ?

-0,3

1

-0,2

2

-0,1

3

-0,0

4

0,05

0,14

0,23

0,32

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8-50.000

0.000

50.000

100.000

150.000

200.000

250.000

x*y*v*Testbereich

Nicht plausibel für f > 0f=r13r12-r23

Tabelle 11: The influence of r12 on the optimal policy r12 ≠ 1) according to the preconditionsr13 r23 m1 m2 m3 s1 s2 s3

0.6 0.8 10 10 10 10 10 10

r12 x* y* v*

0,10 17,802 55,896 26,1040,20 18,265 53,131 25,4180,40 19,169 48,713 24,3620,60 19,766 45,484 23,3790,80 20,032 44,724 23,4300,95 17,869 55,497 26,0060,98 14,901 74,862 30,934

37,60159,961

Testbereich

38,09434,86629,54425,71824,702

0.10 0.20 0.40 0.60 0.80 0.95 0.980.000

10.000

20.000

30.000

40.000

50.000

60.000

70.000

80.000

x*y*v*Testbereich

Nicht plausibel, da für große r 12 ein Testen nicht sinnvoll erscheint.

Tabelle 12: An investigation into the role of f and r12r23 - r13 on the optimal policyr13 x* y* v* x0 v0

0,20 11,334 79,123 16,953 - -0,30 17,816 39,915 15,659 - -0,32 19,168 35,780 15,593 - -0,34 20,571 32,524 15,626 - -0,35 21,257 31,153 15,671 - -0,37 22,614 28,883 15,827 - -0,39 23,945 27,207 16,074 - -0,41 25,125 26,035 16,388 - -0,43 - - - 25,994 16,8770,44 - - - 26,185 17,0790,444 - - - 26,129 17,1610,45 - - - 26,185 17,2830,47 26,034 26,123 17,557 - -0,49 25,406 27,144 17,975 - -

Tabelle 13: The influence of r23 on the optimal policyr13 r12 m1 m2 m3 s1 s2 s3 c1 c2

0.6 0.4 10 10 10 10 10 10 0.1 0.2

r23 x* y* v* x0 v0

0,28 - - - 27,367 20,4200,3 27,079 27,522 20,380 - -0,4 25,249 30,061 20,593 - -0,6 21,846 38,169 22,005 - -0,8 19,169 48,713 24,362 - -0,9 18,017 54,575 25,775 - - 1,0 16,931 60,712 27,293 - -

0.200.30

0.320.34

0.350.37

0.390.41

0.430.44

0.440.45

0.470.49

0.000

10.000

20.000

30.000

40.000

50.000

60.000

70.000

80.000

90.000

x*y*v*x0v0

0.28 0.3 0.4 0.6 0.8 0.9 10.000

10.000

20.000

30.000

40.000

50.000

60.000

70.000

x*y*v*x0v0

MacQueen (1964) zeigt ua, daß eine Interpretation dieser Lösung als 2facher Test möglich ist und1)aus einer großen Anzahl von Möglichkeiten genau N app. optimal unter Einhaltung eines Testbudgets von C gewählt werden können und2) die optimale Ausschöpfung eines beschränkten Budgets B für wiederholte derartige Sequentialtests ohne Beschränkung von deren Anzahl zur Maximierung der Summe der Werte approx. möglich ist.

DeGroot, M.,Optimal Statistical Decisions, McGraw-Hill Company,N.Y., 1970

Ferschl, F., Nutzen- und Entscheidungstheorie, Köln-Opladen,Westdeutscher Verlag,1975

MacQueen, J.B.,Optimal Policies for a Class of Search and Evaluation Problems, Management Science, Vol. 10, No.4,pp. 746 ff

Man kann zeigen: Diese Probleme lassen sich vermeiden, wenn r12r23 - r13 ≤ 0 und r12r13-r23 ≤ 0 erfüllt wird !!

Date post:	05-Apr-2015
Category:	Documents
Upload:	friederike-hemp
View:	106 times
Download:	0 times

Entscheidung bei Infomationsdefizit: Simultane optimale Alternativensuche und Nutzenpräzisierung...

Documents