Test partielle information2011neu

256 Aufrufe

Veröffentlicht am

Shows how to optimal stop searching for normal distributed values with search costs and correlated costly observable attributes

Veröffentlicht in: Business
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
256
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
1
Aktionen
Geteilt
0
Downloads
1
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Test partielle information2011neu

  1. 1. Partielle Information in der Entscheidungstheorie em.o.Univ. Prof. Dkfm. Dr. Wolfgang Janko, WU
  2. 2. Grundmodell der Entscheidungstheorie Handlungsalternativen Umweltzustände z1 z2 … zm Konsequenzen a1 x11 x12 … x1m a2 x21 x22 … x2m … … … … … an xn1 xn2 … xnm Umweltzustände Handlungsalternativen z1 z2 … zm a1 u(x11) u(x12) … u(x1n) a2 u(x21) u(x22) … u(x2n) . . . . . . . . . . . . . . . … u(xmn) am u(xm1) u(xm2) Nutzenmatrix
  3. 3. Informationssystem: Nachrichten Umweltzustände y1 y2 … yk Wahrscheinlichkeiten z1 w(y1│z1) w(y2│z1) … w(yk│z1) z2 w(y1│z2) w(y2│z2) … w(yk│z2) . . . . . . . . . . . . . . . zm w(y1│zm) w(y2│zm) … w(yk│zm)
  4. 4. Bayes‘sches Theorem: m w( yj ) w( yj zi ) w( zi ) i 0 w( zi yj ) w( yj zi ) w( zi ) n w( yj zi ) w( zi ) i 0
  5. 5. Informationsbeschaffung a. Entscheidungstheorie formuliert auch Abbildungen von Nachrichten in den Aktionenraum (die auch randomisiert werden können; s. Ferschl, Nutzenund Entscheidungstheorie,Opladen,1975).Statt für Aktionen wird das Problem nun für Entscheidungsfunktionen betrachtet und liefert den Wert des Informationssystems. Igz zu vollständigen Aktionenmengen wird hier die Aktionenmenge als nur teilweise bekannt und zu Kosten c erweiterbar angesehen: a. Einstufig b. mehrstufig (sequentielle Beschaffungsmodelle)
  6. 6. Aktionensuche:
  7. 7. Alternativensuchmodelle +viele andere Modelle
  8. 8. Optimale Politik bei einfacher Alternativensuche und bekannter Verteilung des (Geld-)Nutzens F(u) mit Dichte f(u): Ermittlung von v* = erwarteter Wert bei optimaler Fortsetzung der Suche Stoppen wenn u ≥ v*! Ermittlung: v E max u, v c s v vf (u )du u f (u )du cs v vF(v) u f (u )du cs v v v (u v) f (u )du cs v TF(v) Wir erhalten v* als Nullstelle: TF(v)-cs=0 Bsp.: Für G(u,s) gilt: TF(v)-f(v)-v(1-F(v)) Für N [0,1] gilt: TF(v)=(v²+1)/2-v und v* = 1-√2cs (cs < ½) v f (u )du v u f (u )du cs v
  9. 9. Aktionensuche
  10. 10. Konjugierte Familie: a priori Verteilung = a posteriori Verteilung , Beispiele: Parameter Konjugierte Familie Bernoulli-Verteilung Beta-Verteilung Normalverteilung Gamma-Verteilung Normal Poisson-Verteilung Gamma-Verteilung Negative Binomialverteilung Beta-Verteilung Gleichverteilung Pareto-Verteilung Multinomialverteilung Dirichlet-Verteilung mehrdimensionale Normalverteilung Wishart-Verteilung
  11. 11. Sequentielle Alternativensuche mit Datenpräzisierung Bekannt: 3-dimensionale Verteilung der ZV X= (x1, x2, x3) Entscheider kann: X1 mit Suchkosten c1 beobachten, X2 mit Testkosten c2 beobachten. Er kann in jedem Fall akzeptieren oder mit der Suche fortfahren. Den wahren Wert X3 kennt er erst nach Akzeptanz. Wir nehmen an X ist multivariat normalverteilt mit den Parametern und der Korrelationsmatrix M.
  12. 12. Der Such- und Testprozess Verwerfen Verwerfen X1 Beobachten c1 X2 Testen c2 Akzeptieren X3
  13. 13. Optimale Politik Es muss untersucht werden, ob Testen überhaupt sinnvoll ist. Wenn nicht, dann ermittelt man den Wert der Politik v0 wie bei einer sequ. Politik. Ist Testen sinnvoll, so werden die Werte x* (<) und y* ermittelt, die das Testintervall definieren. Für x>y* nehme an, für x<x* verwerfe und für x*<x<y* teste. Mit v* errechnet man den Wert der Politik.
  14. 14. Tabelle 1: The influence of search costs c1 on the optimal policy 0.6 0.4 10 10 10 x0 x* y* v* 30,065 24,957 21,865 18,828 13,708 11,563 9,051 7,053 5,854 4,805 3,334 2,437 1,169 -4,193 41,262 36,152 33,063 30,024 24,905 22,763 20,249 18,248 17,053 16,004 14,532 13,636 12,368 6,563 20,265 18,222 16,986 15,770 13,723 12,866 11,860 11,059 10,582 10,162 9,573 9,215 8,708 7,005 10 yx-xx = konstant c2 1 v0 c1 0.01 0.05 0.1 0.2 0.5 0.7 1.0 1.3 1.5 1.7 2.0 2.2 2.5 4.0 10 10 50.0 40.0 30.0 x* 20.0 y* v* 10.0 0.0 -10.0 0.01 0.05 0.1 0.2 0.5 0.7 1.0 1.3 1.5 1.7 2.0 2.2 2.5 4.0 0.4 Tabelle 2: The influence of testing costs on the optimal policy 15,535 18,792 20,352 21,846 23,011 23,785 24,523 25,51 27,027 - 47,098 42,883 40,776 38,169 36,629 33,83 31,947 29,861 27,478 - 22,787 22,505 22,333 22,005 21,593 21,284 20,947 20,611 20,352 - 27,3724 27,373 27,3739 27,3748 20,424 20,424 20,4243 20,4249 50.0 45.0 40.0 35.0 x* 30.0 y* 25.0 v* 20.0 15.0 x0 10.0 v0 5.0 0.0 2.5 0,01 0,05 0,1 0,2 0,35 0,5 0,7 1, 1,5 1,7 2, 2,2 2,5 2.2 v0 2. x0 1.7 v* 1.5 y* c1 0.1 10 1. x* 10 0.7 c2 10 0.5 10 0.35 10 0.2 10 0.1 0.4 0.05 0.6 0.01 0.6
  15. 15. Tabelle 3: The influence of the ratio c 1 /c 2 on the optimal policy 0,395 0,39 0,35 0,3 0,25 0,22 0,2 0,18 0,15 0,1 0,05 0,01 0,005 0,01266 0,0256 0,1428 0,3333 0,6 0,8182 1,0 1,222 1,667 3,0 7,0 39,0 79,0 29,195 28,417 23,155 20,291 17,095 16,360 15,582 14,797 13,584 11,267 8,100 2,336 0,483 52,205 51,559 47,367 46,022 45,381 45,020 45,136 45,296 45,669 46,775 49,079 54,194 56,347 28,413 27,993 25,163 23,891 22,987 22,418 22,215 22,027 21,770 21,416 21,156 21,014 21,010 Tabelle 4: The influence of the mean value 0.6 1 of Hohe Testkosten c2 weniger Einfluss als hohe Suchkosten c1 90.0 80.0 70.0 60.0 c2 50.0 c1/c2 40.0 x* 30.0 v* 10.0 0.0 x 1 on the optimal policy 0.6 0.4 10 10 10 x* 3 5 10 15 20 y* 20.0 0.3… 0,005 0,01 0,05 0,1 0,15 0,18 0,2 0,22 0,25 0,3 0,35 0,39 0,395 0.39 v* 0.35 y* 0.3 x* 0.25 c1/c2 10 0.22 c2 10 0.2 c1 10 0.18 10 0.15 10 0.1 10 0.05 0.4 0.01 0.8 0.0… 0.6 c1 + c2 0.4 y* v* x0 v0 14,846 16,846 21,846 26,846 31,846 31,169 33,169 38,169 43,169 48,169 22,005 22,005 22,005 22,005 22,005 - - 10 c2 0.2 60.0 50.0 Erwarteter Ertrag vx bleibt gleich bei unverändertem Rest Testbereich verschiebt sich exakt um Mittelwertverschiebung 10 c1 0.1 40.0 x* 30.0 y* 20.0 v* 10.0 0.0 3 5 10 15 20
  16. 16. Tabelle 5: The influence of the mean value 0.6 2 of x 2 on the optimal policy 0.4 10 10 10 x* 5 10 20 0.6 y* v* x0 v0 21,846 21,846 21,846 38,169 38,169 38,169 22,005 22,005 22,005 - - 10 c1 0.1 10 c2 0.2 Kein Einfluss bei sonst gleichen Werten 50.0 40.0 30.0 x* 20.0 y* v* 10.0 0.0 Tabelle 6: The influence of the mean value 0.6 3 of x 3 on the optimal policy 5 0.6 10 10 10 10 x* 0 5 10 12 15 20 0.8 y* v* x0 v0 20,873 20,819 20,831 20,817 20,817 20,825 30,980 30,960 30,958 30,957 30,957 30,963 9,547 14,535 19,538 21,533 24,533 29,536 - - 10 20 c1 0.2 10 c2 1.0 35.0 30.0 25.0 20.0 15.0 10.0 5.0 0.0 x* y* v* 0 vx steigt mit 5 10 3 12 15 gleichmäßig parallel 20
  17. 17. Tabelle 7: The influence of 0.6 the standard deviation of x 1 on the optimal policy 0.6 10 10 10 x* 5 7 10 13 15 20 0.8 y* v* x0 v0 15,415 17,582 20,831 24,079 26,246 31,661 20,483 24,676 30,966 37,256 41,450 51,934 19,539 19,539 19,539 19,539 19,539 19,539 - - 10 c1 0.2 10 c2 1.0 1 kein Einfluss auf Ertrag, Testbereich wächst mit steigenden 1 60.0 50.0 40.0 x* 30.0 y* 20.0 v* 10.0 0.0 5 Tabelle 8: The influence of 0.6 2 the 10 13 15 20 standard deviation of x 2 on the optimal policy 0.8 0.6 10 10 10 x* 5 10 15 7 y* v* x0 v0 20,830 20,830 20,830 30,967 30,967 30,967 19,539 19,539 19,539 - - 10 c1 0.2 10 c2 1.0 2 hat keinen Einfluss auf Testbereich und vx. 40.0 x* 20.0 y* 0.0 v* 5 10 15
  18. 18. Tabelle 9: The influence of 0.6 0.8 3 the standard deviation of x 3 on the optimal policy 0.6 10 10 10 x* 2,5 5 7 10 13 15 20 y* v* x0 v0 20,501 20,432 20,831 21,454 21,717 22,187 21,834 26,270 30,966 34,518 36,296 39,667 13,350 15,607 19,539 24,029 27,106 35,116 17,404 - 11,110 - 10 c1 0.2 10 45.0 40.0 35.0 30.0 25.0 20.0 15.0 10.0 5.0 0.0 x* y* v* x0 v0 2.5 5 7 Mit abnehmendem Mit zunehmendem v*steigt mit 3. Tabelle 10: The influence of the correlation 0.4 13 of 10 13 15 20 wird nicht mehr getestet! erweitert sich der Testbereich; 3 3 x 1 and x 3 on the optimal policy 0.4 10 10 10 10 x* 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 c2 1.0 y* v* x0 v0 13,316 17,683 20,677 23,364 25,249 26,778 27,928 - 54,855 40,568 34,351 31,643 30,061 29,239 28,809 - 14,817 15,738 17,077 18,751 20,593 22,605 24,695 - 28,978 27,081 10 c1 0.1 10 c2 0.2 60.0 50.0 x* 40.0 y* 30.0 v* 20.0 x0 10.0 v0 0.0 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Testbereich wird kleiner mit wachsendem 13 bis kein Test mehr; Wert der Politik steigt (Testkosten relativ klein)
  19. 19. Tabelle 11: The influence of the correlation 0.4 3 of x 1 and x 3 on the optimal policy 10 10 10 10 10 c2 0,4 0,6 0,8 0,4 0,6 0,8 0,4 0,6 0,4 0,6 0.4 x* y* v* x0 v0 35.0 0,5 0,5 0,5 1,0 1,0 1,0 2,0 2,0 3,0 3,0 22,847 26,594 25,177 - 29,679 28,046 25,628 - 16,504 20,393 16,161 - 28,522 27,370 28,506 25,687 27,373 25,687 27,376 24,818 20,422 24,805 16,275 20,424 16,275 20,425 c1 0.1 10 30.0 25.0 x* 20.0 y* 15.0 v* 10.0 x0 5.0 v0 0.0 0 2 4 6 8 10 12 Größe der Testkosten zu vx bestimmend für Testbereich; c2 groß führt zum reinen Suchen. Tabelle 12: The influence of 1.0 13 in the extreme situation of 23 = 1 with 12 = 0,4 0.4 10 10 10 10 x* y* v* x0 v0 -18,782 2,723 9,039 12,423 14,926 16,931 18,701 20,178 21,467 22,678 333,50 169,664 114,361 86,948 70,987 60,712 53,721 48,668 44,888 42,033 24,740 25,232 25,560 25,876 26,479 27,293 28,343 29,537 30,855 32,333 - - 10 10 c1 0.1 c2 0.2 400.0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 350.0 300.0 250.0 x* 200.0 y* 150.0 v* 100.0 50.0 0.0 -50.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 vx wächst mit 13; Testintervall wird mit zunehmendm 13 1 kleiner.
  20. 20. Tabelle 13: The influence of 0 13 with 23 = 0 and variable 13 10 10 10 10 x* 0,1 0,3 0,5 0,7 0.4 10 y* v* x0 v0 10 27,686 31,643 33,925 14,447 18,753 23,315 19,016 - 10,902 - c2 0.2 40.0 21,930 23,364 24,117 c1 0.1 30.0 x* y* 20.0 v* 10.0 x0 0.0 0.1 10 10 23 x* y* v* Testbereich 250.0 -3,941 11,334 17,816 24,557 25,091 22,855 21,229 20,231 211,868 79,123 39,915 26,560 27,745 35,152 42,088 48,342 19,391 16,953 15,659 16,223 18,208 21,402 25,162 29,429 215,800 67,800 22,100 2,000 2,654 12,300 20,860 28,110 200.0 150.0 x* 100.0 y* 50.0 v* 0.0 0,32 -50.0 Testbereich 0,23 10 0,14 -0,31 -0,22 -0,13 -0,04 0,05 0,14 0,23 0,32 10 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 10 12 13 - v0 0.7 c2 0.2 -0,04 f= 10 c1 0.1 -0,13 0.9 on the optimal policy with highly correlated variables x 1 and x 2 -0,22 0.4 13 0.5 Ergebnis nicht verständlich! Wozu testen? -0,31 Tabelle 14: The influence of 0.3 From this results the conclusion that it seems reasonable that we require f < 0. 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 Nicht plausibel für f > 0 f= 13 12- 23
  21. 21. Tabelle 15: The influence of 0.6 12 on the optimal policy 12 ≠ 1) according to the preconditions 10 10 x* 0,10 0,20 0,40 0,60 0,80 0,95 0,98 0.8 10 10 y* v* Testbereich 17,802 18,265 19,169 19,766 20,032 17,869 14,901 55,896 53,131 48,713 45,484 44,724 55,497 74,862 26,104 25,418 24,362 23,379 23,430 26,006 30,934 38,094 34,866 29,544 25,718 24,702 37,601 59,961 10 10 80.0 70.0 60.0 50.0 40.0 30.0 20.0 10.0 0.0 x* y* v* Testbereich 0.10 0.20 0.40 0.60 0.80 0.95 0.98 Nicht plausibel, da für große 12 ein Testen nicht sinnvoll erscheint. !
  22. 22. Tabelle 16: An investigation into the role of f and 12 23 - 13 on the optimal policy x* 0,20 0,30 0,32 0,34 0,35 0,37 0,39 0,41 0,43 0,44 0,444 0,45 0,47 0,49 y* v* x0 v0 11,334 17,816 19,168 20,571 21,257 22,614 23,945 25,125 26,034 25,406 79,123 39,915 35,780 32,524 31,153 28,883 27,207 26,035 26,123 27,144 16,953 15,659 15,593 15,626 15,671 15,827 16,074 16,388 17,557 17,975 25,994 26,185 26,129 26,185 - 16,877 17,079 17,161 17,283 - Tabelle 17: The influence of 0.6 0.4 23 on 90.0 80.0 70.0 60.0 x* 50.0 y* 40.0 v* 30.0 x0 20.0 v0 10.0 0.0 the optimal policy 10 10 10 10 10 c1 0.1 10 c2 0.2 70.0 x* 0,28 0,3 0,4 0,6 0,8 0,9 1,0 y* v* x0 v0 60.0 27,079 25,249 21,846 19,169 18,017 16,931 27,522 30,061 38,169 48,713 54,575 60,712 20,380 20,593 22,005 24,362 25,775 27,293 27,367 - 20,420 - 50.0 x* 40.0 y* 30.0 v* 20.0 x0 10.0 v0 0.0 0.28 0.3 0.4 0.6 0.8 0.9 1.0
  23. 23. Man kann zeigen: Diese Probleme lassen sich vermeiden, wenn 12 23 - 13 ≤ 0 und 12 13- 23 ≤ 0 erfüllt wird! MacQueen (1964) zeigt, daß 1) Eine Interpretation der Lösung als 2facher Test möglich ist und 2) hiedurch die optimale Ausschöpfung eines beschränkten Budgets für wiederholte Sequentialtests approx. möglich ist DeGroot, M.,Optimal Statistical Decisions, McGraw-Hill Company,N.Y., 1970 MacQueen, J.B.,Optimal Policies for a Class of Search and Evaluation Problems, Operations Research, Vol. 8, No.3
  24. 24. Univ.Prof. Dipl.-Ing. Dr. Wolfgang PANNY Full Professor (retired) Department of Information Systems and Operations WU Vienna University of Economics and Business Welthandelsplatz 1, 1020 Vienna, Austria Phone: +43-1-31336-5221, Fax: +43-1-31336-905221 wolfgang.panny@wu.ac.at Personal data Date of birth: August 5, 1948 Citizenship: Austria Marital Status: married Education 2005 – 2007 WU, Department of Information Systems and Operations Chair of Department 1987 – 1989 WU, Department of Statistics and Mathematics Associate Professor 1986 – 1987 University of Bamberg (Germany), Department of Management Information Systems Full Professor 1985 – 1986 WU, Department of Statistics and Mathematics Associate Professor 1976 – 1985 WU, Department of Statistics and Mathematics Assistant Professor 1973 – 1976 WU, Department of Statistics and Mathematics Research and Teaching Assistant
  25. 25. Visiting positions Visiting Scientist, McMaster University (Hamilton, Ontario, Canada), Department of Mathematics and Statistics, 1987 Outside positions Austrian member of ISO/IEC JTC1/SC32/WG3 (Database Languages) Research interests > Algorithms and data structures > Design and analysis of algorithms > Databases and database languages Teaching experience > > > > > Algorithms and data structures Databases and database languages Information retrieval MIS, expert systems Analysis of algorithms Research projects > > > > > > IDIOM Information Diffusion Across Interactive Online Media; Partners: MODUL University Vienna, TU Graz, Gentics Software, Austria.info Systems GmbH, Prisma RAVEN Relation Analysis and Visualization for Evolving Networks; Partners: MODUL University Vienna, Know-Center, Gentics Software, SmApper Technologies Conference chairs > Section chair, Symposium Informationswirtschaft, Vienna 2003 > Section chair, 4th International Conf. on Lattice Path Combinatorics and Applications, Vienna 1998 > Section chair, Operations Research, Vienna 1990 > Host and Organizer, Working Group Meeting ISO/IEC JTC1/SC32/WG3, Vienna 2002 > Scientific Committee, 6th International Conf. on Lattice Path Combinatorics and Applications, Tennessee, USA, 2007 Refereeing Occasional refereeing (e.g. for Wirtschaftsinformatik, Teubner, Springer, Random Structures & Algorithms, The Computer Journal, Journal of Applied Probability, Journal of Statistical Planning and Inference, …)
  26. 26. Memberships > > > > > > Austrian Computer Society Austrian Mathematical Society Austrian Statistical Society GI-Special Interest Group for Information Retrieval Society for Industrial and Applied Mathematics (SIAM) Institute of Combinatorics and its Applications (ICA) Publications of the last years W. PANNY: A Lattice Path Combinatorial Approach to Rothe Numbers and Related Convolution Results, Fundamenta Informaticae 117 (2012), 265-277. E. ASCHAUER, E. EBERHARTINGER, W. PANNY: Cross-Border hybrid Finance and Tax Planning: Does International Tax Coordination Work? in: International Tax Coordination: An Interdisciplinary Perspective on Virtues and Pitfalls, ed.: M. Zagler (Routledge: London, 2010), 115-133. W. PANNY: Deletions in Random Binary Search Trees: A Story of Errors, Journal of Statistical Planning and Inference 140 (2010), 2335-2345.

×