המודל הנורמטיבי
תורת תוחלת התועלת¶
Von Neuman & Morgenstern, 1947 הציעו את המודל הנורמטיבי תורת תוחלת התועלת (Expected Utility Theory). היא מתבססת על נוסחת תוחלת הערך של כל חלופה:
EV = Σ P(i) * V(i)
E = תוחלת, P = הסתברות, V = ערך
אלא שהנוסחא הזו עסוקה ברווח כספי, אבל מה שמטריד אותנו הוא תועלת - לאו דווקא רווח כספי. המודל מניח שמקבל ההחלטות מונע מרצון למקסם את תוחלת התועלת - כלומר, אם נבחר בבחירה הזו עד אינסוף, נקבל את הערך הגבוה ביותר מכל החלופות. לכן, הנוסחא שלו היא כזו:
EV = Σ P(i) * U(i)
E = תוחלת, P = הסתברות, U = תועלת
ניתן להמחיש את ההבדל באמצעות הפרדוקס של סנט פטרסבורג (1738).
מטילים מטבע וממשיכים עד שהמטבע נופלת על עץ. אם המטבע נופלת על עץ בהטלה ראשונה, השחקן מרוויח 1$ והמשחק מסתיים, אם המטבע נופלת בהטלה השנייה על עץ השחקן מרוויח 2$, לאחר 3 הטלות 4 $, כך שבכל הטלה נוספת כמות הכסף מוכפלת. נניח שאנו מעוניינים לקבוע את תוחלת הערך של ההימור.
EV = 1/2 * 1 + 1/4 * 2 + 1/8 * 4
, וככה עד אינסוף.
כעת נשאלת השאלה - כמה שחקן יהיה מוכן לשלם על מנת לשחק את המשחק? כנראה שלא יותר מדי; וזאת למרות תוחלת ההימור האינסופית - אם שחקן ישחק במשחק אינסוף פעמים, הוא בוודאות ייזכה ובגדול. אז למה שאנשים לא יסכימו לשלם?
דניאל ברנולי ניסה לפתור את הפרדוקס, בכך שטען כי פונקציית התועלת לכסף הינה בעלת ערך שולי פוחת. כלומר, התועלת שאנחנו מרגישים הולכת ופוחתת ככל שאנו מרוויחים יותר כסף - להרוויח אלף שקל ואז חמישים שקל מרגיש פחות טוב מלהרוויח חמישים שקל ואז עוד חמישים שקל.
דוגמה:
Two Gambles: A. 1 v=100 B. 0.001 $100,000 0.999 $0 EV(A)=EV(B)=100
Assuming that the function was logarithmic
U(x)=log10V(x) log10V(100)=2 log10V(100,000)=5 EU(A)= log10V(100)=2 EU(B)=.001* log10V(100,000)=.005 Therefore EU(A)>EU(B)
הנחות בסיס¶
שלמות¶
נניח וחלופה A היא טיול ללונדון, וB היא טיול לפריז. אם AוB בסט החלופות S אזי B ≤ A או A ≤ B או B ~ A
היכולת להשוות כל שתי אלטרנטיבות ולקבוע עדיפות של אחת על פני השנייה או אדישות. כלומר, לפי תורת תוחלת התועלת, לכל חלופה יש שיפוט - העדפה של החלופה הראשונה, השנייה, או אדישות ביניהן.
אי-תלות¶
נניח וחלופה A היא טיול ללונדון, B היא טיול לפריז וC היא טיול למדריד.
אם חלופות A, B וC בסט החלופות S, אזי B≤A אם ורק אם ApC ≥ BpC
כלומר, אם A מועדפת על B, אזי יחס העדפה צריך להישמר, אם מקבל החלטה מקבל בהסתברות P את A ובהסתברות 1-P את C ובהסתברות P את B ובהסתברות 1-P את C.
אם אני מעדיף את לונדון על פני פריז, והסיכוי שאבחר לטייל בלונדון הוא 0.6, הסיכוי שאבחר לטייל במדריד הוא המשלים (0.4), אבל אם הסיכוי שאבחר לטייל בפריז הוא 0.6, הסיכוי שאבחר לטייל במדריד הוא גם המשלים (0.4).
טרנזיטיביות¶
אם A > B וB > C, אזי A > C
אם אני מעדיף את פריז על פני לונדון, ואת לונדון על פני מדריד, אני מעדיף את פריז על פני מדריד.
אבל אם לא, ואני דווקא מעדיף את מדריד על פריז? זהו מצב של חוסר טרנזיטיביות. מצב זה מכונה משאבת הכסף - כי אם אני מעדיף את מדריד על לונדון, יש פתח לנצל את זה (תמורת סכום קטן, אתן לך את הטיול למדריד שאתה מעדיף, או את לונדון על פני מדריד, או את פריז על פני לונדון...)
לכן, אנחנו שואפים שההחלטות שלנו כן יהיו טרנזיטיביות.
המשכיות¶
עבור A, B וC בסט חלופות S, אם B ≤ A ו C ≤ B, אזי קיים P עבורו מתקיים B ~ (ApC)
A הכי טובה, C הכי גרועה, B ביניהן. אנחנו תמיד יכולים למצוא הימור כזה שבו נקבל את A בהסתברות P ואת C ב1-P, ואנחנו אדישים בין ההימור הזה לבין קבלה בוודאות של P.
כל זה טוב ויפה - אבל האם אנשים מתנהגים ככה בפועל? לא ולא, אומרים טברסקי וכהנמן.
הפרות¶
עקרון הדומיננטיות¶
עקרון הדומיננטיות הוא עיקרון בכל המודלים הנורמטיבים, והוא אומר שאף פעם לא נאמץ חלופה שנשלטת בידי חלופות אחרות.
Tversky & Shafir (1992) מדגימים הפרה של העיקרון.
לנבדקים הוצעה האפשרות להשתתף בהימור שבו היה 50% סיכוי לזכות ב 200$ ו-50% סיכוי להפסיד 100$. כשליש הסכימו להשתתף. ישנם שלושה תנאיי ניסוי: - נאמר לנבדקים שהם זכו בהימור - נאמר לנבדקים שהם הפסידו בהימור - נאמר לנבדקים שההימור נעשה, אך לא ניתנו תוצאות
האם הם מוכנים להשתתף באותו הימור פעם שניה?
נחשב את תוחלת הערך של ההימור:
EV = Σ P(i) * V(i)
כלומר,
EV = 0.5 * 200 + 0.5 * -100
מה שייתן 50
- תוחלת הערך חיובית; אם נשחק בניסוי אינסוף פעמים נזכה ב50$. אז למה שנגיד ששני-השליש שלא הסכימו להשתתף יהיו רציונליים?
כן נכנס עניין התועלת - אנשים מסוימים, למשל, שונאי סיכונים, ואז התועלת שלהם שונה; אם התועלת שלהם היא לא להפסיד, החישוב שלהם יהיה שונה - תועלת היא לאו-דווקא כספית!
ומי הסכים לשחק שוב? אלו שזכו בהימור (69%). אבל, רוב אלו שהפסידו גם היו מוכנים להשתתף פעם נוספת (59%). ובאופן הכי חריג - אלו שלא קיבלו תוצאות נטו שלא לנסות שוב (36%).
זוהי הפרה חלשה של עיקרון הדומיננטיות - מצבים שלא משנה מה יקרה, אנחנו יודעים מה נעשה - אבל חשוב לנו לדעת מה יקרה.
נניח ואתם מתלבטים אם לטוס לחו"ל מיד אחרי תקופת המבחנים. אם תצליחו, בטח שתטוסו - הרווחתם את זה. אם לא תצליחו, לפחות תהיו בחו"ל - גם תטוסו כנראה. אבל אם אתם לא יודעים? דווקא אז יהיה לנו הכי קשה להזמין את הכרטיס. זוהי הפרה של העיקרון - אם יש מצב שנבחר בו בכל תוצאה, למה שנהסס כל עוד התוצאה לא ידועה?
עקרון האי-תלות¶
הפרדוקס של Allais מדגים הפרה של עקרון האי תלות.
נניח ויש לנו כמה חלופות:
- חלופה A
אנחנו מקבלים מיליון דולר, בוודאות.
- חלופה B 10% לזכות ב2.5 מיליון דולר, 89% לזכות במיליון דולר, או אחוז לא לזכות בכלום.
רוב האנשים מעדיפים את חלופה A.
ואם נוסיף עוד חלופות? - חלופה C: 11% לזכות במיליון דולר 89% לא לזכות בכלום
- חלופה D 10% לזכות בשתיים וחצי מיליון דולר, ו90% לא לזכות בכלום
רוב האנשים בוחרים בחלופה D.
הבחירות האלו מפרות את עקרון האי-תלות (ר' סרטון ומצגת).
בתמצית - כשיש לנו שתי חלופות שיש דברים משותפים ביניהן, זה לא אמור לעניין אותנו - רק ההבדלים. אם אני מחפש לשכור דירה ומתלבט בין שתי דירות, ושתיהן בקומה השלישית - זה שהן בקומה השלישית לא אמור להפריע לי, אלא כל שאר הדברים.
חוסר טרנזיטיביות¶
נניח ואנחנו צריכים לבחור בין שלושה מועמדים:
IQ | ניסיון | מועמד |
---|---|---|
120 | 1 | A |
110 | 2 | B |
100 | 3 | C |
ונניח והקריטריונים שלנו לבחור הם:
- אם המועמדים שונים ביותר מ10 נקודות IQ, בוחרים על פי הIQ
- אם המועמדים אינם שונים ביותר מ10 נקודות IQ, בוחרים על פי הוותק.
לפי זה: - A (120) בהשוואה ל B (110) נבחר ב B על פי הוותק - B (110) בהשוואה ל C (100) נבחר ב C על פי הוותק - A (120) בהשוואה ל C (100) נבחר ב A לפי ה IQ
הפרת הטרנזיטיבית נובעת מהעובדה שחוק ההחלטה מבוסס על שני ממדים שונים - IQ וניסיון - אשר מתואמים ביחס הפוך. לפי עקרון הטרנזיטיביות:
אם העדפתי את B על פני A, ואת C על פני B, אני אמור להעדיף את C על פני A - אבל כאן עשינו בדיוק ההיפך, בגלל שגררנו פנימה את הIQ, והיחס בין הIQ לניסיון הפוך (יותר ניסיון, פחות IQ).
קביעות¶
הפרה מאוד בעייתית היא הפרת הנחת הקביעות1 (Invariance) - ההנחה כי אופן הצגת ההנחות לא צריכה להשפיע על ההחלטה.
למשל, הצגת החלופות כתהליך חד שלבי או דו שלבי, רווח או הפסד, צמצום תמותה או העלאת שרידות - לא אמורה להשפיע על ההעדפות כל עוד התוצאה זהה.
למשל, בין שתי החלופות האלו:
-
חלופה A אפשרות א': רווח בטווח של 30$ אפשרות ב: 80% להרוויח 45$
-
חלופה B בשלב הראשון, סיכוי של 75% לא להרוויח, ו25% לעבור לשלב נוסף שבו: אפשרות א': רווח בטווח 30$ אפרות ב': 80% להרוויח 45$
-
חלופה C אפשרות א': 25% להרוויח 30$ אפשרות ב: 20% להרוויח 45$
B וC זהים מבחינת תועלת. אבל, A וB נתפסים כזהים - למרות שהם לא. ההעדפות שלנו, בהתאם, מפרות את עקרון הקביעות - זה שבB יש שלב נוסף מטה אותנו לטובת B, למרות שהיא זהה לC.
-
המשותפת לכל המודלים הנורמטיביים, לא רק לתורת תוחלת התועלת. ↩