הסתברות

הסתברות: להגביר את הסיכוי להצליח בסטטיסטיקה

מהי הסתברות ולמה היא חשובה?

הסתברות הינה מושג בסיסי בסטטיסטיקה אותו לומדים בד"כ בקורסי מבוא לסטטיסטיקה או סטטיסטיקה א'. מושג זה ,עוזר לנו להבין את הסבירות או את הסיכוי של אירוע להתרחש. ניתן להשתמש בהסתברות לביצוע תחזיות, ניתוח נתונים וקבלת החלטות במצבים של אי ודאות.הבנה טובה של מושג ההסתברות יכולה לעזור לכם לבצע טוב יותר בבחינות ובמטלות, מכיוון שהיא מהווה מרכיב מרכזי בניתוחים סטטיסטיים רבים!
אי פעם תהיתם כיצד מקבלים תחזיות או החלטות כאשר מתמודדים עם אי ודאות? החל מתחזיות מזג אוויר ועד השקעות פיננסיות, ההסתברות משחקת תפקיד חיוני בחיי היומיום שלנו. הסתברות אולי נראית כמו מושג מורכב ומופשט, אבל היא למעשה נמצאת סביבנו בחיי היומיום שלנו. כל המצבים שהוזכרו קודם כרוכים בהסתברות, והבנתה יכולה לעזור לנו לקבל החלטות ותחזיות טובות יותר. במאמר זה, נפרק את היסודות של הסתברות למונחים קלים להבנה, ונספק לכם את הידע והמיומנויות להתמודד עם בעיות הסתברות בביטחון. עד סוף מאמר זה, תוכלו ליישם את הידע החדש שלכם על הסתברות על תרחישים שאלות ממבחנים ומטלות, ולהשיג ביצועים טובים יותר בקורס הסטטיסטיקה שלכם!

פונקציית ההסתברות, הידועה גם כפונקציית מסת ההסתברות (PMF), היא פונקציה הממפה עבורנו את התוצאות האפשריות עבור ניסוי מסוים ואת ההסתברויות או הסיכוי לקבל כל תוצאה.
נניח: מרחב המדגם של ניסוי פשוט הוא Ω וA הוא מאורע בתוך מרחב המדגם הנ"ל.
אזי: למאורע A נוכל להתאים ערך מספרי, שאותו נסמן ב-P(A), ונקרא לו ההסתברות של A. הסתברות הינו מדד הסבירות או הסיכוי שאירוע מסוים יתרחש ומבוטא כמספר בין 0 ל-1.
פונקציית הסתברות על כן מקיימת את אקסיומות ההסתברות הבאות:

  1. P(A)≥0 עבור כל מאורע A . כלומר, הסתברות יכולה לקבל ערכים חיוביים בלבד.
  2. P(Ω)=1  כלומר, הסיכוי שכל המאורעות בעולם התוכן יקרו, היא 1 (100%).
  3. P(A∪B)=P(A)+P(B)-P(A∩B)

אם A ו-B מאורעות זרים, קרי P(A∩B)=0 אזי P(A∪B)=P(A)+P(B) . איחוד בין קבוצות משמעו ספירת כל האיברים שקיימים בקבוצה אחת או בקבוצה השנייה או בשתיהן גם יחד. לפיכך, במידה ולא קיים אף איבר משותף בין קבוצות A וB, החלק האחרון פשוט יהיה קבוצה ריקה או אפס. במקרה כזה, הסיכוי לאיחוד המאורעות יהיה שווה לחיבור שלהן.

את שני המשפטים האחרונים ניתן להדגים באמצעות דיאגרמת Venn:

נניח מאורעות A וB זרים כפי שניתן לראות בתרשים:

האיחוד שלהם יהיה כל המאורעות בA (או ההסתברות להתרחשות מאורע A) פלוס כל המאורעות בB (או ההסתברות להתרחשות מאורע B) ומכיוון שלא קיימת חפיפה ביניהם, אין צורך לקחת בחשבון את החיתוך.

במידה ומאורעות A וB אינם זרים כפי שניתן לראות בתרשים:

עלינו לקחת בחשבון את האיברים המשותפים או ההסתברות המשותפת. מכיוון שאנו סופרים את האיברים או ההסתברות פעמיים (פעם אחת מהכיוון של A ופעם נוספת מהכיוון של B), על מנת להימנע מכפילויות בעת האיחוד אנחנו מחסירים פעם אחת את הסתברות החיתוך בין A לB, ומכאן מגיעה הנוסחה: P(A∪B)=P(A)+P(B)-P(A∩B)

בואו נראה דוגמא לשאלה:
במחקר על זיכרון, חוקרים גילו כי 60% מהמשתתפים יכלו להיזכר ברשימה של 10 מילים שהוצגו בפניהם. בנוסף, 40% מהמשתתפים דיווחו שהרגישו פחות לחוצים לאחר השלמת תרגיל הרפיה. כמו כן, החוקרים מצאו ש-25% מהמשתתפים גם זכרו את המילים וגם דיווחו שהרגישו פחות לחוצים. מהי ההסתברות שמשתתף שנבחר באקראי ייזכר במילים, ידווח שהוא מרגיש פחות לחוץ או שניהם יחד?

פתרון לפי שלבים

שלב 1: כתיבת הנתונים וההסתברויות הנתונות

A יהיה המאורע "זוכר את המילים", ו – B יהיה המאורע "מרגיש פחות לחוץ". אנו רוצים למצוא את ההסתברות של A או B, או שניהם.

P(A)= 0.6

P(B) = 0.4

מכיוון שכתוב לנו ש25% מהמשתתפים גם זכרו את המילים וגם דיווחו שהרגישו פחות לחוצים, נכתוב שהחיתוך שווה 25%:  P(A ∩ B) = 0.25

כאשר מצוין בפנינו "או A או B", מתכוונים שמעוניינים בהסתברות שלפחות אחד מהמאורעות A או B יתרחש. בבעיה זו, אנו מעוניינים בהסתברות שהמשתתף או יזכור את המילים, או ירגיש פחות לחוץ, או שניהם. מילים אלו מרמזות לנו על כך שאנו מתבקשים למצוא את ההסתברות לאיחוד המאורעות A (המשתתף זוכר מילים) ו-B (המשתתף מרגיש פחות לחוץ).

אם נציב את הערכים האלה בנוסחה:

P(A∪B) = P(A) + P(B) – P(A ∩ B)

נקבל:

P(AB) = 0.6 + 0.4 – 0.25 = 0.75

לכן, ההסתברות שמשתתף שנבחר באקראי יזכור את המילים או ידווח שהוא מרגיש פחות לחוץ, או שניהם, היא 0.75.

איך מייחסים הסתברויות למאורעות (הסתברות כשכיחות יחסית)?

נניח שאנו מטילים מטבע. התוצאה שתתקבל יכולה להיות או "עץ" או "פלי". מה ההסתברות שייצא "עץ"? בהנחה כי אין עדיפות לתוצאה מסוימת, וכי מדובר במטבע הוגן, הסיכויים לשתי התוצאות יהיו שווים, ועל כן  נאמר כי 0.5 = ('עץ')P

אבל מה המשמעות של מספר זה? הכוונה היא שאם נבצע מספר רב של הטלות (כמעט אינסוף), אנו נצפה שבמחצית מהן נקבל את התוצאה "עץ" ובחצי השני, את התוצאה "פלי". השכיחות היחסית של המאורע "עץ" מוגדרת כמספר הפעמים שהתוצאה "עץ" התקבלה [("עץ")f], חלקי מספר הפעמים שמאורע זה קרה (n):

ניתן לחשוב על ההסתברות לקבלת התוצאה "עץ" כעל שכיחות יחסית לאחר מספר רב של הטלות. באופן כללי, ההסתברות של מאורע A לקרות שווה למספר התולדות במאורע זה, לחלק למספר התולדות הכללי:

בואו נראה שתי שאלות לדוגמה:

1. מהי ההסתברות לקבלת תוצאה אי-זוגית בהטלת קוביה?

{1,3,5}=A {1,2,3,4,5,6}, Ω. 

כפי שניתן לראות, מספר האפשרויות של מאורע A (תוצאה אי-זוגית) הוא 3 ומספר האפשרויות של Ω (תוצאה כלשהי בקובייה) הוא 6. לכן ההסתברות לקבלת תוצאה אי-זוגית בהטלת קוביה היא:

2. מטילים 2 קוביות מובחנות. מהי ההסתברות שסכום התוצאות יהיה 9?

מס' האפשרויות של A יהיה: 

A = {(3, 6), (4, 5), (5, 4), (6, 3)}

כלומר: n(A)=4

ומס' האפשרויות של אומגה יהיה:

{(6,6)…(1,1)}=Ω

כלומר: n=36 , ולכן ההסתברות שסכום התוצאות יהיה 9 היא

הסתברות מותנית

הסתברות מותנית עוסקת בהסתברות או בסיכוי של התרחשות של מאורע מסויים, כאשר נתון שמאורע אחר כבר התרחש. במילים אחרות, הסתברות מותנית היא ההסתברות להתרחשות אירוע A, בהינתן שאירוע B  כבר קרה. 

הנוסחה להסתברות מותנית היא:

 כאשר P(A | B) היא ההסתברות של A נתון להתרחש כאשר ידוע ש B כבר קרה, P(A∩B) הוא ההסתברות להתרחשות של A ו-B גם יחד

חשוב לציין כי: 

כדי להבין הסתברות מותנית טוב יותר, בואו נסתכל על דוגמא:

לפנינו נתונים, מחולקים לפי מגדר, המציגים את מס' הסטודנטים הלומדים בשנה א' בשני חוגים בפקולטה למדעי החברה: פסיכולוגיה (P) ותקשורת (C). הניחו כי כל הסטודנטים לומדים בתוכנית חד חוגית.

בוחרים סטודנט באופן אקראי, מה ההסתברות לבחור סטודנט.ית לתקשורת, אם ידוע שזו אישה?

כדי לפתור בעיה זו, עלינו להשתמש בהסתברות מותנית. אנו רוצים למצוא את ההסתברות לבחירת סטודנט.ית לתקשורת, בהתחשב בכך שידוע שנבחרה אישה. ב"סטטיסטית", אנחנו יכולים לכתוב זאת כך:

נשתמש בנתונים המופיעים בטבלה כדי לחשב הסתברויות אלו:

אנו רואים שבסה"כ ישנן 59 סטודנטיות, ומספר הסטודנטיות הלומדות תקשורת הוא 27. לכן, ההסתברות לבחור גם סטודנטית וגם סטודנטית  לתקשורת היא:

לאחר מכן, עלינו למצוא את ההסתברות לבחור סטודנטית נקבה [P(F)]. ניתן לראות מהטבלה שישנן 59 סטודנטיות מתוך סך של 102 סטודנטים. לכן, ההסתברות לבחור סטודנטית נקבה היא:

כעת נוכל להציב את הערכים הללו בנוסחת ההסתברות המותנית:

כלומר, ההסתברות לבחירת סטודנט.ית לתקשורת, בהינתן שנבחר.ה נקבה, היא 27 חלקי 59. 

סיכום

לסיכום, הבנת סוגי ההסתברות השונים היא חיונית עבור תחומי לימוד רבים, החל ממתמטיקה ועד למדעי החברה. במאמר זה, חקרנו את המושגים הבסיסיים של הסתברות, כולל חיתוך ואיחוד, הסתברות מותנית והשימוש בדיאגרמות וון. על ידי הבנה טובה ושליטה במושגים אלה, תוכלו לשפר את סיכוייכם להצליח בקורסי הסטטיסטיקה השונים.