המדריך להתפלגות נורמלית

לצאת מהנורמליות: המדריך להתפלגות נורמלית

ההתפלגות הנורמלית, המכונה לעתים קרובות התפלגות גאוס או עקומת פעמון, היא מושג יסוד בסטטיסטיקה והסתברות. בבסיסה, התפלגות זו מייצגת נקודות נתונים שמתקבצות בעיקר סביב ערך מרכזי, הממוצע. הסימטריות של ההתפלגות מבטיחה שכל    מדדי המרכז שלה: הממוצע, השכיח והחציון של ההתפלגות יהיו שווים.  ההתפלגות הנורמלית תשמש אותנו לא רק למציאת ההסתברות שמאורעות מסוימים יקרו, אלא גם עבור ניתוחים סטטיסטיים מתקדמים יותר כגון מבחני t ומבחני Z.

שימוש בהתפלגות נורמלית

ההתפלגות הנורמלית יכולה לשמש אותנו בתחומים שונים. למשל באוכלוסיות, תכונות כמו גובה ומשקל תואמות בדרך כלל לצורת התפלגות זו. לרובם יש תכונות ממוצעות, עם פחות חריגים בכל אחד מהקצוות, מה שיוצר את עקומת הפעמון. מעבר להתרחשויות טבעיות, התפלגות זו מסייעת בהבנת שגיאות מדידה, שינויים בלחץ הדם, התפלגות ציוני IQ , תנודות בשוק הפיננסי ועוד. יתר על כן, אנו נשתמש בהתפלגות הנורמלית בשביל קירוב התפלגויות הסתברות אחרות אחרות, כגון בינומי או פואסון. משפט הגבול המרכזי, אשר מהווה אבן יסוד בסטטיסטיקה, מדגיש את חשיבותו, וקובע שהתפלגות ממוצעים ממשתנים בלתי תלויים תתקרב בצורתה להתפלגות נורמלית, ללא קשר לאופי ההתפלגות המקורית ככל שהמדגם גדול יותר.

המדדים של ההתפלגות הנורמלית

שני פרמטרים מהותיים מגדירים את ההתפלגות הנורמלית: הממוצע, או התוחלת המסומן באות µ, המספק את הנקודה המרכזית, וסטיית התקן (σ) או השונות (σ^2) המייצגות את הפיזור של הנתונים. בהתפלגות הנורמלית התוחלת תגדיר את מרכז ההתפלגות, כך שככל שלהתפלגות תהיה תוחלת גדולה יותר, ככה המרכז שלה ייטה יותר ימינה. לעומת זאת, ככל שלהתפלגות נורמלית תוחלת קטנה יותר, ככה המרכז שלה ייטה יותר שמאלה. סטיית התקן של ההתפלגות תגדיר את הפיזור שלה. ככל שלהתפלגות סטיית תקן נמוכה יותר, הנתונים יהיה קרובים יותר לאחד לשני וההתפלגות תהיה מצומצמת יותר. לעומת זאת, ככל שלהתפלגות סטיית תקן גבוהה יותר, ההתפלגות הנתונים יהיו רחוקים יותר אחד מהשני והיא תיראה לנו מפוזרת יותר.

 

חישוב הסתברות בהתפלגות הנורמלית (ציוניו וטבלת Z)

כאשר מבקשים למצוא את ההסתברות של ערך או טווח ערכים מסוים בתוך ההתפלגות הנורמלית, יש לשקול את הממוצע (הערך המרכזי) ואת סטיית התקן (מדד לפיזור הנתונים), על מנת לחשב את ציון התקן של ההתפלגות. כאשר אנו נרצה למצוא הסתברות של טווח ערכים ספציפיים, אנו נשתמש בשטח מתחת לעקומה עבור אותו קטע. כדי לקבוע את ההסתברות עבור טווח נתון, נעקוב אחר הצעדים הבאים:

1. נמיר את ציון הגלם (X) לציון תקן (Z):  ציון z מייצג את המרחק של התצפית או הערך מהממוצע בסטיות תקן ואנו נשתמש בנוסחה הבאה:2. נשתמש בטבלת Z : ברגע שמצאת את ציון ה-Z , עיין בטבלת Z המתאימה למוסד הלימודים שלך, אשר מספקת את ההסתברות הקשורה לכל ציון Z. לרוב, הערך שתמצא בטבלה מייצג את ההסתברות למצוא את השטח משמאל לציון ה -Z (כלומר הסיכוי למצוא ערך כמוהו או קטן יותר) . למשל, עבור התפלגות נורמלית עם ממוצע 100 וסטיית תקן 15 , השטח (או הסיכוי) "מתחת" ל – 120 ייראה כך :


באיור מעלה, השטח הכחול מייצג את הסיכוי למצוא ערך קטן או שווה ל120 (כ1.33 סטיות תקן מעל הממוצע) בהתפלגות נורמלית שהממוצע שלה הוא 100 וסטיית התקן היא 15. כפי שניתן לראות באיור, הסיכוי הזה לפי טבלת Z שווה ל90.88%. 

ציוני Z – מדד יחסי

בעולם הסטטיסטיקה, ציון Z משמש ככלי לביצוע תיקנון של ערכים (המרה לציוני תקן) והשוואה של נקודות נתונים מהתפלגויות שונות. כאמור, ערך z מייצג את המרחק של תצפית או נקודת נתונים מסוימת מהממוצע בסטיות תקן. על ידי המרת ציונים גולמיים מהתפלגויות שונות לערכי Z, נוכל למקם אותם על סולם משותף, מה שהופך את ההשוואות להגיוניות ופשוטות יותר. לדוגמה, נניח שישנם שני סטודנטים, אליס ובוב: אליס היא מבית ספר א' וקיבלה ציון 85 במבחן המתמטיקה שלה, שבו הציון הממוצע בבית הספר שלה הוא 80 עם סטיית תקן של 5. בוב הוא מבית ספר ב' וקיבל ציון 88 במבחן המתמטיקה שלו, שבו הציון הממוצע בבית הספר שלו הוא 92 עם סטיית תקן של 4. כדי להשוות את הביצועים שלהם, נוכל לחשב את ערכי ה-Z עבור שני הציונים.

עבור אליס :

עבור בוב :

על אף שציון הגלם של בוב גדול משל אליס, מאחר וביחס לממוצע כיתתו הוא מתחת לממוצע, ניתן לומר שבאופן יחסי, הציון של אליס גדול משל בוב, כפי שניתן לראות באיור מטה:  

כלל האצבע עבור התפלגות הנורמלית

כאשר ישנה התפלגות נורמלית של נתונים, סטיית התקן הופכת לשימושית במיוחד. ניתן להשתמש בה כדי לקבוע את הפרופורציה של הערכים הנופלים בתוך מספר מוגדר של סטיות תקן מהממוצע. לדוגמה, בהתפלגות נורמלית, 68% מהתצפיות נופלות בתוך מרחק של +/- 1 סטיית תקן מהממוצע. תכונה זו היא חלק מהכלל האמפירי, המתארת את אחוז הנתונים הנופלים בתוך מספרים ספציפיים של סטיות תקן מהממוצע של עקומות בצורת פעמון. אתם יכולים לראות בטבלה מטה, את ההרחבה של החלוקה הזו לפי הכלל אצבע של ההתפלגות הנורמלית: 


כמו כן, ניתן לראות באיור מטה את החלוקה של שטח ההתפלגות הנורמלית לפי סטיות תקן מהממוצע: 

שאלה

בואו נראה דוגמא לשאלה ופתרון: 

נפח המיצים בבקבוקים בחנות משקאות מסוימת מתפלג נורמלית עם ממוצע של 500 מיליליטר (מ"ל) וסטיית תקן של 40 מ"ל.

א. מה ההסתברות שנפחו של מיץ בבקבוקים שנבחר באקראי מהחנות יהיה בין 470 מ"ל ל-540 מ"ל?

ב. החנות החליטה להציע הנחת קידום מכירות על 20% מהמיצים בבקבוקים כדי להגביר את המכירות. הבקבוקים שנבחרו למבצע הם אלה עם הנפח הנמוך ביותר. מהו הנפח המקסימלי של מיץ בבקבוק שיוצע במחיר מוזל?

פתרון

ראשית, על מנת לדעת את ההסתברות למצוא בקבוק עם נפח בין שני ערכים, עלינו להמיר את שני הערכים הללו לציוני Z:   ברגע שיש לנו את ציוני ה-Z, נוכל למצוא את ההסתברויות הקשורות אליהם באמצעות שימוש בטבלת Z. אם נסתכל בטבלת Z, נראה שהסיכוי למצוא ציון Z קטן מ0.75- (או בציוני גלם, קטן מ470) הוא 0.2266. באותו האופן, הסיכוי למצוא ציון תקן קטן מ-1 הוא 0.8413. על מנת למצוא את ההסתברות שנפחו של מיץ בבקבוקים שנבחר באקראי מהחנות יהיה בין 470 מ"ל ל-540 מ"ל, עלינו להחסיר בין שתי ההסתברויות הללו:

ב. בהתחשב בכך ש-20% מהמיצים בבקבוקים מוצעים בהנחה ואלו הם המיצים עם הנפח הנמוך ביותר, הדבר שווה ערך למציאת ציון Z המשויך להסתברות מצטברת של 0.20. לאחר מכן אנו נוכל להשתמש באותו ציון Z כדי למצוא את הנפח המתאים. כמו כן, מכיוון שהשטח המצטבר הוא של 20%, אנו יכולים להבין שמדובר על ערך שנמוך מהממוצע. ככלל אצבע, כל ערך Z אשר השטח המצטבר שלו הוא נמוך מ-50%, ימוקם מתחת לממוצע ההתפלגות. מכיוון שכך, אנו מבינים שציון הZ של אותה נקודה יהיה שלילי כפי שניתן לראות באיור מטה: 


לפי טבלת Z, ציון הZ המתאים הוא  0.842-. ברגע שיש לנו את ציון ה-Z , נוכל להשתמש  בנוסחה למציאת ציון גלם: 

לפיכך, הנפח המקסימלי של מיץ בבקבוק שיוצע במחיר מוזל הוא 466.32 מ"ל.

סיכום

לסיכום, ההתפלגות הנורמלית, משמשת כאבן יסוד בניתוחים סטטיסטיים ובתורת ההסתברות. אופייה הסימטרי סביב הממוצע, יחד עם הפרמטרים שלה (הממוצע וסטיית התקן), מציעים דרך מובנית להבין ולפרש נתונים. היישומים המעשיים של התפלגות זו הם נרחבים, החל מהבנת תופעות טבע כמו התפלגות גובה, IQ ומשקל ועד ניתוחים מורכבים יותר. כלים כמו הכלל האמפירי ומשפט הגבול המרכזי מספקים מסגרות המאפשרות הבנה אינטואיטיבית ותחזיות המבוססות על התפלגות זו. בין אם מדובר בקביעת הסבירות לאירוע מסוים או בהשוואת ביצועים יחסיים בין מערכי נתונים שונים, ההתפלגות הנורמלית נותרת כלי הכרחי בעולם ניתוח הנתונים.

כלי נגישות

Powered by - Wemake