התפלגות הדגימה ומשפט הגבול המרכזי

מדריך מקיף להתפלגות הדגימה ומשפט הגבול המרכזי

מבוא

בתחום העצום של הסטטיסטיקה, הרעיון של התפלגות דגימה מהווה את הבסיס להכל. בבסיסה, התפלגות הדגימה היא התפלגות של נתון מסוים הנגזר ממדגמים רבים בגודל נתון שנלקחו מתוך אוכלוסייה ספציפית. הסיבה שבגללה התפלגות הדגימה היא כה חיונית היא בשל יכולתה להציע תובנות לגבי השונות והדיוק של ההשערות הסטטיסטיות שלנו, ובכך לאפשר לנו לבצע בדיקת השערות בהקשרים מחקריים שונים.

התפלגות הדגימה לעומת התפלגות האוכלוסייה והמדגם

 כדי להבין באמת את מהות התפלגויות הדגימה, חיוני להבחין בינה לבין שתי התפלגויות יסוד אחרות: התפלגות האוכלוסייה והתפלגות המדגם. התפלגות האוכלוסייה מייצגת את כלל נקודות הנתונים באוכלוסייה, ומציגה את התדירות או השכיחות שבה כל ערך מתרחש. מצד שני, התפלגות המדגם מתייחסת להתפלגות נקודות הנתונים בתוך מדגם בודד ספציפי שנלקח מאוכלוסייה זו. 

לעומת זאת, התפלגות הדגימה לוקחת צעד אחורה כדי להסתכל על התמונה הרחבה יותר. במקום להתמקד בנקודות נתונים בודדות, היא מתייחסת להתפלגות של נתון מדגם מסוים (כמו ממוצע או חציון) על פני מדגמים מרובים מהאוכלוסייה. על ידי הבנת התפלגות זו, ניתן להסיק מסקנות לגבי אוכלוסיות, אפילו כאשר אנו מצוידים רק בנתונים מחלק קטן מהם. 

סטטיסטי לעומת פרמטר

פרמטר מתייחס לערך מספרי המאפיין היבט של אוכלוסייה שלמה. למשל, אם היינו לוקחים בחשבון את הגבהים של כל אדם במדינה, הגובה הממוצע המחושב יהיה פרמטר האוכלוסייה. מצד שני, הסטטיסטי הוא ערך מספרי המתאר מאפיין של מדגם, שהוא רק תת-קבוצה של אותה האוכלוסייה.  למשל, אם היינו מודדים את הגבהים של קבוצה אחת של פרטים מתוך מדינה מסוימת, הגובה הממוצע של קבוצה זו יהיה סטטיסטי המדגם.

היופי בסטטיסטיקה טמון בהבנה שלעתים קרובות איננו יכולים למדוד אוכלוסייה שלמה – זה לא מעשי או בלתי אפשרי. לכן, אנחנו לוקחים דגימות ומחשבים סטטיסטי, כמו ממוצע המדגם. האתגר אם כן הוא להסיק על הפרמטר של האוכלוסייה מתוך הנתון המדגמי הזה (הסטטיסטי), ומכאן מגיע הרעיון של התפלגות הדגימה. התפלגות הדגימה מספקת מסגרת שעוזרת לנו להבין כיצד ממוצע המדגם שלנו קשור לממוצע האוכלוסייה בפועל, וכמה שונות אנו יכולים לצפות בין ממוצעי המדגם השונים. הבנת הקשר הזה הוא המפתח להסקת מסקנות מדויקות ומשמעותיות לגבי האוכלוסייה הגדולה יותר בעזרת נתוני המדגם שלנו.

איך נוצרת (תיאורטית) התפלגות הדגימה

כדי להבין איך נוצרת התפלגות הדגימה, תארו לעצמכם שיש לכם כד עצום מלא באינספור גולות, שכל אחת מהן מייצגת נקודת נתונים בודדת באוכלוסייה. לאחר מכן, באופן אקראי אנחנו נדגום מספר קבוע מראש של גולות (נניח 10 גולות) מהכד. בואו נניח, עבור מקרה זה בלבד, שאת אותן 10 גולות דגמנו 50 פעמים. אחרי שעשינו את זה נחשב את הערך הסטטיסטי – המשקל הממוצע של הגולות שנבחרו. לאחר שמצאנו את הממוצע, אנו מחזירים את כל הגולות לתוך הכד, ובכך אנו מבטיחים שהאוכלוסייה תישאר ללא שינוי. לאחר מכן, נוציא עוד מדגם אקראי של 10 גולות ונחשב את הממוצע של המדגם החדש הזה. תיאורטית, היינו ממשיכים בתהליך הזה מספר אינסופי של פעמים, כאשר בכל פעם היינו מחשבים את הממוצע של המדגם ואז מחזירים את הגולות לכד, אבל לצורך הדוגמא נסתפק ב50 פעמים בלבד. ככל שנמשיך לרשום את הממוצעים מכל מדגם, לאורך זמן, אנו נראה שמתגלה דפוס. הממוצעים הללו יתחילו ליצור התפלגות משלהם – התפלגות הדגימה של הממוצע, כפי שניתן לראות באיור מטה: 

כפי שאתם רואים, ההיסטוגרמה מעלה מציגה את המשקל הממוצע של 10 גולות, שנדגמו 50 פעמים. העמודות מייצגות את התדירות או השכיחות של ממוצעים שנדגמו בטווחי משקל ספציפיים והעקומה מספקת ייצוג של כלל ההתפלגות. ניתן לראות שרוב ממוצעי המדגם מתקבצים סביב                  הערך המרכזי, מה שמצביע על משקל ממוצע עקבי על פני הדגימות. הרעיון המרכזי כאן הוא שבעוד שלמדגמים בודדים עשויים להיות ממוצעים שונים מממוצע האוכלוסייה, כאשר אנו מסתכלים על ההתפלגות של כל ממוצעי המדגם האפשריים, אנו מתחילים לראות דפוס עקבי וניתן לחיזוי. דפוס זה של התפלגות הדגימה, יכול לספק לנו הבנות לגבי תכונות האוכלוסייה, גם אם לעולם לא יהיה ברשותנו את המידע של אוכלוסייה כולה. לעומת זאת, אם נגדיל את מספר הדגימות שלנו, נראה שהתפלגות הדגימה מתחילה לקבל צורה מוכרת:

הפרמטרים של התפלגות הדגימה

כאשר אנו דנים בהתפלגות הדגימה, במיוחד של ממוצעי המדגם, שני פרמטרים ראשוניים מופיעים כמתארים בסיסיים: הממוצע (תוחלת) של התפלגות הדגימה וסטיית התקן שלה, לעתים קרובות מכונה טעות התקן. ממוצע התפלגות הדגימה :  הממוצע או התוחלת (μ) של התפלגות הדגימה, הוא ממוצע כל ממוצעי המדגמים האפשריים. הדבר מבוסס על ההיגיון שאם היינו מחלצים אינסוף מדגמים ומחשבים את הממוצעים שלהם, הנטייה המרכזית תתכנס לכדי ממוצע האוכלוסייה האמיתי. לפיכך, בממוצע, ממוצעי המדגם הם אומדים חסרי הטיה של ממוצע האוכלוסייה. סטיית תקן של התפלגות הדגימה (טעות תקן):  טעות התקן משקפת את השונות (הפיזור) של ממוצעי המדגם ובאה לענות על השאלה: "בכמה ממוצעי המדגמים שלנו שונים זה מזה?". טעות התקן מחושבת כסטיית התקן של האוכלוסייה (σ) חלקי השורש של גודל המדגם (n). הרציונל הוא אינטואיטיבי: ככל שאנו מגדילים את גודל המדגם שלנו, כל ממוצע מדגם נגזר מיותר נקודות נתונים, מה שהופך אותו לאומדן יציב ומהימן יותר. לפיכך, השונות בין ממוצעי המדגמים שונים פוחתת, מה שמוביל לטעות תקן קטנה יותר. הבנת הפרמטרים הללו חיונית משתי סיבות: ראשית, ידיעת טעות התקן של התפלגות הדגימה עוזרת ליצור רווחי סמך, המספקים טווח שבתוכו נמצא כנראה פרמטר האוכלוסייה האמיתי. שנית, טעות התקן ממלאת תפקיד מרכזי בבדיקת השערות, וקובעת עד כמה סטטיסטי המדגם שלנו קיצוני ביחס להתפלגות הדגימה. הטבלה הבאה מספקת סיכום של הסמלים והנוסחאות העיקריות הקשורות לסטטיסטי המדגם ולפרמטרים של אוכלוסייה הן עבור ממוצע והן עבור פרופורציה וחישוב טעויות התקן שלהם:

משפט הגבול המרכזי

משפט הגבול המרכזי עומד כאחד העקרונות החשובים ביותר בסטטיסטיקה. הוא מציע גשר בין סטטיסטי המדגם ופרמטר האוכלוסייה, המבסס בדיקות ונהלים סטטיסטיים רבים. משפט הגבול המרכזי קובע כי ללא קשר לצורת התפלגות האוכלוסייה המקורית, התפלגות הדגימה של ממוצע המדגם מתקרבת להתפלגות נורמלית ככל שגודל המדגם גדל. ההתכנסות הזו לנורמליות היא מהירה להפליא, ולעתים קרובות מתקיימת אפילו עם גודל מדגם קטן יחסית. באופן כללי, ככל שהתפלגות האוכלוסייה שנדגם ממנה הייתה דומה יותר להתפלגות נורמלית, כך גודל המדגם הדרוש בשביל שמשפט הגבול המרכזי יעבוד יכול להיות קטן יותר. כפי שניתן לראות בתמונה מטה, עבור מדגם שנלקח מתוך אוכלוסייה שהתפלגותה נוטה להיות מוטה, ככל שהמדגם גדול יותר, כך התפלגות הדגימה דומה יותר בצורתה להתפלגות נורמלית:

תנאים בהם משפט הגבול המרכזי חל

דגימה אקראית: יש לדגום את הנתונים באופן אקראי מהאוכלוסייה. לכל תצפית בודדת צריך להיות סיכוי שווה להיכלל במדגם.

 אי תלות: התצפיות במדגם חייבות להיות בלתי תלויות זו בזו. הדבר מתקיים לעתים קרובות אם גודל המדגם מהווה פחות מ-10% מגודל האוכלוסייה.

גודל המדגם: למרות שאין סף קפדני, כלל אצבע הוא שגודל המדגם צריך להיות לפחות 30 (n≥30). עבור אוכלוסיות שאינן מתפלגות באופן נורמלי באופן מובהק, ייתכן שיידרשו גדלי מדגם גדולים יותר כדי שהתפלגות הדגימה תתקרב לנורמליות.

השלכות על צורת התפלגות הדגימה

היופי של משפט הגבול המרכזי  טמון בהשלכות שלו על צורת התפלגות הדגימה. גם אם התפלגות האוכלוסייה המקורית הייתה מוטה, יש לה בולטות  מסוימת או בעלת צורה שהיא רחוקה מעקומת הפעמון הקלאסית, התפלגות הדגימה של ממוצע המדגם תיטה להתפלגות נורמלית ככל שגודל המדגם יגדל. צורה נורמלית אופיינית זו, המכונה לעתים קרובות "עקומת הפעמון", היא סימטרית לגבי הממוצע ומתארת את הסבירות לקבל ממוצעי מדגם שונים. ככל שגודל המדגם גדול יותר, כך התפלגות זו תהיה קרובה יותר לעקומת פעמון מושלמת.

התפלגות הדגימה עבור הממוצע והפרופורציה

ממוצע המדגם

התפלגות הדגימה של ממוצע המדגם היא המוכרת ביותר, בעיקר בשל הקשר שלה עם משפט הגבול המרכזי. כפי שהדגשנו, לא משנה מהי צורת התפלגות האוכלוסייה, התפלגות הדגימה של הממוצע נוטה להתפלגות נורמלית ככל שגודל המדגם עולה. מאפיין זה מתקיים גם אם האוכלוסייה המקורית אינה מתפלגת נורמלי, מה שהופך אותה לכלי חזק להסקת מסקנות סטטיסטיות.

פרופורציית המדגם

התפלגות הדגימה של הפרופורציה היא התפלגות פרופורציות המדגם הנגזרות מדגימה חוזרת של פרופורציית המדגם מתוך האוכלוסייה. בדומה לממוצע המדגם, התפלגות הדגימה של הפרופורציה נוטה לנורמליות ככל שגודל המדגם עולה, בתנאי ששיעור ההצלחה באוכלוסייה אינו קרוב מדי לאפס או לאחת. באופן ספציפי, התנאים לקיום הנחת הנורמליות בהתפלגות פרופורציה הם : כאשר n זהו גודל המדגם וp זהו הפרופורציה (או שיעור ההצלחה) באוכלוסייה. כמו כן, כפי שניתן לראות באיור מטה, גם מידת הסימטריות של שיעור ההצלחה באוכלוסייה, משפיע על צורת התפלגות הדגימה של הפרופורציה: כפי שניתן לראות, ללא קשר לגודל המדגם, ככל שהפרופורציה של האוכלוסייה יותר קיצונית (אדום וסגול), צורת ההתפלגות נהיית פחות דומה לפעמון, בהשוואה למצבים בהם פרופורציית האוכלוסייה יותר נוטה לסימטריות (התפלגות כתומה, ירוקה וכחולה).

גורמים המשפיעים על התפלגות הדגימה

גודל המדגם

ככל שגודל המדגם עולה,  כך התפלגות הדגימה הופכת בצורתה לפעמונית יותר, ללא קשר להתפלגות האוכלוסייה המקורית, הודות למשפט הגבול המרכזי. כמו כן, גודל מדגם גדול יותר מוביל גם לטעות תקן קטנה יותר, מה שמרמז על פחות שונות בין סטטיסטי מדגם שונים. לצורך המחשה, בואו נחזור לדוגמא של הגולות ממקודם, אך הפעם ניקח מדגם של 10 תצפיות 100,000 פעם ומדגם של 40 תצפיות 100,000 פעם ונראה מה קורה:  

כמו שניתן לראות, התמונה מציגה את התפלגות הדגימה של משקלי גולות עבור שני גדלי דגימה: 10 ו-40 גולות שנדגמו 100,000 פעמים. האזור הכחול מציג את השונות במשקלים הממוצעים על פני  מדגמים של 10 גולות. לעומת זאת, האזור האדום, מציג את המשקלים הממוצעים עבור דגימות גדולות יותר של 40 גולות. ניתן לראות שההתפלגות עבור גודל המדגם הגדול יותר מרוכזת יותר, ומשקפת שונות מופחתת בין ממוצעי המדגם. 

הגודל היחסי בין המדגם לאוכלוסייה, בא לידי ביטוי גם הוא בעת דגימה ללא החזרה מאוכלוסיות סופיות. כאשר גודל המדגם מהווה חלק משמעותי מהאוכלוסייה (בדרך כלל יותר מ-5%), לגורם זה עשויה להיות השפעה רבה, ע"י צמצום התפשטות התפלגות הדגימה.

ככל שהשונות או הפיזור באוכלוסייה גדולה יותר, כך השונות בהתפלגות הדגימה גדולה יותר גם כן. הסיבה לכך היא שמדגמים שנלקחו מאוכלוסייה עם שונות גבוהה, נוטים יותר לייצר נתוני מדגם השונים באופן משמעותי מפרמטר האוכלוסייה. טעות התקן, המודדת את השונות של התפלגות הדגימה, עומדת ביחס ישר לסטיית התקן של האוכלוסייה.

התפלגות הדגימה ובדיקת השערות

תפקיד התפלגות הדגימה בקביעת התפלגות השערת האפס

בתחום ההסקה הסטטיסטית, התפלגות הדגימה ובדיקת השערות הם שני מושגים בסיסיים הפועלים במקביל כדי לאפשר לנו לקבל החלטות על האוכלוסייה. כאשר אנו עורכים בדיקת השערות, אנו למעשה משווים את נתוני המדגם שלנו להתפלגות דגימה המניחה שהשערת האפס נכונה. השוואה זו מאפשרת לנו להעריך עד כמה קיצוני או טיפוסי הנתון  שלנו שהתקבל במדגם בהקשר של התפלגות זו. בבדיקת השערות, התפלגות הדגימה עוזרת לנו לכמת את הסיכוי לקבל את תוצאת המדגם במקרה, במידה והשערת האפס היא נכונה. על ידי הבנת התפלגות זו, נוכל לשפוט באופן יותר מדויק האם ההבדלים שנצפו במדגם שלנו עשויים להיות משקפים הבדלים באוכלוסייה כולה, או אם הם רק התרחשויות אקראיות. לכן, התפלגות הדגימה היא לא רק מבנה תיאורטי אלא כלי קריטי עבור תהליך בדיקת ההשערות. 

התפלגות הדגימה וp-value

p-value הוא מדד בסיסי בבדיקת השערות, המייצג את ההסתברות לקבל נתון סטטיסטי קיצוני כמו, או קיצוני יותר, מזה שחושב במדגם, בהנחה שהשערת האפס נכונה. הסתברות זו נגזרת ישירות מהתפלגות הדגימה של השערת האפס. בעיקרו של דבר, ערך ה-p עוזר לנו להבין עד כמה הנתון המדגם שלנו חריג או נדיר בהקשר של התפלגות האפס. כאשר אנו מחשבים או מוצאים את ערך ה-p, אנו למעשה מאתרים את  סטטיסטי המבחן שלנו בתוך התפלגות הדגימה  של H0, וקובעים את מידת הסבירות לצפייה בנתון כזה או קיצוני ממנו תחתיה. ערך p קטן (מאלפא) מצביע על כך שהנתון הנצפה תחת השערת האפס נדיר מספיק כדי לספק לנו ראיות נגדה ועל כן לדחות אותהלחילופין, ערך p גבוה מאלפא, מצביע על כך שהנתון הנצפה מספק לנו ראיות בעד התפלגות הדגימה של H0, מה שבעצם מצביע על כך שעלינו לקבל אותה. 

חשיבותה התפלגות הדגימה במרווחי סמך

רווחי סמך הם הערכות טווח, שעם רמת ביטחון מסוימת, מכילים את פרמטר האוכלוסייה האמיתי. הקונספט של התפלגות הדגימה מהווה את הבסיס לבניית המרווחים הללו. בהתחשב בכך שהתפלגות הדגימה מספקת התפלגות של נתוני מדגם אפשריים, אנו יכולים להשתמש במאפיינים שלה כדי לקבוע טווח שבו סביר שנמצא את פרמטר האוכלוסייה ה"אמיתי". באופן ספציפי, טעות התקן מכמתת את השונות הצפויה בסטטיסטי המדגם. על ידי שימוש בשונות הזו והמאפיינים של ההתפלגות הנורמלית, נוכל לבנות מרווחים מסביב לנתוני המדגם שלנו אשר סביר להניח שלוכדים את פרמטר האוכלוסייה, בהסתברות מוגדרת מראש (למשל, 95% ביטחון). לדוגמה, עבור רווח סמך של 95% לממוצע האוכלוסייה, ניקח את ממוצע המדגם שלנו ונוסיף ונחסיר מרווח שגיאה. מרווח השגיאה הזה יבוסס על הטעות התקן ועל ערך z (או ערך t) התואמים את רמת הביטחון הרצויה.

דוגמאות ויישומים מהעולם האמיתי

במחקר רפואי, הבנת התפלגות הדגימה היא חיונית. למשל, בעת בדיקת יעילותה של תרופה חדשה, החוקרים יוכלו לנתח את התוצאות הממוצעות ממדגם של משתתפים. התפלגות הדגימה עוזרת לקבוע האם ההשפעות שנצפו הן מובהקות סטטיסטית או שהן היו יכולות להתרחש גם במקרה.

סוקרים אוספים נתונים מחלק מציבור הבוחרים כדי לחזות את תוצאות הבחירות. הבנת התפלגות הדגימה הינה חיונית אפוא בכדי לאמוד את מרווח הטעות ולפרש את תוצאות הסקר בהקשר של ציבור הבוחרים הגדול יותר.

חברות לוקחות לעתים קרובות חבילות גדולות של מוצרים כדי לבדוק את איכותם. התפלגות הדגימה מסייעת בקביעת הסבירות שהחבילה כולה עומדת בתקני איכות בהתבסס על תוצאות המדגם.

חוקרים עשויים לאסוף דגימות ממקומות ספציפיים כדי להעריך את רמות הזיהום. התפלגות הדגימה מודיעה להם על רמות הזיהום הסבירות על פני שטח רחב יותר.

חברות דוגמות לעתים קרובות תת-קבוצה של צרכנים כדי לבדוק תגובות למוצר או פרסומת חדשה. המשוב ממדגם זה אשר מנותח בהקשר של התפלגות הדגימה, עוזר לחזות את תגובת השוק הרחב יותר.

סיכום

לסיכום, התפלגות הדגימה, המבוססת על משפט הגבול המרכזי, מהווה אבן יסוד בסטטיסטיקה, ומאפשרת לנו לגשר בין תובנות ממדגמים ספציפיים לאוכלוסיות רחבות יותר. תפיסה זו מספקת הבנה לגבי האופן שבו ניתן להסיק בעזרת נתוני מדגם על אוכלוסיות שלמות. ראינו כיצד הפרמטרים של התפלגות הדגימה חיוניים לבדיקת השערות ובניית רווחי סמך. ככל שגודל המדגם גדל, התפלגות הדגימה נוטה לצורה פעמונית יותר, גם אם האוכלוסייה המקורית לא. הנחה זו הינה חיונית עבור יישומים בעולם האמיתי כמו ניסויים קליניים, סקרים פוליטיים וחקר שוק. למעשה, התפלגות הדגימה מאפשרת לנו לקבל החלטות מושכלות מתוך תת-קבוצה של נתונים, תוך הדגשת המשמעות של ניתוח סטטיסטי על פני תחומים שונים. בשביל הבנה מעמיקה יותר של התפלגות הדגימה, כולל סימולציה בלייב של איך התפלגות הדגימה נוצרת, פתירת תרגילים של בדיקת השערות ורווח סמך ועוד, אתם מוזמנים להצטרף לקורס סטטיסטיקה ב' שלנו.