מדדי פיזור: המדריך לסטיית תקן, טווח בינרבעוני ושונות

המדריך למדדי פיזור: טווח, טווח בינרבעוני, שונות וסטיית תקן

מדדי פיזור הם נתוני תקציר המייצגים את כמות הפיזור הקיים במערך נתונים מסוים. בעוד שמדדי נטייה מרכזית מתארים את הערך הטיפוסי במערך המחקר, מדדי הפיזור מגדירים כמה רחוק נקודות הנתונים נוטות ליפול ממרכז הנתונים. פיזור נמוך של ערכים מצביע על כך שנקודות הנתונים נוטות להתקבץ בחוזקה סביב המרכז. פיזור גבוה מסמל שהם נוטים ליפול רחוק יותר.

בסטטיסטיקה, שונות, פיזור והתפשטות הן מילים נרדפות שמייצגות כולן את רוחב ההתפלגות. כשם שיש מספר מדדים של נטייה מרכזית, ישנם מספר מדדים של פיזור. בפוסט זה, נבין מדוע הבנת הפיזור של הנתונים היא קריטית. לאחר מכן, נבחן את המדדים הנפוצים ביותר של פיזור – הטווח, הטווח הבין-רבעוני, השונות וסטיית התקן. לבסוף, נבין כיצד ניתן לקבוע איזה מהם מתאים לנתונים שלך.

מדוע חשוב להבין מדדי פיזור?

בואו ניקח צעד אחורה ותחילה נבין מדוע הבנת מדדי פיזור היא כה חיונית. במחקר משתמשים לעתים קרובות במדדי מרכז כדי להבין משהו על הערכים המרכזיים של האוכלוסייה.  כאשר להתפלגות יש פיזור נמוך יותר, משמעות הדבר היא שהערכים במערך נתונים עקביים יותר. עם זאת, כאשר הפיזור גבוהה יותר, נקודות הנתונים שונות יותר וערכים קיצוניים הופכים לסבירים יותר. כתוצאה מכך, הבנת הפיזור עוזרת להבין את הסבירות לכך שאירועים חריגים יקרו.

מדדי הפיזור נמצאים בכל מקום. זמן הנסיעה לעבודה משתנה מעט מדי יום. כשאתה מזמין מנה אהובה במסעדה שוב ושוב, זה תמיד לא בדיוק אותו דבר בכל פעם. כל אלו הן דוגמאות לשונות בחיים האמיתיים ולכן מידה מסוימת של שונות היא בלתי נמנעת. עם זאת, יותר מדי חוסר עקביות יכול לגרום לבעיות. אם נסיעת הבוקר שלך נמשכת הרבה יותר מזמן הנסיעה הממוצע, תאחר לעבודה. אם המנה במסעדה שונה בהרבה ממה שהיא בדרך כלל, אולי לא תאהבו אותה בכלל. וגם, אם חלק מסוים מיוצר מחוץ למפרט המיועד לו, אולי הוא לא יתפקד כמתוכנן ועוד!

דוגמה למדד פיזור בחיי היומיום

בואו נחשוב למשל על שתי מסעדות פיצה. שתיהן מפרסמות שזמן האספקה הממוצע שלהן הוא כ- 20 דקות. כשאנחנו רעבים, שתי המסעדות נשמעות טוב באותה מידה! עם זאת, שוויון זה יכול להטעות! כדי לקבוע מהי המסעדה שאתה צריך להזמין ממנה כשאתה רעב, עלינו לנתח את הפיזור שלה. במילים אחרות, עד כמה משלוחי הפיצה עקביים או לא בהגעה שלהם אל בית הלקוח בזמן קרוב ל-20 דקות.  נניח שאנו לומדים את זמני האספקה שלהם, מחשבים את השונות לכל מקום. נניח ונראה שעל אף ששתי המסעדות מגיעות בממוצע תוך 20 דקות, למסעדה אחת יש זמני הגעה קיצוניים יותר מהשנייה. כמה משמעותי ההבדל הזה בהשגת פיצה ללקוחות שלהם באופן מיידי?

כאמור, שונות מסוימת היא בלתי נמנעת, אבל בעיות מתרחשות כאשר ישנה קיצוניות. התפלגויות עם פיזור גדול יותר מייצרות תצפיות עם ערכים גדולים וקטנים בצורה חריגה יותר ובתדירות גבוהה יותר מאשר התפלגויות עם פחות פיזור. כתוצאה מכך, פחות סביר שבפיצה הקיצונית יותר נקבל את הפיצה בזמן קרוב יותר לממוצע שלה ויותר סביר שניטה לאזורים הקיצוניים יותר. כעת, בואו נעבור על מדדי הפיזור השונים.

טווח (Range)

נתחיל עם הטווח מכיוון שהוא המדד הפשוט ביותר לחישוב והפשוט ביותר להבנה. הטווח של מערך נתונים הוא ההפרש בין הערכים הגדולים והקטנים ביותר באותו מערך נתונים. לדוגמה, בשני מערכי הנתונים שלהלן:

למערך נתונים 1 יש טווח של 97-2= 95 ואילו למערך נתונים 2 יש טווח של89-11 = 78. למערך נתונים 1 יש טווח רחב יותר, ומכאן, יותר פיזור ממערך נתונים 2.

על אף היות הטווח קל מאוד להבנה, הוא מבוסס רק על שני הערכים הקיצוניים ביותר במערך הנתונים, מה שהופך אותו לרגיש מאוד לערכים חריגים. אם אחד מאותם מספרים גבוה או נמוך בצורה יוצאת דופן, הדבר משפיע על כל הטווח. בנוסף, גודל מערך הנתונים משפיע גם הוא על הטווח. באופן כללי, ככל שנגדיל את גודל המדגם, ישנן יותר הזדמנויות להשיג ערכים קיצוניים. כתוצאה מכך, כאשר לוקחים מדגמים אקראיים מאותה אוכלוסייה, הטווח נוטה לגדול ככל שגודל המדגם גדל. לפיכך, מומלץ להשתמש בטווח כדי להשוות בין פיזורים של מדגמים שונים, רק כאשר גדלי המדגם דומים.

הטווח הבין-רבעוני (IQR)

הטווח הבין-רבעוני הוא החצי האמצעי של הנתונים. כמו שניתן לחלק את מערך הנתונים לשניים באמצעות החציון , כך באופן דומה ניתן לחלק את הנתונים גם לרבעים. הרבעון הנמוך ביותר (Q1) מכיל את הרבע של מערך הנתונים עם הערכים הקטנים ביותר. הרבעון העליון (Q3) מכיל את הרבע של מערך הנתונים עם הערכים הגבוהים ביותר. הטווח הבין-רבעוני הוא החצי האמצעי של הנתונים שנמצא בין הרבעון העליון והתחתון. במילים אחרות, הטווח הבין-רבעוני כולל 50% מנקודות הנתונים הנופלות בין הרבעון הראשון לרבעון השלישי (ה-IQR) , כפי שניתן לראות בתרשים מטה.

הטווח הבין-רבעוני הוא מדד עמיד בפני פיזור גבוה באופן דומה לזה שהחציון הוא מדד חזק של נטייה מרכזית. שני מהמדדים הללו אינם מושפעים באופן דרמטי מערכים חריגים מכיוון שהם אינם תלויים בשום ערך. בנוסף, הטווח הבין-רבעוני מצוין עבור התפלגות מוטות, בדיוק כמו החציון. כפי שנלמד בהמשך, כאשר יש לנו התפלגות נורמלית, סטיית התקן עוזרת לנו להבין מהו אחוז התצפיות הנופלות במרחקים ספציפיים מהממוצע. עם זאת, עבור התפלגויות מוטות זה לא עובד yuc, ולכן ה-IQR הוא אלטרנטיבה מצוינת.

שׁוֹנוּת

שונות היא ההפרש הממוצע בריבוע של הערכים מהממוצע. שלא כמו מדדי הפיזור הקודמים, השונות כוללת בתוכה את כל הערכים על ידי השוואת כל ערך לממוצע. בכדי לחשב את הנתון הזה, יש לחשב את ההבדלים בריבוע שבין נקודות הנתונים והממוצע, לחבר אותם ואז לחלק במספר התצפיות. בתרשים מטה ניתן לראות את ההבדל באופן גרפי עבור התפלגויות עם אותו ממוצע אך עם שׁוֹנוּת שונה. ההתפלגות הכחולה מציגה התפלגות שמקובצת היטב סביב הממוצע עם שונות קטנה של הנתונים, בעוד שההתפלגות האדומה מפוזרת יותר ומציגה שונות גבוהה יותר.

 

 ישנן שתי נוסחאות לשונות, כתלות בחישוב השונות עבור אוכלוסייה שלמה או עבור המדגם כדי להעריך או לאמוד את שונות האוכלוסייה .

שונות האוכלוסייה

הנוסחה לשונות האוכלוסייה היא כדלהלן:

בנוסחה מעלה, סיגמה (σ) בריבוע היא הפרמטר באוכלוסייה עבור השונות, μ הוא הפרמטר לממוצע האוכלוסייה, ו-N הוא מספר נקודות הנתונים, שאמורות לכלול את כל האוכלוסייה.

שונות המדגם

כדי להשתמש במדגם על מנת להעריך או לאמוד את השונות עבור אוכלוסייה, יש להשתמש בנוסחה הבאה:

 שימוש במשוואה הקודמת עם נתוני מדגם נוטה להוביל להערכת חסר של השונות. מכיוון שבדרך כלל אי אפשר למדוד אוכלוסייה שלמה, נשתמש במשוואה עבור שונות מדגם בתדירות גבוהה הרבה יותר:

בנוסחה מעלה, S כובע בריבוע הוא אומדן השונות של האוכלוסייה. וn-1 במכנה מתקן את הנטייה של המדגם לבצע הערכת חסר של שונות האוכלוסייה.

דוגמא לחישוב שונות

בואו ניקח לדוגמא סט נתונים שמייצג את הציונים של חמישה סטודנטים במבחן פסיכולוגי:

 [12, 15, 14, 10, 11]. כעת בואו נראה כיצד ניתן לחשב את השונות שלהם צעד אחר צעד:

  1. חישוב הממוצע:
  1. חישוב הסטייה בריבוע מהממוצע עבור כל ציון:
  1. סכימת הסטיות הריבועיות:
  1. חישוב השונות (חלוקה בn-1):
 
 

בעיית הפרשנות של השונות

מכיוון שהחישובים בנוסחאות השׁוֹנוּת משתמשים בהפרשים בריבוע, גם השונות היא ביחידות בריבוע ולא ביחידות המקוריות של הנתונים. בעוד שערכים גבוהים יותר של השונות מצביעים על פיזור גדול יותר, אין פרשנות אינטואיטיבית לערכים ספציפיים. למרות מגבלה זו, מבחנים סטטיסטיים שונים משתמשים בשונות בחישוביהם, לדוגמא, מבחן F ו-ANOVA. למרות שקשה לפרש את השונות עצמה, סטיית התקן פותרת בעיה זו!

סטיית התקן

סטיית התקן היא ההפרש הממוצע של הנתונים מהממוצע. כמו השונות, כאשר הערכים במערך נתונים מקובצים קרוב יותר זה לזה, סטיית התקן תהיה קטנה יותר, ולהפך. באופן נוח, סטיית התקן משתמשת ביחידות המקוריות של הנתונים, מה שמקל על הפרשנות. כתוצאה מכך, סטיית התקן היא המדד הנפוץ ביותר לפיזור. לדוגמה, בדוגמה למשלוח פיצה, סטיית תקן של 3 מציינת שהסטייה הממוצעת מזמן האספקה הממוצע הוא של 3 דקות. מדד זה מדוּוח לעתים קרובות יחד עם הממוצע.

סטיית התקן היא רק השורש הריבועי של השונות. נזכיר שהשונות היא ביחידות בריבוע. לפיכך, השורש הריבועי מחזיר את הערך ליחידות הטבעיות. כדי לחשב את סטיית התקן, לאחר חישוב השונות נעביר עליה את השורש הריבועי, וזהו! יש לך סטיית תקן.

סטיית תקן לעומת טעות תקן

לעתים קרובות סטודנטים מתבלבלים בין סטיית התקן לטעות התקן של הממוצע. בעוד ששני המדדים מעריכים את הפיזור של ההתפלגות, לשתיהן מטרות שונות מאוד. אחת מהן אומדת את הפיזור של התפלגות האוכלוסייה והשנייה של התפלגות הדגימה.

אז מהו המדד הכי טוב – הטווח, הטווח הבין-רבעוני או סטיית התקן?

ראשית,  בוודאי שמתם לב שלא כללתי את השונות כאחת האפשרויות בכותרת מעלה. הסיבה לכך היא שהשונות מספקת מדד ביחידות בריבוע ולכן פרשנותה אינה אינטואיטיבית ועל כן מחקתי אותה מהרשימה. בואו נעבור על שלושת המדדים האחרים של פיזור.

כאשר אנו משווים מדגמים בגודל זהה, מומלץ להשתמש בטווח כמדד הפיזור. עם זאת, כדאי לשים לב שחריג יחיד יכול להפיל את הטווח כולו. הטווח מתאים במיוחד לדגימות קטנות כאשר אין לך מספיק נתונים כדי לחשב את המדדים האחרים בצורה מהימנה, ועל כן גם הסבירות לקבל תוצאה חריגה היא נמוכה יותר. כאשר אנו עוסקים בהתפלגות מוטה, בדיוק כשם שהחציון הוא המדד טוב יותר לנטייה מרכזית, הטווח הבין-רבעוני במקרה כזה יתאים ביותר. עבור נתונים המתפלגים נורמלית, או אפילו נתונים שאינם מוטים במיוחד, השימוש בשילוב של הממוצע וסטיית התקן הוא הדרך הנכונה ללכת בה, ושילוב זה הוא ללא ספק הנפוץ ביותר. יחד עם זאת, עדיין ניתן להשלים את הגישה הזו עם טווחים מבוססי אחוזונים לפי הצורך. פרט לשונות, הנתונים הסטטיסטיים שסקרנו במאמר זה הם מדדים מוחלטים של פיזור מכיוון שהם משתמשים ביחידות המדידה של המשתנה המקורי.

סיכום

לסיכום, הבנת מדדי הפיזור היא חיונית בהבנת הפיזור והשונות של הנתונים בתוך המערך שלהם. מדדים אלה משלימים את מדדי הנטייה המרכזית על ידי מתן תובנות לגבי האופן שבו נתונים מסוימים סוטים מהערך המרכזי, ובכך מדגישים את העקביות והאמינות שלו. מהטווח הבסיסי ועד לשונות המורכבת יותר וסטיית התקן, כל מדד מספק פרספקטיבה שונה על פיזור הנתונים. ההשלכות בעולם האמיתי, מציגות את החשיבות המעשית של מדדים אלה. בעיקרו של דבר, בעוד שהנטיות המרכזיות מספקות תמונת מצב של הערך הטיפוסי של מערך נתונים, מדדי הפיזור מאירים את רוחבו ואת יכולת החיזוי שלו, ומבטיחים פרשנות מקיפה יותר של הנתונים.