טעויות סטטיסטיות

להפחית את הסיכוי לטעות: המדריך לטעויות סטטיסטיות

כאשר אנו מתעמקים בעולם המחקר, אנו נתקל בכמה מונחים טכניים שיכולים להיות בעלי השפעה משמעותית על התוצאות שלנו.  במאמר זה נבין לעומק מה הן שגיאות סטטיסטיות מסוג I ו-II, כיצד הן יכולות להשפיע על מסקנות המחקר ועל הגורמים המשפיעים על כל שגיאה.

מהן טעויות סטטיסטיות מסוג I וסוג II?

שגיאות מסוג I וסוג II הן שני סוגים של שגיאות שיכולות להתרחש במהלך בדיקת השערות סטטיסטיות. בדיקת השערות היא שיטה לשימוש בנתונים כדי לבדוק את תקפות ההנחות או ההצהרות לגבי האוכלוסייה. בדיקות השערות  בודקת שתי הצהרות סותרות זו את זו לגבי האוכלוסייה כדי לקבוע איזו הצהרה נתמכת בצורה הטובה ביותר על ידי נתוני המדגם. שתי הצהרות אלו נקראות השערת האפס וההשערה החלופית או השערת החוקר. מכיוון שבעת ביצוע בדיקת השערות, אנו משתמשים במדגם אקראי כדי להסיק מסקנות  לגבי האוכלוסיה, מבחני ההשערה אינם מדויקים ב-100%. כאשר מבצעים מבחן  בדיקת השערות, ישנם שני סוגים של טעויות הקשורות להסקת מסקנה שגויה.

שגיאה מסוג I: דחיית השערת אפס בטעות, קרי, כשהיא נכונה.

שגיאה מסוג II: קבלת השערת האפס בטעות, קרי, קבלת השערת האפס כאשר זו נכונה.

כאשר הנתון המדגמי או הסטטיסטי חריג מספיק ביחס להשערת האפס בשביל שיהיה ממוקם באזור הדחייה של H0. "חריג מספיק" במבחן השערה משמעו שנתוני המדגם מספקים ראיות מספקות לכך שהסיכוי לקבלת תוצאת המדגם באופן מקרי (קרי במידה והשערת האפס נכונה) הוא נמוך מאוד. כאשר זה קורה, ערך הp יהיה קטן מאוד (או קטן מרמת המובהקות) וניתן יהיה לדחות את השערת האפס עבור כל האוכלוסייה ולהסיק שהנתונים מצביעים על "העדפה" כלפי ההשערה האלטרנטיבית.

שגיאה מסוג I (אלפא)

טעות מסוג I (או טעות מסוג אלפא)   מתרחשת כאשר השערת האפס נדחית בטעות. כלומר, כאשר החוקר לקח החלטה (שגויה) לדחות את השערת האפס כאשר היה עליו לקבל אותה. כלומר, זוהי ההסתברות לדחות את השערת האפס כאשר היא באמת נכונה. במילים אחרות, זו ההסתברות להסיק שיש השפעה או הבדלים מובהקים כאשר אין כאלו. שגיאה מסוג I מסומנת בסמל אלפא (α) והיא מוגדרת בדרך כלל כ-0.05 או 0.01, ומושפעת על ידי החלטת החוקר בלבד.

שגיאה מסוג II (ביטא)

טעות מסוג II (או טעות מסוג ביטא) מתרחשת כאשר החוקר קיבל את השערת האפס בטעות. כלומר, כאשר החוקר לקח החלטה (שגויה) לקבל את השערת האפס כאשר היה עליו לדחות אותה. במילים אחרות, זו ההסתברות להסיק שאין השפעה או הבדלים מובהקים כאשר יש כאלו. שגיאה מסוג II מסומנת בסמל בטא (β) ומושפעת מהגורמים להלן.

מה משפיע על טעות מסוג ביטא

1. רמת המובהקות

רמת המובהקות (α), היא ההסתברות לדחיית השערת האפס כשהיא נכונה. הגדלת רמת המובהקות מפחיתה את הסיכוי לטעות מסוג II, אך מגבירה את הסיכוי לטעות מסוג I (דחיית השערת אפס שהיא למעשה נכונה). המשמעות היא שאם נגדיר רמת α גבוהה יותר, יש סיכוי גבוה יותר שנדחה בטעות את השערת האפס ונסיק שיש השפעה מובהקת, גם אם היא לא קיימת באוכלוסייה.

לדוגמה: נניח שחברת תרופות בודקת תרופה חדשה ורוצה לקבוע אם היא יעילה בטיפול במצב מסוים, כאשר המצב באוכלוסייה הוא שהתרופה אכן יעילה. השערת האפס תהיה שלתרופה אין השפעה, בעוד שההשערה האלטרנטיבית (השערת החוקר) תהיה הפוכה אליה ותגרוס שהתרופה כן יעילה. אם רמת המובהקות (α) נקבעת ל-0.05, והחברה תערוך מחקר עם מדגם של 100 חולים, הם עשויים למצוא השפעה שאינה מובהקת סטטיסטית עם ערך p של 0.07. המשמעות היא שהם יקבלו את השערת האפס ויסיקו שהתרופה לא יעילה בטיפול במצב, כלומר יבצעו טעות מסוג II. לעומת זאת, אם יגדילו את רמת המובהקות ל0.10, הם יותר ייטו לדחות את השערת האפס (בטעות ובצדק) ולכן פחות ייטו לקבל את השערת האפס (בטעות ובצדק), וכתוצאה מכך יקטינו את הסיכוי לטעות מסוג ביטא.  מכאן אנו מבינים שישנו יחס הפוך בין אלפא לביטא; ככל שאנו מגדילים את אלפא, כך אנו מקטינים את הסיכוי לטעות ביטא, ולהפך. לכן, יש לבחור בקפידה את רמת המובהקות (α) כדי לאזן את הסיכון לשגיאות מסוג I ו-II, ולהבטיח שהמסקנות המתקבלות מהניתוח הסטטיסטי מדויקות ומהימנות.

2. המרחק בין ההתפלגויות (גודל האפקט)

 גודל האפקט הוא מדד למידת המרחק בין ההתפלגות של השערת האפס וההשערה החלופית. גודל אפקט גדול יותר מגדיל את ההסתברות לדחיית השערת האפס ומקטין את ההסתברות לביצוע שגיאה מסוג II ולהפך, כפי שניתן לראות בתרשימים מטה.

גודל אפקט קטן (מרחק קטן בין H0 לH1):

גודל אפקט גדול (מרחק גדול בין H0 לH1):​

3. שונות הנתונים

שונות הנתונים סביב הממוצע, יכולה גם היא להשפיע על טעות מסוג II. אם השונות של התפלגות הדגימה גדולה, המשמעות היא שנקודות הנתונים מפוזרות באופן נרחב ביחס לממוצע, מה שיכול להקשות על זיהוי הבדל מובהק סטטיסטית בין שתי קבוצות. דבר זה יכול להקשות על זיהוי הבדל אמיתי בין שתי קבוצות. כאשר השונות של הנתונים גדולה, טעות התקן של הממוצע גדלה, מה שמגדיל את הפיזור של התפלגות הדגימה, מגדיל את הסיכוי לטעות ביטא ומקטין את העצמה של המבחן הסטטיסטי (אחד מינוס β), כמו בתרשימים מטה. בקורס סטטיסטיקה ב' שלנו, תוכלו לקבל הבנה מעמיקה יותר ושיטות כיצד לזהות נכונה את סוג הטעות עליה אתה נשאל.

שונות גדולה

שונות קטנה

לדוגמה: נניח שחוקר בודק האם טיפול חדש יעיל בהפחתת סימפטומים של מחלה מסוימת. השערת האפס תהיה שאין הבדל בחומרת המחלה בין קבוצת הטיפול לקבוצת הביקורת, בעוד שההשערה האלטרנטיבית היא שהטיפול מפחית את חומרת המחלה. 

אם שונות הנתונים תהיה גבוהה, ההבדל בממוצע בין קבוצות הטיפול לקבוצת הביקורת עשוי להיות קטן, גם אם הטיפול יעיל. כתוצאה מכך, ייתכן שהבדיקה הסטטיסטית לא תצליח לזהות הבדל מובהק בין הקבוצות, מה שיוביל לשגיאה מסוג II. 

כדי להפחית את הסיכון לשגיאה מסוג II בנוכחות שונות נתונים גבוהה, ייתכן שהחוקר יצטרך להגדיל את גודל המדגם. הדבר יכול לעזור להקטין את טעות התקן של הממוצע ולהגדיל את העוצמה של המבחן הסטטיסטי, מה שהופך אותו לבעל סבירות גבוהה יותר לזהות הבדל אמיתי בין הקבוצות.

4. גודל המדגם

 גודל המדגם הוא אחד הגורמים החשובים ביותר המשפיעים על שגיאות מסוג II. באופן כללי, ככל שהמדגם גדל, כך ההסתברות לשגיאות מסוג II פוחתת. הסיבה לכך היא שמדגם גדול יותר מספק מידע נוסף על האוכלוסייה ומפחית את השונות של הנתונים. כמו כן, גודל המדגם מקטין את הפיזור של התפלגות הדגימה (טעות התקן) וכפי שראינו בתרשימים מעלה, פיזור קטן = טעות קטנה יותר, וכתוצאה מכך, עוצמה גדולה יותר.

5. סוג ההשערה

בין אם היא חד-זנבית או דו-זנבית, סוג ההשערה יכולה להשפיע על הסיכוי לשגיאה מסוג II בבדיקה סטטיסטית. השערה חד-זנבית היא כיוונית, כלומר מנבאת או "מתחייבת" לכיוון ההשפעה, בעוד שהשערה דו-זנבית היא לא כיוונית, כלומר מנבאת שיהיה הבדל או קשר כלשהו, אך לא את הכיוון שלו. בהשערה חד-זנבית, הסיכוי לשגיאה מסוג II קטן יותר מאשר בהשערה דו-זנבית. הסיבה לכך היא שהשערה חד-זנבית ממוקדת יותר בכיוון ספציפי של האפקט, ולכן יש לה יותר עוצמה לזהות הבדל או קשר בכיוון ההפוך. אולם, אם ההשפעה היא בכיוון ההפוך של ההשערה, ייתכן שהבדיקה החד-זנבית לא תצליח לזהות אותה, מה שיגרום להעלאת הסיכוי לטעות מסוג II. מבחינה סטטיסטית, בדיקת השערות באמצעות השערה דו זנבית, מובילה לחצייה של רמת המובהקות (אלפא) והקטנתה. כפי שראינו מקודם, הקטנה של האלפא, משמעה הגדלה של ביטא.

לדוגמה:  נניח שאנו עורכים מחקר כדי לבדוק את ההשפעה של תרופה חדשה לשיפור קשב על הציונים בקורס סטטיסטיקה. במקרה הנוכחי, החלטנו להשתמש במבחן השערות דו-זנבי כדי להעריך את התוצאות. אם נשתמש ברמת מובהקות (אלפא) של 0.05, משמעות הדבר היא שאנו מוכנים "לספוג" הסתברות של 5% לטעות מסוג I (דחיית השערת האפס כשהיא באמת נכונה). עם זאת, שימוש במבחן דו-זנבי אומר שאנו מחלקים את רמת האלפא שלנו בין שני זנבות ההתפלגות ועל כן כל זנב מקבל רמת אלפא של 2.5%. כפי שראינו קודם, הקטנה של רמת המובהקות, מובילה להגדלת ההסתברות לטעות מסוג ביטא וכתוצאה מכך, הקטנה של העוצמה הסטטיסטית.  

6. שכיחות המצב הנחקר

 השכיחות של המצב הנחקר יכולה גם להשפיע על ההסתברות לשגיאה מסוג II. כאשר מעוניינים לאמוד משתנה שקורה תחת תנאים נדירים באוכלוסייה, סביר להניח שיהיה צורך במדגם גדול יותר שיסייע לזהות הבדלים או השפעה אמיתית, על מנת להפחית את הסיכוי לשגיאות מסוג II.

לסיכום

לפני ביצוע מחקר, על החוקרים לשקול היטב את הגורמים שסקרנו כאן בעת תכנון המחקר שלהם, כדי למזער את הסיכון לשגיאות מסוג I ו II. שימוש בגדלי מדגם מתאימים, מבחנים סטטיסטיים, רמות מובהקות ועצמה סטטיסטית יכולים כולם לעזור להבטיח שלמחקר יהיה את היכולת לזהות הבדל או השפעה אמיתיים כאשר קיים אחד כזה. 

בנוסף, בקרה על משתנים מתערבים, שימוש בשיטות אקראיות וצמצום ההטיה, יכולים כולם לעזור לשפר את התקפות והמהימנות של המחקר ולהפחית את הסיכוי לטעויות מסוג II. מוכן לקחת את ההבנה שלך בטעויות מסוג I וסוג II לשלב הבא? הירשם לקורס סטטיסטיקה ב' שלנו עוד היום וקבל גישה לתרגילים מאתגרים שיכינו אותך הכי טוב לבחינה והדרכה מהמומחים והמדריכים המנוסים ביותר בתחום!

כלי נגישות

Powered by - Wemake