לנתח את השוני: מדריך מקיף לניתוח שונות (ANOVA)
מבוא
ניתוח שונות (ANOVA) היא טכניקה סטטיסטית המשמשת אותנו למציאת הבדלים מובהקים בין שלוש ממוצעי קבוצות או יותר. שיטה זו, עוזרת לנו לקבוע האם ההבדלים שנצפו בין הקבוצות הם מובהקים סטטיסטית, או שמא נובעים ממקריות/טעות. במאמר זה נעבור על יסודות הANOVA, סוגי הANOVA הקיימים ונראה מה הן ההנחות והשלבים הדרושים בכדי לבצע מבחן סטטיסטי זה.
למה להשתמש בANOVA בכלל?
ANOVA היא טכניקה סטטיסטית חשובה מכיוון שהיא מאפשרת לחוקרים להשוות את הממוצעים של מספר קבוצות ולקבוע אם יש הבדלים משמעותיים ביניהם או שמא השונות ביניהן נובעת מהבדלים מקריים של הנתונים. טכניקה זו שימושית במיוחד במחקרים מדעיים, בהם חשוב לזהות אם ההבדלים שנצפו נובעים מקריות או שהם משקפים הבדלים אמיתיים בין קבוצות. ANOVA היא טכניקה גמישה הניתנת ליישום על מגוון רחב של שאלות מחקר, החל מהשוואת היעילות של טיפולים שונים ועד לניתוח ההשפעות של מספר משתנים בלתי תלויים על משתנה תלוי אחד. ניתוח זה נמצא בשימוש נרחב בתחומים שונים כולל פסיכולוגיה, ביולוגיה, כלכלה, רפואה ועסקים. יתרה מכך, ANOVA מספקת דרך לבחון מספר השערות בו זמנית, מה שעוזר להפחית את הסיכוי לטעויות מסוג I , ע"י מניעת ניפוח אלפא.
למה לא 3 מבחני t (ניפוח אלפא)?
ניפוח אלפא מתייחס לעלייה בסיכוי לטעות מסוג I (טעות אלפא), שהיא דחייה של השערת האפס בטעות. כאשר עורכים הרבה מבחני t ,או מספר רב של השוואות זוגיות בין ממוצעים, ההסתברות לבצע לפחות שגיאה אחת מסוג אלפא עולה עם כל בדיקה שנערכת, גם אם רמת המובהקות של כל מבחן נשמרת. הסיבה לכך היא שההסתברות לבצע שגיאה מסוג I אינה בלתי תלויה בבדיקות, וככל שנערכות יותר בדיקות, ההסתברות לבצע לפחות שגיאה אחת מסוג I הופכת גדולה יותר. ANOVA יכולה להפחית את ניפוח האלפא על ידי בדיקת הבדלים בין כל הקבוצות בו-זמנית, במקום ביצוע מספר השוואות. פרוצדורה זו מקטינה את המספר הכולל של הבדיקות שנערכו ובכך מקטינה את ההסתברות לטעות מסוג I.
למשל, תארו לעצמכם שחוקר רוצה להשוות את הגובה הממוצע של אנשים משלוש מדינות שונות: יפן, צרפת וברזיל. דרך אחת שהחוקר יכול לגשת לזה היא על ידי ביצוע מבחן t נפרד עבור כל זוג מדינות (קרי, יפן מול צרפת, צרפת מול ברזיל, יפן מול ברזיל). אם נבצע שלושה מבחני t בלתי-תלויים בין כל זוג מדינות, ברמת מובהקות של 0.05, אזי ההסתברות לבצע לפחות שגיאה אחת מסוג I (כלומר, ההסתברות שנסיק בטעות שיש הבדל משמעותי בין המדינות) תהיה כדלהלן:
כמו שאנו זוכרים מהסתברות, כאשר אנו מעוניינים לחשב הסתברות חיתוך עבור מספר מאורעות בלתי תלויים, עלינו לבצע הכפלה בין ההסתברויות. לכן, הסיבה שאנו מעלים את הסוגריים בחזקת שלוש היא מכיוון שאנו רוצים לחשב את הסיכוי שלא תהיה טעות מסוג ראשון במבחן הראשון, לא במבחן השני, וגם לא במבחן השלישי. לפיכך, הסיכוי הכולל לבצע לפחות שגיאה אחת מסוג אלפא הוא 0.143, שהוא גדול יותר מרמת המובהקות הכללית 0.05. המשמעות היא שביצוע בדיקות t מרובות בדרך זו מגדילה את הסיכוי לקבל מסקנה שגויה מסוג I.
לחלופין, החוקר יכול להשתמש במבחן ANOVA כדי להשוות את הגבהים הממוצעים של כל שלוש המדינות בו זמנית. ANOVA משתמשת במודל סטטיסטי כדי להעריך את השונות בתוך כל מדינה ואת השונות בין המדינות. אם השונות בין המדינות גדולה יותר מהשונות בתוך כל מדינה, אזי בדיקת ANOVA תראה שיש הבדל משמעותי בגובה הממוצע בין זוג מדינות אחד לפחות. היתרון בשימוש ב-ANOVA במצב זה הוא בכך שהיא מקטינה את הסיכוי הכולל לבצע שגיאה מסוג I, על ידי עריכת בדיקה אחת בלבד במקום שלוש.
משתנים תלויים ובלתי תלויים
ב-ANOVA, המשתנים הבלתי תלויים הם המשתנים שעברו מניפולציה או שינוי על ידי החוקר כדי לראות את השפעתם על המשתנה התלוי. המשתנים הבלתי תלויים נקראים גם גורמים, והם בדרך כלל משתנים קטגוריאליים בעלי שתי רמות או יותר. בניסוי, משתנים בלתי תלויים נשלטים על ידי החוקר כדי ליצור קבוצות שניתן להשוות זו לזו. המשתנה התלוי, לעומת זאת, הוא משתנה התוצאה הנמדד בתגובה לשינויים שנעשו במשתנים הבלתי תלויים. זהו המשתנה שהחוקר מעוניין להבין או לחזות, ולרוב יהיה רציף. ב-ANOVA, המשתנה התלוי הוא המשתנה המנותח כדי לקבוע אם יש הבדלים מובהקים סטטיסטית בין קבוצות או רמות של המשתנים הבלתי תלויים.
ההנחות של ANOVA
נורמליות: הנחת הנורמליות היא הנחת מפתח של ANOVA (ניתוח שונות) הקובעת שהנתונים צריכים להתפלג נורמלית בתוך כל קבוצה. הנחת הנורמליות חשובה מכיוון שאם הנתונים אינם מתפלגים בצורה נורמלית, ייתכן שתוצאות ניתוח ה-ANOVA לא יהיו אמינות או מדויקות. אם הנתונים מוטים או שהם בעלי תצפיות חריגות בצורה קיצונית, הדבר יכול להשפיע על תוצאות ניתוח ANOVA, להוביל למסקנות או להחלטות שגויות. כדי לבדוק הנחה זו, חוקרים משתמשים בדרך כלל בכל מיני שיטות גרפיות או מבחנים סטטיסטיים שונים. אם הנתונים אינם עומדים בהנחה של הנורמליות, ייתכן שהחוקרים יצטרכו לשנות את הנתונים או להשתמש במבחן א-פרמטרי, במקום ANOVA. הנחת הנורמליות חשובה כדי להבטיח שניתוח ANOVA יהיה מדויק ומהימן, ולהסיק מסקנות תקפות על סמך הנתונים.
הומוגניות של שונויות: הנחת הומוגניות של שונויות, הידועה גם בשם 'הנחת שוויון שונויות', היא הנחת מפתח נוספת של ANOVA הקובעת כי על השונות או הפיזור של הנתונים בתוך כל קבוצה, להיות זהה בין כל אחת מהקבוצות המושוות. אם הנחת שוויון השונויות מופרת, משמעות הדבר היא שהנתונים בתוך כל קבוצה יתפזרו באופן שונה, מה שעלול להוביל למסקנות שגויות. מכיוון שערך ה-F ב-ANOVA מחושב בתור היחס של השונות בין הקבוצות לשונות הטעות; ניפוח שונות הטעות , יוביל בסופו של דבר לערך F נמוך יותר, ולשגיאה מסוג II. לעומת זאת, אם הנחת שוויון השונויות תתקיים, השונות בתוך כל קבוצה תהווה אומדן לא מוטה של השונות האמיתית באוכלוסייה.
אי תלות: הנחת האי תלות קובעת שהתצפיות או הנתונים בתוך כל קבוצה צריכים להיות בלתי תלויוים זה בזה. במילים אחרות, הערך של תצפית או נקודת נתונים אחת לא צריך להיות קשור או תלוי בערכים של תצפיות או נקודות נתונים אחרות באותה קבוצת טיפול. כדי להבטיח אי תלות, על החוקרים להשתמש בשיטת דגימה אקראית ולוודא שגודל המדגם גדול מספיק כדי לייצג את האוכלוסייה.
רנדומליות: הנחת האקראיות או הרנדומליות קובעת שיש לבחור את נתוני המדגם באופן אקראי/רנדומלי מתוך האוכלוסייה. במילים אחרות, לכל תצפית מתוך האוכלוסייה צריך להיות סיכוי שווה להיבחר למדגם. כדי להבטיח אקראיות, על החוקר להשתמש בשיטת דגימה אקראית בשביל לבחור את נתוני המדגם מהאוכלוסייה.
השלבים הכרוכים בביצוע ANOVA
1. הגדרת ההשערות
הצעד הראשון בביצוע ANOVA הוא הגדרת השערת האפס והשערת המחקר. במקרה של אנובה, השערת האפס תמיד תהיה שכל תוחלות הקבוצות יהיו שוות זו לזו, והשערת החוקר תהיה שלפחות אחת מהקבוצות שונה מחברותיה.
2. בדיקת ההנחות
השלב השני הוא בדיקת ההנחות. ארבע ההנחות הן כזכור: נורמליות, שוויון שונויות, אי-תלות ורנדומליות. עלינו לבדוק האם הנתונים עומדים בהנחות אלו לפני שממשיכים בניתוח.
3. חישוב ערכי ה-F
השלב השלישי הוא לחשב את ערך ה-F הסטטיסטי. ה-F הסטטיסטי משווה את השונות בין הקבוצות (MSB) לשונות בתוך הקבוצות (MSW), וקובע אם יש הבדל משמעותי בין הממוצעים שלהן ע"י חלוקת שתי השונויות הללו. MSB מודד את ההבדלים בין ממוצעי הקבוצה ומחושב על ידי סכום ההפרשים בריבוע בין כל ממוצע קבוצה לממוצע הכולל (SSB), ולאחר מכן חלוקה במספר הקבוצות מינוס אחת:
MSW מודד את השונות בתוך הקבוצות, ומחושב על ידי סכום ההפרשים בריבוע בין כל תצפית לממוצע הקבוצה שלה (SSW), ואז חלוקה במספר הכולל של התצפיות פחות מספר הקבוצות:
ערך ה-F מחושב על ידי חלוקה בין שתי שונויות אלו. כאשר ערך F סטטיסטי גדול מערך הF הקריטי, הדבר מצביע על כך שההבדלים בין ממוצעי הקבוצות (שונות האפקט) גדולים מההבדלים בתוך הקבוצות (שונות הטעות). משמעות הדבר היא שעלינו לדחות את השערת האפס לטובת ההשערה החלופית לפיה לפחות ממוצע קבוצה אחד שונה באופן מובהק מהאחרים.
לסיכום, ערך ה-F מייצג את גודל היחס בין שונות האפקט לשונות הטעות ומשמש לבדיקת הבדלים מובהקים בין ממוצעי הקבוצה במבחן ANOVA. ערך F גבוה מצביע על הבדלים גבוהים בין הקבוצות ביחס להבדלים בתוכן, בעוד שערך F נמוך מצביע על הבדלים נמוכים בין הקבוצות ביחס להבדלים בתוכן או על היעדר הבדלים מובהקים ביניהן.
4. קביעת p-value וחישוב ערך F סטטיסטי
השלב הרביעי הוא קביעת ערך ה-p על ידי חישוב ערך F סטטיסטי (או ה-F המחושב) והשוואתו לערך F קריטי עם דרגות חופש מתאימות. כדי למצוא את ערך ה-F הקריטי עבור רמת מובהקות נתונה, עלינו ראשית לקבוע את דרגות החופש של המונה והמכנה. דרגות החופש של המונה הן דרגות החופש הקשורות לשונות בין הקבוצות, והן שוות למספר הקבוצות מינוס 1.
דרגות החופש של המכנה, הן דרגות החופש הקשורות לשונות בתוך הקבוצות, והיא שווה לגודל המדגם הכולל פחות מספר הקבוצות. לאחר שקבענו את דרגות החופש, נוכל להשתמש בטבלת F סטנדרטית או בתוכנה סטטיסטית כדי לחפש את ערך ה-F הקריטי הקשור לרמת המובהקות הרצויה ולדרגות החופש. לדוגמה, אם אנו בודקים ברמת מובהקות של 0.05 עם 2 דרגות חופש במונה ו-27 דרגות חופש במכנה, נמצא שהערך הקריטי מטבלת F הוא 3.15.
משמעות הדבר היא שאם ערך ה-F המחושב גדול מערך ה-F הקריטי (כלומר, גדול מ3.15), אנו דוחים את השערת האפס, מה שמצביע על כך שקיים הבדל מובהק בין לפחות אחד מן הממוצעים של הקבוצות. אם ערך ה-F המחושב קטן מערך ה-F הקריטי, אנחנו לא נדחה את השערת האפס, מה שיצביע על כך שאין מספיק ראיות כדי להסיק שממוצעי הקבוצה שונים באופן משמעותי זה מזה. אם דחינו את השערת האפס, משמעות הדבר שערך ה-p קטן יותר מרמת המובהקות.
5. פירוש התוצאות
השלב החמישי והאחרון הוא לפרש את תוצאות ה-ANOVA. אם השערת האפס נדחית, אזי ניתן להסיק שיש הבדל משמעותי בין לפחות אחד מ-ממוצעי הקבוצות. לאחר מכן, החוקר יכול לבחון את גדלי האפקט של ההשפעה ואת מבחני ההמשך כדי לנתח עוד יותר את ההבדלים בין הקבוצות ולהבין את מקור ההבדלים בין הקבוצות.
סוגי ANOVA
ANOVA חד כיוונית/חד גורמית
אנובה חד כיוונית או חד גורמית היא שיטה סטטיסטית המשמשת להשוואת הממוצעים של שלוש קבוצות או יותר על משתנה בלתי תלוי יחיד. שיטה זו קובעת האם יש הבדל משמעותי בין לפחות אחד מן הממוצעים של הקבוצות. לדוגמה, ניתן להשתמש ב-ANOVA חד כיוונית כדי להשוות את ההכנסה הממוצעת של שלוש ערים שונות, או כדי להשוות את היעילות של שלושה טיפולים שונים במצב רפואי. בואו נראה דוגמא לשאלה של מבחן F חד כיווני וכיצד פותרים אותה.
שאלה : חברת מחקרי שיווק אספה נתונים על רמות שביעות הרצון של לקוחות עבור שלושה מותגים שונים של סמארטפונים: מותג A, מותג B ומותג C. רמות שביעות הרצון נמדדו בסולם של 1 עד 10, כאשר ציונים גבוהים יותר מצביעים על שביעות רצון גבוהה יותר. המשרד רוצה לדעת אם יש הבדל מובהק סטטיסטית ברמות שביעות הרצון בין שלושת המותגים. כדי לבדוק זאת, הם ערכו סקר עם 5 משתתפים עבור כל מותג ורשמו את רמות שביעות הרצון שלהם. התוצאות מוצגות כדלקמן:
מותג א: 7, 6, 8, 6, 5
מותג ב: 8, 7, 7, 6, 8
מותג ג: 9, 8, 7, 6, 8
בדוק את השערת החברה ברמת מובהקות של 5%. בהנחה שכל ההנחות הדרושות מתקיימות.
פתרון מלא לפי שלבים
שלב 1: הגדרת השערות האפס וההשערה החלופית
השערת אפס [H0]: אין הבדל מובהק ברמות שביעות הרצון בין שלושת המותגים. µ1=µ2=µ3
השערה חלופית [H1]: יש הבדל מובהק ברמות שביעות הרצון בין לפחות אחד משלושת המותגים.
שלב 2: חישוב הממוצע וסכומי הריבועים (SS)
ראשית נחשב את הממוצע הכולל של כל הנתונים:
לאחר מכן, אנו מחשבים את סכום הריבועים בתוך הקבוצות (SSW) ע"י חישוב סכום ריבועי הסטיות בתוך כל קבוצה:
כעת נחשב את סכום הריבועים בין הקבוצות (SSB) ע"י חישוב סכום ריבועי הסטיות בין כל ממוצע קבוצה לממוצע הכללי:
שלב 3: חישוב דרגות החופש
דרגות החופש בין קבוצות (dfB) הן J-1, כאשר J הוא מספר הקבוצות (במקרה זה, J=3). לכן, dfB = 2.
דרגות החופש עבור בתוך קבוצות (dfW) הן N-J, כאשר N הוא המספר הכולל של התצפיות (במקרה זה, N=15). לכן, dfW = 15-3=12.
שלב 4: חישוב אומדני השונויות (MS)
אומדן השונות בין הקבוצות (MSB) יחושב על ידי חלוקת סכום ריבועי הסטיות בין הקבוצות (SSB) בדרגות החופש בין הקבוצות (dfB):
אומדן השונויות בתוך הקבוצות (MSW) יחושב על ידי חלוקת סכום ריבועי הסטיות בתוך הקבוצות (SSW) בדרגות החופש בתוך קבוצות (dfW):
הערה חשובה: כל ריבועי הסטיות (SSB וSSW) מסתכמות ביחד לסך השונות הכללית:
גם דרגות החופש בין ובתוך הקבוצות, מסתכמות יחדיו לכדי דרגות החופש הכלליות:
עם זאת, אומדני השונויות לא מסתכמים יחדיו לכדי אומדן השונות הכללי:
שלב 5: חישוב ערך הF הסטטיסטי
הערך הסטטיסטי יחושב על ידי חלוקת אומדן השונות בין הקבוצות (MSB) באומדן השונות בתוך הקבוצות (MSW):
שלב 6: קביעת הערך הקריטי
הערך הקריטי בטבלת F יימצא על ידי הצלבת דרגות החופש בין הקבוצות (2), עם דרגות החופש בתוך הקבוצות (12) בטבלת F עם רמת המובהקות המתאימה (5%): F(2,13)=3.81.
שלב 7: קבלת החלטה
מכיוון שהערך הסטטיסטי קטן מהערך הקריטי, אנו נמקם אותו באזור הקבלה של התפלגות השערת האפס ונסיק כי ברמת מובהקות 5% אין הבדל בשביעות הרצון בין הסמארטפונים השונים (p>.05). להסבר מעמיק ומרחיב יותר על אנובה חד גורמית, על סכומי הסטיות הריבועיות ואומדני השונויות, אתם מוזמנים להירשם לקורס הסקה סטטיסטית שלנו.
ANOVA דו כיוונית/גורמית
ANOVA דו גורמית או דו כיוונית היא שיטה סטטיסטית המשמשת לניתוח ההשפעות של שני משתנים בלתי תלויים על משתנה תלוי בודד. זוהי הרחבה של ANOVA חד כיוונית. לדוגמה, במחקר הבודק יעילות של תרופה חדשה בין גברים ונשים, ניתן להשתמש ב-ANOVA דו-כיוונית לניתוח השפעות התרופה ומין המטופל על זמן ההחלמה.
השלבים הכרוכים בביצוע ANOVA דו-כיוונית דומים מאוד לשל ANOVA חד-כיוונית. אולם, ב-ANOVA דו-כיוונית, ערך ה-F הסטטיסטי משמש לניתוח ההשפעות של כל אחד מהמשתנים הבלתי תלויים (אפקטים עיקריים), וההשפעה המשולבת (האינטראקציה) שלהם.
האינטראקציה של ניתוח שונות דו גורמי מייצגת מצב שבו המשתנה הבלתי תלוי הראשון משפיע באופן שונה על המשתנה התלוי , בתוך הרמות של המשתנה הבלתי השני. בואו נראה דוגמא לשאלה, כיצד מחשבים את הערכים הסטטיסטיים של כל גורם, כולל גורם האינטראקציה.
שאלה
חוקר מעוניין לבדוק האם קיים הבדל משמעותי בעלייה במשקל בין שלושה סוגי דיאטות (סוג A, סוג B וסוג C) ושתי רמות של פעילות גופנית (Exercise 1 Exercise 2). לצורך כך, החוקר הקצה באופן אקראי 5 משתתפים לכל אחת מ-6 קבוצות הטיפול (2×3), ומדד את עלייתם במשקל לאורך תקופה של 4 שבועות. הנתונים מוצגים בטבלה שלהלן:
בדוק את האפקטים העיקריים והאינטראקציה של סוג הדיאטה ורמת הפעילות הגופנית, ברמת מובהקות 5%. הנח שכל ההנחות הדרושות מתקיימות.
פתרון מלא לפי שלבים
סיכום
ביצוע מבחן ANOVA כרוך במספר שלבים: 1. חישוב סכום הריבועים 2. חישוב דרגות החופש 3. חישוב אומדני השונויות. 4. חישוב ה-F הסטטיסטי ופירוש התוצאות. ישנם סוגים שונים של ANOVA, במאמר זה סקרנו שניים מהם: ANOVA חד כיווני ודו כיווני. על ידי הבנת ההנחות, השלבים והסוגים של ANOVA, ניתן להשתמש בכלי זה כדי להסיק מסקנות מהנתונים המוצגים לנו בשאלה.
שלב 1: ניסוח השערות האפס והמחקר
השערות אפס:
HoA: אין הבדל בעלייה במשקל בין שלושת סוגי הדיאטות.
HoB: אין הבדל בעלייה במשקל בין שתי הפעילויות הגופנית.
HoAB: אין השפעת אינטראקציה בין סוג דיאטה ורמת פעילות גופנית על עלייה במשקל.
השערות חלופיות (Ha):
Ha1: יש הבדל בעלייה במשקל בין שלושת סוגי הדיאטות. (אפקט עיקרי לסוג הדיאטה)
Ha2: יש הבדל בעלייה במשקל בין שתי הפעילויות הגופנית. (אפקט עיקרי לסוג הפעילות גופנית)
Ha3: יש אפקט אינטראקציה בין סוג הדיאטה ורמת הפעילות הגופנית על עלייה במשקל.
שלב 2 : ארגון הנתונים וחישוב הנתונים הסטטיסטיים הדרושים
תחילה נחשב את הממוצעים של כל אחת משש קבוצות הטיפול תחת כל אחד מסוגי האימון.
תחת Exercise 1 :
ממוצע Exercise 1 :
תחת Exercise 2 :
ממוצע Exercise 2 :
באותו האופן נחשב את הממוצע כל סוג דיאטה:
ממוצע כללי:
שלב 3: חישוב סכום ריבועי הסטיות
שלב 3.1 : חישוב סכום ריבועי הסטיות הכללי
את סכום הריבועים הכללי (SST) נחשב באמצעות הנוסחה הבאה שדורשת מאיתנו לחבר את הסטייה בריבוע של כל תצפית בכל קבוצה (xij) מהממוצע הכללי x̿:
הצבה:
שלב 3.2 : חישוב סכום ריבועי הסטיות של סוג הדיאטה (Type)
כעת נחשב את סכום ריבועי הסטיות של סוג הדיאטה (Type) ונקרא לו SSA. נעשה זאת ע"י החסרה של כל ממוצע קבוצת דיאטה מהממוצע הכללי והעלאה בריבוע, מעבר לרמת הפעילות (Exercise). לבסוף, נכפיל במספר התצפיות של הקבוצה. בשביל לעשות זאת, נשתמש בנוסחה הבאה:
* כאשר j הוא מס' הקבוצה של המשתנה הראשון, n מייצג את מס' התצפיות בכל קבוצה וb את מס' הרמות של המשתנה הב"ת השני (Exercise).
הצבה:
שלב 3.3 : חישוב סכום ריבועי הסטיות של סוג הפעילות (Exercise)
כעת נחשב את סכום ריבועי הסטיות של סוג הפעילות (Exercise) ונקרא לו SSB. נעשה זאת באותה צורה כמו שעשינו עם סוג הדיאטה: נחסיר כל ממוצע קבוצת Exercise מהממוצע הכללי והעלאה בריבוע, מעבר לסוג הדיאטה (Type). לבסוף גם כאן, מכפילים במספר התצפיות של הקבוצה. לצורך כך, נשתמש בנוסחה הבאה:
* כאשר k הוא מס' הקבוצה של המשתנה הב"ת השני, n מייצגת מס' התצפיות שיש בכל קבוצה וa את מס' הרמות של המשתנה הב"ת הראשון (Type).
הצבה:
שלב 3.4 : חישוב סכום ריבועי הסטיות של האינטראקציה
כעת נחשב את סכום ריבועי הסטיות של האינטראקציה בין סוג התרגיל (Type) לסוג הפעילות (Exercise) ונקרא לו SSAB.
נעשה זאת ע"י החישוב הסטייה הריבועית של ממוצע כל תא (X̿jk) מהממוצע של סוג הדיאטה (.X̿j), פחות הממוצע של סוג הפעילות (.X̿k), פלוס הממוצע הכללי (X̿), ואת כל זה נכפיל במס' התצפיות שיש בכל קבוצה. על מנת לעשות זאת, נשתמש בנוסחה הבאה:
הצבה:
שלב 3.5 : חישוב סכום ריבועי הסטיות בתוך הקבוצות
הדרך לחישוב ריבועי הסטיות בתוך הקבוצות באנובה דו גורמית היא מאוד ארוכה וכוללת החסרת כל תצפית (Xijk) מהממוצע קבוצה שלה (Xjk) :
לכן, במקום לקחת את הדרך הארוכה ניקח את הדרך החכמה ונזכור שחיבור כל סכומי ריבועי הסטיות, יהיה שווה לסכום ריבועי הסטיות הכללי (SST) . כך, נוכל לחלץ את סכום ריבועי הסטיות שבתוך הקבוצות:
לאחר העברת אגפים נקבל:
ANOVA דו כיוונית/גורמית
דרגות החופש בין קבוצות (dfB) הן J-1, כאשר J הוא מספר הקבוצות (במקרה זה, J=3). לכן, dfB = 2.
דרגות החופש עבור בתוך קבוצות (dfW) הן N-J, כאשר N הוא המספר הכולל של התצפיות (במקרה זה, N=15). לכן, dfW = 15-3=12.
שלב 4 : חישוב דרגות חופש
מאחר ואומדן השונות מחושב על ידי חלוקת סכום ריבועי הסטיות של הגורם לחלקי לדרגות החופש המתאימות שלו, עלינו לחשב את דרגות החופש עבור כל גורם.
עבור גורם A דרגות החופש יהיו מס' הקבוצות של A פחות 1 :
dfA=3-1=2
עבור גורם B דרגות החופש יהיו מס' הקבוצות של B פחות 1 :
dfB=2-1=1
עבור גורם האינטראקציה (AB) , דרגות החופש יהיו מס' הקבוצות של B פחות 1 כפול מס' הקבוצות של A פחות 1:
dfAB=(3-1)*(2-1)=2
עבור גורם הטעות, דרגות החופש יהיו מס' התצפיות הכללי פחות מס' הקבוצות הכללי:
dfW=30-6=24
שלב 5 : חישוב אומדני השונויות
כעת נוכל לחשב את אומדני השונויות של כל גורם:
שלב 6 : חישוב מנות F
כעת נחשב את מנת הF עבור כל גורם על ידי חלוקת אומדן השונות שלו בגורם הטעות (MSW) :
שלב 7 : חיפוש ערך קריטי F וקבלת החלטה
עבור כל אחד מגורמי ה-F, נחפש ערך קריטי לפי מס' דרגות החופש של הגורם במונה (או בשורות בטבלת F) ודרגות החופש של הטעות במכנה (או העמודות בטבלת F):
עבור גורם F(2,24)=3.40 :A
עבור גורם F(1,24)=4.28 :B
עבור גורם F(2,24)=3.40 :AB
כאשר הערך הסטטיסטי המחושב גדול מהערך הקריטי, אנו נגיע למסקנה שקיים אפקט מובהק ועל כן נדחה את השערת האפס. כמו שאתם רואים, הערך המחושב של גורם A ושל גורם B גדולים מהערכים הקריטיים שלהם, אך לא של גורם האינטראקציה. לפיכך, עבור שני הגורמים הללו אנו נדחה את השערת האפס ונסיק כי אכן לסוג הדיאטה (A) ולסוג הפעילות הגופנית (B), השפעה מובהקת על המשקל (אפקטים עיקריים), אך לא לשניהם יחד (אפקט אינטראקציה).