מבחן זד (Z TEST)

מבחן זד, בדיקת השערות ומה שביניהם

במדריך זה נספק הבנה מקיפה של מבחן ה-z, כולל הגדרתו, הנחותיו, סוגיו ויישומיו. תחילה, ישנן כמה נקודות מפתח שאפשר לקחת מפוסט זה:

1. מבחן Z הינו מבחן סטטיסטי הנועד לקבוע האם ממוצע המדגם גדול, קטן או שונה מ-ממוצע האוכלוסייה.

2. ציון Z מייצג את המרחק מהממוצע בסטיות (או טעויות) תקן.

3. מבחני Z מהווים את הבסיס להבנת מבחני t.

4. מבחני Z מניחים שסטיית התקן של האוכלוסייה ידועה.

5.  על מנת להשתמש במבחן Z, עלינו להניח שהנתונים באוכלוסייה מתפלגים נורמלית או שהמדגם גדול מספיק (>30).

מהו Z-Test (מבחן זד)?

מבחן ה-z הוא מבחן סטטיסטי המשמש כדי לקבוע אם ממוצע המדגם שונה באופן מובהק מ-ממוצע האוכלוסייה. מבחן זה משמש אותנו כאשר שונות האוכלוסייה ידועה, וגודל המדגם גדול מספיק. מבחן ה-z מבוסס על ההתפלגות הנורמלית הסטנדרטית. כדי לחשב את ציון ה-z, יש להחסיר את ממוצע האוכלוסייה מ-ממוצע המדגם ולחלק בטעות התקן של התפלגות הדגימה של הממוצע:

ההנחות של Z-Test (מבחן זד)

לפני עריכת מבחן z, עלינו לוודא כי אנו עומדים בהנחות מסוימות:

דגימה אקראית: על הדגימות להיבחר באופן אקראי מתוך האוכלוסייה.

התפלגות נורמלית: האוכלוסייה חייבת להתפלג נורמלית.

גודל מדגם גדול: במידה וידוע שהאוכלוסייה לא מתפלגת נורמלית, יהיה עלינו להשתמש במשפט הגבול המרכזי אם הנחות אלו אינן מתקיימות, תוצאות מבחן ה-z עשויות להיות מוטות.

איך משתמשים ב Z-Test (מבחן זד) ?

מבחן זד: שאלה לדוגמא

כדי לבצע מבחן Z, תחילה עלינו לקבוע את ממוצע האוכלוסייה ואת סטיית התקן שלה. ניתן למצוא מידע זה נתון בשאלה שאנו עונים עליה. ברגע שיש לך מידע זה, נוכל לחשב את ציון ה-Z באמצעות הנוסחה הבאה:

*כאשר X הוא ממוצע המדגם, μ הוא ממוצע האוכלוסייה, σ הוא סטיית התקן של האוכלוסייה, ו-n הוא גודל המדגם.

לאחר חישוב ציון ה Z, נוכל להשתמש בטבלת Z או בתוכנה סטטיסטית כדי למצוא את ההסתברות לקבל את ממוצע המדגם הנצפה, בהנחה שהשערת האפס נכונה (p-value). אם הp value נמוך מרמת המובהקות שנקבעה מראש (בדרך כלל 0.05), נוכל לדחות את השערת האפס ולהסיק שיש הבדל מובהק בין ממוצע המדגם לממוצע האוכלוסייה. אם ערך ה-p גדול מ-0.05, לא ניתן לדחות את השערת האפס, ואין הבדל מובהק בין ממוצע המדגם לממוצע האוכלוסייה.

על פי סקר שנערך על ידי יצרן רכב, היחס הממוצע בין קילומטראז’ לדלק עבור דגם מסוים הוא 28 מיילים לליטר (mpg) עם סטיית תקן של 2.5 mpg. קבוצה של פעילי איכות הסביבה טוענת כי קילומטראז’ הדלק הממוצע בפועל נמוך יותר ממה שהיצרן טוען. כדי לבדוק את טענתם, נבחר מדגם אקראי של 50 מכוניות ונמצא כי קילומטראז’ הגז הממוצע הוא 26.5 mpg.

בדוק האם תוצאות המדגם מאששות את טענת הפעילים הסביבתיים ברמת מובהקות 0.02?

נקודות מפתח לזיהוי המבחן הסטטיסטי

על מנת לפתור את השאלה הנ”ל, יש להשתמש במבחן זד (Z-test) למדגם יחיד. בואו נבין מה בשאלה הוביל לכך שזה המבחן הדרוש:

1. בשאלה ניתן למצוא במפורש את סטיית התקן של האוכלוסייה, שהיא דרישה מקדימה לשימוש במבחן Z.

2. גודל המדגם גדול יחסית (n = 50), מה שהופך את הנחת הנורמליות לסבירה יותר.

3. מעוניינים להשוות ממוצע מדגם לממוצע אוכלוסייה ידוע וקיים.

בהתבסס על נקודות אלו, אנו יכולים לשער שמבחן z של מדגם יחיד מתאים לבדיקת ההשערה. על מנת לפתור את השאלה, עלינו להשתמש במבחן זד למדגם יחיד באמצעות שימוש בשלבים הבאים:

פתרון לפי שלבים

שלב 1: ניסוח ההשערות

H0: יחס הקילומטראז' לדלק הממוצע עבור הדגם המסוים שווה או גבוה מ-28 קמ"ג.  (μ >= 28)

H1: יחס הקילומטראז' לדלק הממוצע עבור הדגם המסוים נמוך מ-28 קמ"ג. (μ < 28)

רמת המובהקות נתונה כ-0.02.

הנוסחה למבחן z-מדגם יחיד היא: x̄ הוא ממוצע המדגם (26.5) μ הוא ממוצע האוכלוסייה (28) , σ הוא סטיית התקן של האוכלוסייה (2.5), ו-n הוא גודל המדגם (50).אם נחבר את הערכים, נקבל:

מכיוון שהחוקר משער על כך שהממוצע האמיתי באוכלוסייה יהיה קטן מהממוצע הידוע, השערת החוקר היא חד זנבית שמאלית. באמצעות טבלת z או תוכנה סטטיסטית, אנו מוצאים שערך ה-p קטן מ-0.0001 עבור מבחן חד-זנב ימני.

מכיוון שערך p קטן מרמת המובהקות של 0.02, אנו דוחים את השערת האפס. תוצאות המדגם מאששות את טענת הפעילים הסביבתיים ולכן נסיק כי קילומטראז' הדלק הממוצע בפועל אכן נמוך ממה שהיצרן טוען. במילים אחרות, יש מספיק ראיות כדי להצביע על כך שיחס הקילומטראז' לדלק הממוצע עבור הדגם המסוים נמוך מ-28 קמ"ג.

סיכום

לסיכום, מבחן ה-z הוא שיטה סטטיסטית המשמשת לבדיקה האם ממוצע מדגם שונה מהממוצע של האוכלוסייה, כאשר סטיית התקן של האוכלוסייה ידועה. הוא מבוסס על ההתפלגות הנורמלית הסטנדרטית ומשמש אותנו כאשר שונות האוכלוסייה ידועה וגודל המדגם גדול מספיק.

כלי נגישות

Powered by - Wemake