top of page

מבחנים פרמטריים או לא-פרמטריים?

 

 

 

 

 

 

 

 

 

אחת השאלות הקריטיות שעולה לפני ביצוע ניתוח סטטיסטי היא: האם להשתמש במבחן פרמטרי או לא-פרמטרי? השאלה הזו נראית טכנית, אבל התשובה עליה משפיעה ישירות על אמינות התוצאות ועל הכוח הסטטיסטי של המחקר. בחירה שגויה עלולה להוביל למסקנות מוטעות או לפספוס ממצאים משמעותיים. הנה מדריך מעשי שיעזור לכם להבין מתי להשתמש בכל סוג מבחן, אילו הנחות צריך לבדוק, ואיך לקבל החלטות מושכלות.

מה ההבדל בין מבחנים פרמטריים ללא-פרמטריים?

מבחנים פרמטריים הם מבחנים סטטיסטיים שמניחים שהנתונים מתפלגים בצורה מסוימת, בדרך כלל התפלגות נורמלית (פעמון גאוס). המבחנים הפרמטריים הנפוצים כוללים מבחן t, ניתוח שונות (ANOVA), ומתאם פירסון. מבחנים אלה חזקים ורגישים יותר לזיהוי הבדלים, אבל הם דורשים שהנתונים יעמדו בהנחות מסוימות.

מנגד, מבחנים לא-פרמטריים הם מבחנים שלא מניחים התפלגות מסוימת של הנתונים. הם מתאימים למצבים שבהם ההנחות של המבחנים הפרמטריים לא מתקיימות, או כשעובדים עם נתונים סדרתיים (אורדינליים). המבחנים הלא-פרמטריים הנפוצים כוללים את מבחן מאן-ויטני (Mann-Whitney), קרוסקל-וואליס (Kruskal-Wallis), ומתאם ספירמן (Spearman). המבחנים האלה גמישים יותר אבל בדרך כלל פחות רגישים מהמבחנים הפרמטריים.

ההנחות שצריך לבדוק לפני שבוחרים במבחן פרמטרי

לפני שמשתמשים במבחן פרמטרי, צריך לוודא שהנתונים עומדים במספר הנחות בסיסיות. הנחה ראשונה ומרכזית היא התפלגות נורמלית: הנתונים בכל קבוצה צריכים להיות מתפלגים בצורה תקינה, כלומר בצורת פעמון סימטרי. הנחה זו חשובה במיוחד במדגמים קטנים (מתחת ל-30 משתתפים בקבוצה). במדגמים גדולים יותר, המבחנים הפרמטריים חסינים יותר (robust) להפרות קלות של ההנחה הזו בזכות משפט הגבול המרכזי.

הנחה שנייה היא שוויון שונויות (homogeneity of variance): השונות בקבוצות השונות צריכה להיות דומה. במבחן t, למשל, משתמשים במבחן Levene כדי לבדוק שוויון שונויות. אם השונויות שונות משמעותית, אפשר להשתמש בגרסת התיקון של מבחן t (Welch's t-test).

הנחה שלישית היא עצמאות התצפיות: כל תצפית צריכה להיות בלתי תלויה בתצפיות האחרות. זאת אומרת שמדידה של משתתף אחד לא צריכה להשפיע על מדידות של משתתפים אחרים.

איך בודקים התפלגות נורמלית?

יש כמה דרכים לבדוק אם הנתונים מתפלגים נורמלית. הדרך הראשונה והאינטואיטיבית ביותר היא בדיקה ויזואלית באמצעות היסטוגרמה או Q-Q plot (Quantile-Quantile plot). היסטוגרמה מראה את התפלגות הנתונים – אם היא נראית סימטרית ובצורת פעמון, זה סימן טוב. Q-Q plot משווה את התפלגות הנתונים שלנו להתפלגות נורמלית תיאורטית – אם הנקודות נמצאות קרוב לקו האלכסוני, ההתפלגות קרובה לנורמלית.

הדרך השנייה היא באמצעות מבחנים סטטיסטיים להתפלגות נורמלית. המבחנים הנפוצים ביותר הם Shapiro-Wilk (מומלץ למדגמים קטנים עד בינוניים) ו-Kolmogorov-Smirnov. אם המבחן מראה תוצאה לא מובהקת (p > 0.05), זה אומר שהנתונים לא שונים באופן משמעותי מהתפלגות נורמלית, ואפשר להשתמש במבחנים פרמטריים. חשוב לזכור שמבחנים אלה רגישים מאוד במדגמים גדולים – גם סטיות קטנות מנורמליות עלולות להיות מובהקות, למרות שבפועל הן לא בהכרח מונעות שימוש במבחנים פרמטריים.

מתי להשתמש במבחנים לא-פרמטריים?

מבחנים לא-פרמטריים מתאימים במספר מצבים ברורים. ראשית, כאשר הנתונים לא מתפלגים נורמלית ולא ניתן לתקן את ההתפלגות באמצעות טרנספורמציות (כמו לוגריתם או שורש ריבועי). שנית, כאשר עובדים עם משתנים סדרתיים (למשל, סולם ליקרט של 1-5) שאינם בהכרח בעלי מרווחים שווים. שלישית, כאשר המדגם קטן מאוד (פחות מ-15-20 משתתפים בקבוצה) והקושי לבדוק נורמליות באופן אמין. ורביעית, כאשר יש ערכים קיצוניים (outliers) שמשפיעים באופן דרסטי על הממוצעים – מבחנים לא-פרמטריים מבוססים על דירוגים (ranks) ולכן פחות רגישים לערכים קיצוניים.

השוואה בין מבחנים פרמטריים ללא-פרמטריים נפוצים

כדי להקל על ההחלטה, הנה השוואה בין המבחנים הנפוצים:

במקום מבחן t למדגמים בלתי תלויים (פרמטרי), משתמשים במבחן מאן-ויטני (Mann-Whitney U) כאלטרנטיבה לא-פרמטרית. שני המבחנים משווים שתי קבוצות בלתי תלויות, אבל מאן-ויטני עובד עם דירוגים ולא עם ממוצעים.

במקום ניתוח שונות חד-כיווני (One-Way ANOVA), משתמשים במבחן קרוסקל-וואליס (Kruskal-Wallis). שני המבחנים משווים שלוש קבוצות או יותר, אבל קרוסקל-וואליס לא מניח נורמליות.

במקום מתאם פירסון (Pearson), משתמשים במתאם ספירמן (Spearman). פירסון מודד קשר ליניארי בין משתנים כמותיים ומניח נורמליות, בעוד ספירמן מבוסס על דירוגים ומתאים גם לקשרים מונוטוניים שאינם בהכרח ליניאריים.

במקום מבחן t למדגמים תלויים (Paired t-test), משתמשים במבחן ווילקוקסון למדגמים תלויים (Wilcoxon Signed-Rank Test). שני המבחנים משווים שתי מדידות של אותם משתתפים, אבל ווילקוקסון לא מניח נורמליות.

מחיר השימוש במבחנים לא-פרמטריים

חשוב לדעת שלמבחנים לא-פרמטריים יש מחיר: הם פחות חזקים (less powerful) מהמקבילים הפרמטריים שלהם. זה אומר שאם באמת יש הבדל או קשר בין הקבוצות, מבחנים לא-פרמטריים נדרשים למדגם גדול יותר כדי לזהות אותו. בנוסף, מבחנים לא-פרמטריים בוחנים הבדלים במדיאנים או בדירוגים, ולא בממוצעים – מה שלעיתים פחות אינטואיטיבי לפרשנות.

כללי אצבע מעשיים

כדי לסכם, הנה כמה כללי אצבע פשוטים:

אם המדגם גדול (מעל 30 בכל קבוצה), ההתפלגות קרובה לנורמלית, ואין ערכים קיצוניים דרמטיים – השתמשו במבחנים פרמטריים. הם חזקים יותר ונותנים תוצאות מדויקות יותר.

אם המדגם קטן, ההתפלגות סוטה מנורמליות, או שיש ערכים קיצוניים משמעותיים – השתמשו במבחנים לא-פרמטריים. הם בטוחים יותר ופחות רגישים להפרות הנחות.

אם אתם עובדים עם נתונים סדרתיים (למשל, שאלוני ליקרט) – העדיפו מבחנים לא-פרמטריים, גם אם ההתפלגות נראית סבירה.

תמיד בדקו את ההנחות לפני שבוחרים במבחן – אל תניחו אוטומטית שהנתונים נורמליים. השקיעו דקות ספורות בהיסטוגרמה או במבחן Shapiro-Wilk, וזה יחסוך לכם בעיות בהמשך.

לסיכום

הבחירה בין מבחנים פרמטריים ללא-פרמטריים אינה שרירותית – היא צריכה להתבסס על בדיקה מדוקדקת של הנתונים והבנה של ההנחות שמאחורי כל מבחן. כשעומדים בהנחות, מבחנים פרמטריים מציעים כוח סטטיסטי גבוה יותר ופרשנות אינטואיטיבית. כשההנחות מופרות, מבחנים לא-פרמטריים מספקים חלופה בטוחה ואמינה. הכלל החשוב ביותר: תמיד בדקו את ההנחות, אל תסתמכו על הנחות מראש – והנתונים ידריכו אתכם לבחירה הנכונה.

statistics-810022_1280.jpg
bottom of page