באיזה מבחן סטטיסטי להשתמש?

מחבר:
בתאריך:

בחינת השערות מבררת האם תוצאות של סקר או ניסוי הם משמעותיות סטטיסטית.

כדי לבחון האם תוצאות של ניסוי הם משמעותיות סטטיסטית אנחנו מגדירים מראש השערת אפס לפיה אין דבר מיוחד בתוצאות כאשר השערה חלופית היא שיש משהו יוצא דופן. מטרת המבחן היא לאשש את השערת האפס או לדחות אותה.

לדוגמה, ניסוי הבוחן הם כמות הדשן משפיעה על משקל התפוחים הנקטפים. השערת האפס היא שאין שינוי והדשן אינו משפיע. ההשערה החלופית היא שכמות הדשן משפיעה.

which statistical test to choose?

אחרי שהגדרנו את השערת האפס וההשערה החלופית, עלינו לבחור רמת משמעות (alpha) שהיא ההסתברות שאת התוצאות קיבלנו במקרה. בהתאם, alpha מהווה את הסף לדחיית השערת האפס. מקובל לבחור בערך alpha של 5%. אבל במקרים רבים רצוי לבחור בערך נמוך יותר כדי להקטין את הסיכוי לזיהוי שגוי, כאשר ההבדל אינו קיים אולם ההבדל נראה משמעותי בניסוי בגלל השפעתם של גורמים אקראיים.

לאחר סיום הניסוי נשתמש במבחנים סטטיסטיים אותם נסקור במדריך כדי לקבל ערך p-value, ההסתברות לקבל את תוצאות הניסוי או קיצוניות מהם במקרה. במידה וערך p-value הוא נמוך מ-alpha נדחה את השערת האפס ונקבל את ההשערה החלופית.

ישנם מבחנים סטטיסטיים רבים לבחינת השערות. במדריך זה נלמד לבחור את המבחן המתאים ביותר לתרחיש שמעניין אותנו מתוך המבחנים הפופולריים ביותר.

כדי לבחור את המבחן המתאים ביותר עלינו לדעת 2 דברים:

  • מה סוג המידע (קטגורי או כמותי)
  • האם המבחן הוא פרמטרי או לא

 

סוג המידע : קטגורי או כמותי

קטגורי

משתנים קטגוריים מייצגים קבוצות. 

קיימים 3 סוגים של משתנים קטגוריים:

  • דירוג אורדינלי (לדוגמה, הדירוג העולמי של שחקן טניס)
  • שמי נומינלי (לדוגמה, שם מוסד הלימודים, שם קבוצת הספורט)
  • בינארי (לדוגמה, 1 או 0, הטלת מטבע)

 

כמותי

משתנים כמותיים מבטאים כמות.

שני סוגים של משתנים כמותיים הם: 

  • כמותיים דיסקרטיים ניתנים למנייה (לדוגמה, מספר אצבעות ביד, כמות מכירות בשנה)
  • כמותיים רציפים ניתנים לחלוקה (ק"ג, מטר) 

סוג המבחן: פרמטרי או לא

ניתן לערוך מבחנים פרמטריים רק בתנאי שהאוכלוסיה עומדת במספר תנאים:

  1. התצפיות הם בלתי תלויות
  2. המידע מספרי ומתפלג באופן נורמלי
  3. כמות דוגמאות גדולה מספיק (לפחות 30)

עדיף לערוך מבחנים פרמטריים כי התוצאות הם חזקות יותר אבל אם אין ברירה אפשר להסתפק במבחנים א-פרמטריים.

 

מבחני קורלציה

קורלציה משמשת לבדוק האם שינוי במשתנה אחד מלווה בשינוי במשתנה שני, בלי סיבה ותוצאה.

המבחן המשמש לקורלציה בין שני משתנים כמותיים רציפים הוא Pearson's r.

התוצאה היא ערך מתאם r. ערך המתאם הוא בין 1- ל1+. ערך קרוב לאפס מעיד על העדר מתאם. ערך קרוב ל-1+ מצביע על מתאם חיובי מלא. וערך קרוב ל1- מעיד על מתאם שלילי.

לדוגמה:

  • קשר בין משקל התפוחים וכמות הדשן
  • קשר בין מספר שעות הלימוד וציון המבחן
  • קשר בין גודל דירה ומחיר

 

מבחני רגרסיה

מבחני רגרסיה בודקים כיצד משתנה מספרי אחד משפיע על משתנה אחר. התוצאה היא משוואה שאפשר להיעזר בה בשביל תחזית.

רגרסיה קווית simple linear regression משתמשת במשתנה אחד X בתור קלט כדי לקבל את תחזית עבור משתנה אחד אחר Y.

לדוגמה:

  • מה השפעת כמות הדשן על משקל התפוחים שאפשר לגדל במטע בשטח דונם?
  • מה השפעת הטמפרטורה על שיעור החולים בשפעת?
  • מה השפעת גודל הדירה על המחיר?

אם מעוניינים להזין ב-2 משתנים בלתי תלויים או יותר משתמשים ב- multiple linear regression

לדוגמה:

  • מה השפעת כמות הדשן והטמפרטורה על משקל התפוחים?
  • מה השפעת הטמפרטורה, מהירות הרוח והגובה מעל פני הים על ביצועי אצן?

משתמשים ברגרסיה לוגיסטית logistic regression כאשר מזינים במשתנה אחד או יותר כדי לקבל תוצאה בינארית (כן או לא, 1 או 0)

לדוגמה:

  • כמות קוטל החרקים המספיקה להשמדת כל הכנימות התוקפות צמח
  • האם העברה בנקאית היא תרמית על סמך גובה ההעברה והארץ ממנה הכסף נשלח

 

מבחני השוואה

מבחני השוואה בוחנים את ההבדל בין ממוצעי קבוצות.

מבחניt-testמשווים את הממוצעים של 2 קבוצות.

לדוגמה:

  • משקל תפוחים ירוקים ואדומים
  • גובה ממוצע של בנים ובנות בכיתה
  • אחוז הקלקות על קישורים כחולים לעומת אדומים

 

One-sample t-test

משווה את ממוצע התכונה באוכלוסיה אחת כנגד ערך סטנדרטי.

דוגמאות:

  • האם משקל התפוחים במטע אחד הוא גדול משמעותית ממשקל תפוחים ממוצעים?
  • האם כמות הקוטג' במיכלים שמייצרת חברה מסחרית נמוכה משמעותית מ-200 גרם?

 

Independent t-test

כאשר משווים ממוצע תכונה אחת בין 2 קבוצות מאוכלוסיות שונות . חשוב שמספר הדוגמאות יהיה שווה בין הקבוצות.

דוגמאות:

  • השוואה של משקל התפוחים בין 2 מטעים
  • השוואה של משקל בנים ובנות בני כיתה אחת

 

Paired t-test

כאשר משווים ממוצע תכונה אחת בין 2 קבוצות מאותה אוכלוסיה . בדרך כלל, בוחנים את האוכלוסיה לפני ואחרי טיפול.

לדוגמה: 

  • ממוצע ציון הבנת הנקרא בקרב קבוצת תלמידים לפני ואחרי שלקחו קורס קיץ באנגלית
  • מדד לחץ דם באנשים בני 60 וכעבור 10 שנים בהיותם בני 70

 

ANOVA

כאשר משווים את הממוצע בין יותר מ-2 קבוצות משתמשים ב-ANOVA במקום ב-t-test.

לדוגמה:

  • מה משקל התפוחים באותו מטע שקיבלו 3 סוגים של דשן
  • מה הציון הפסיכומטרי הממוצע של בוגרי בתי ספר תיכוניים שונים

 

MANOVA

בעוד ANOVA משמשת להשוואת ממוצע תכונה אחת, MANOVA משמשת להשוואת ממוצע של מספר תכונות.

לדוגמה:

  • כיצד משפיע סוג הדשן על המשקל, גובה הגזע ומספר הענפים
  • כיצד משפיע קורס מיומנויות למידה על ציוני הבחינה במתמטיקה ואנגלית

 

מבחנים לא פרמטריים

מבחנים א-פרמטריים משמשים כשאי אפשר לעשות מבחנים פרמטריים. בטבלה הבאה סיכום של מבחנים פרמטריים ומקביליהם הא-פרמטריים:

מבחן א-פרמטרי

מבחן פרמטרי

Spearman’s r

Pearson’s r

Sign test

One-sample t-test

Wilcoxon Rank-Sum test

Independent t-test

Wilcoxon Signed-rank test

Paired t-test

Kruskal–Wallis H

ANOVA

ANOSIM

MANOVA

 

מבחני Chi-Square

משתמשים במבחני Chi-Square לבחינת השערות בנוגע להתפלגות האוכלוסייה לקטגוריות.

מבחן Chi-Square בוחן את שכיחות התצפיות בקטגוריות, ומנסה למצוא האם קטגוריה אחת (או שילוב של קטגוריות) הוא נפוץ יותר מהצפוי.

בדומה לקורלציה מבחן Chi-Square מנסה למצוא קשר בין משתנים אבל כיוון שהמשתנים קטגוריים אי אפשר להשתמש בקורלציה.

ישנם 3 סוגים של מבחני Chi-Square:

 

Chi-Square goodness of fit

מבחן goodness of fit בוחן האם התפלגות של משתנה 1 תואם להתפלגות הצפויה.

דוגמאות:

  • האם שכיחות התוצאות בהטלת מטבע שונה מהצפוי (1:1)?
  • האם שיעור התפוחים הפסולים ליצוא שווה בין 3 שיטות טיפול שונות

את הנתונים למבחני Chi-Square ניתן לסדר בטבלת שכיחויות. לדוגמה, טבלת שכיחויות של הטלת מטבע 100 פעמים:

תוצאה

שכיחות

עץ

48

פלי

52

האם העובדה ששכיחות התוצאות שונה מ-50:50 מעידה על כך שהמטבע מוטה? או שהתוצאה אינה מובהקת מספיק? על זה יענה מבחן goodness of fit

 

Chi-Square test for independence

מחפש קשר בין שני משתנים קטגוריים בתוך אותה אוכלוסיה. בניגוד ל-goodness of fit המבחן לא משווה משתנה יחיד לאוכלוסיה תיאורטית, אלא שני משתנים בתוך אותה אוכלוסיה אחד כנגד השני.

לדוגמה, מחקר שבחן האם יש קשר בין טעם קולינרי לבין טעם ספרותי מצא את התוצאות הבאות בקרב 300 נשאלים:

איטלקי

תאילנדי

מזרחי

עיון

90

40

10

הרפתקאות

20

20

10

הרומן הרומנטי

20

20

70

מבחן Chi-Square test for independence יענה על השאלה האם יש קשר בין טעם קולינרי וספרותי.

 

Chi-Square test for homogeneity

המבחן להומוגניות בוחן האם דוגמאות שונות באות מאותה אוכלוסיה.

לדוגמה, האם שני יינות שונים מגיעים מאותו יקב על סמך אחוז הסוכר וכמות הגופרית?

 

אולי גם זה יעניין אותך

מבחני t-test באמצעות פייתון

מבחן ANOVA - האם ממוצעי קבוצות שונים סטטיסטית

מה זה A/B testing - בדיקת A/B?

 

לכל המדריכים בנושא של למידת מכונה

 

אהבתם? לא אהבתם? דרגו!

0 הצבעות, ממוצע 0 מתוך 5 כוכבים

 

 

הוסף תגובה חדשה

 

= 5 + 7