שם הכותב: תאריך: 05 מרץ 2014

סטטיסטיקה 3- שיעור 3

אם ניקח מדגם מאד גדול, הסיכויים להראות שיש הבדל בין התוחלות גדלים. הסיבה היא שאנחנו מתקרבים יותר לגודל של האוכלוסייה. לכן, אף פעם לא נסתפק ב"דחייה" או "אי דחייה", אלא תמיד נתייחס גם לETA בריבוע. משתנה זה ייתן לנו אינדיקציה האם המודל שלנו מסביר את הבדיקה שלנו או לא. בדרך כלל המשתנה קריטי במדגמים גדולים.

 

בדיקת הנחות המודל דרך הפלטים

 

ניתוח שונות דוגמה 1

 

ניתוח שונות חד-כיווני

 

דוגמא 1: השפעת שיטת הלמידה על ההישגים בבחינה

נבדוק אם קיימת השפעה על פי השיעורים הקודמים, האם שיטת ההוראה משפיעה על תוחלת ההישגים. להל"ן המדגם:


יש פערים בין הממוצעים, השאלה הנשאלת היא האם ההבדל הוא מקרי? כיוון שמדובר ב3 מדגמים מדובר על ניתוח שונות.

על ידי הפלטים נבדוק את הנחות 4 ו5-

4. התפלגות נורמאלית של הציונים באוכ' בכל אחת משיטות ההוראה.

5. שונויות הציונים באוכלוסייה שוות בכל שלושת שיטות ההוראה.

 

הנחה מספר 5 היא הבסיס שיאפשר לנו לכל החישובים. כשאנחנו אומרים שהשוניות הללו שוות, אנחנו טוענים שהשוני בין הסטיות תקן במדגם הם הבדלים מקריים בלבד. למשל בדוגמה זו אנחנו מניחים על ידי הנחה זו שיש הבדל מקרי בלבד בין 6.35, 10.5 ו13.4.

 

ניתן ללמוד מתוך הדיאגרמה להל"ן על צורת ההתפלגות:


 

בדיקת הנחת הנורמאליות:

נבדוק האם ציונים מתפלגים נורמאלית בכל אחת משיטות ההוראה. מדובר ב3 בדיקות שונות לכל קטגוריה. עלינו לפרט את שלושת ההשערות במבחן זה.

 

השערות

H0: ציוני התלמידים בקרב הלומדים לבד מתפלגים נורמאלית

H1: אחרת

 

H0: ציוני התלמידים בקרב הלומדים בכיתה מתפלגים נורמאלית

H1: אחרת

 

H0: ציוני התלמידים בקרב הלומדים בקבוצות קטנות מתפלגים נורמאלית

H1: אחרת

 

המבחן שנשתמש בו לבדיקת נורמאליות הוא smirnov. במבחן נסתכל על SIG ונשווה אותו לα.

כלל הכרעה: SIG<α. נניח כי אלפא שווה ל0.05. לכן במקרה הנ"ל: 0.2>0.05 בכל הקטגוריות ולכן אן סיבה מספקת לדחות H0, בכל אחת מ3 הבדיקות שביצענו ברמת מובהקות 0.05, כלומר יש עדות לכך שציוני התלמידים באוכלוסייה בכל אחת מ3 השיטות מתפלגים נורמאלי.

 

אם אחד מהקטגוריות אינו מתפלג נורמאלית, אין אפשרות להמשיך. חובה שכולם יתפלגו נורמאלית.


 

 

בדיקת הנחת שוויון שונויות (5)

השערות:

H0: σ^2-1= σ^2-2= σ^2-3

H1: אחרת

 

כלל הכרעה:

Sig<α

דוחים H0.

 

*יש השערה 1 ולא 3 כמו בבדיקת נורמאליות.

 

במקרה הנ"ל:

0.083>0.05, לכן אין סיבה מספקת לדחות H0 ברמת מובהקות 0.05, כלומר יש עדות לכך כי שונויות הציונים באוכלוסייה בכל שלושת שיטות ההוראה שוות.


 

 

טבלת נתונים:

 

מדובר בטבלה שנותנת לנו את כלל נתוני השאלה:

4 שורות הטבלה מתייחסות לאחת מהקטגוריות של המשתנה הב"ת, כאשר השורה האחרונה מתייחסת לTOTAL.

סטיית התקן שבTOTAL, כוללת בתוכו "בתוך" הקבוצות וגם "בין" הקבוצות, כאשר הסטיות תקן של כל קטגוריה מאפיינת את "בתוך" הקבוצה בלבד.

 

העמודה של טעות התקן מאפיינת את טעות תקן של כל קטגוריה. כלומר אם נבדוק איזושהי השערה נוכל להשתמש בטעות תקן לשם בדיקת ההשערה. לדוגמה אם נרצה לבדוק השערה שתתייחס לתוחלת של אחת הקבוצות בלבד- אם יעניין אותנו "האם ניתן להגיד שתוחלת1 גדולה מ60?".

 

המינימום והמקסימום מתייחסים לציון הכי גבוה והכי נמוך בכל אחת מהקבוצות. כמו כן, במרכז מופיע רווח בר הסמך.

האם על סמך הרווח בר סמך ניתן לדעת אם ניתן לדחות את ההשערה שלנו?

נסתכל האם יש חפיפות בין רווחי הסמך, כלומר אם הם שונים זה מזה לגמרי או שקיימת ביניהם חפיפה. אם יש חפיפה, הרי שממוצע אחד יכול להיות מוכל ברווח בר סמך אחר. אם אין חפיפה, נוכל להגיד כי יש הבדל. זו לא הבדיקה שאנו עושים, אך מדובר בבדיקה ראשונה שניתן להסתמך עליה. כל רווח מייצג קבוצה, נבדוק כל רווח בר סמך לעומת האחרים. כמו כן, ניתן להשוות כל תוחלת לתוחלת הכללית ולבדוק באותו אופן האם קיימים הבדלים.

לא מדובר בביטחון של 100%, כיוון שכל רווח בר סמך מסתמך על אומדן אחר. בבדיקה שאנו עושים אנו משקללים את כלל האומדנים ולכן מדובר בבדיקה יותר נכונה.

 


ANOVA

 

לרוב זו הטבלה שאנו נדרשים לשחזר אותה.

SSB= 2254

SSW=6328

SST=8582

 

על ידי הטבלה הזו נמצא את הנתונים לבדיקות שנבצע.

 

F=msb/msw=10.151

 

כלל הכרעה:

Sig<α

 

קיבלנו F שמעליו יש 0.000, כלומר הוא נמצא בקיצון של ההתפלגות שלנו. על פי כלל ההכרעה נדחה אתH0 (עבור כל α).

 

    

Post Hoc Tests

 

 

מסקנה: 0.000<0.05, ולכן נדחה H0 ברמת מובהקות 0.05, כלומר קיים הבדל בין תוחלות ההישגים של שלושת שיטות ההוראה השונות. ניתן גם: "קיימת השפעה"….

 

Eta^2=2254.033/8582.183=0.262

 

0.262 זו הפרופורציה שבה ניתן להסביר את ההבדלים בציוני התלמידים על ידי העובדה שלמדו בשיטות הוראה שונות.

 

בהרבה בחינות אנחנו נראה פלט חסר:

 

לדוגמה אם נתון לנו רק הסטיות תקן:

 


על ידי עמודה זו אנו יכולים לחלץ את SST.

SST=12.06^2*(60-1)

 

כמו כן, על ידי שקלול האומדנים אנו נוכל להגיע לSSW:


13.3^2*(20-1)+10.51^2*(20-1)+6.35^2*(20-1)

 

על ידי SST וSSW נגיע לSSB

 

 

האם נכון להגיד שMSW, יהיה אומדן חסר הטייה לשונות של אלו שלמדו בקרב קבוצות קטנות? כן, כיוון שהשונויות שוות.

 

ברגע שהשונויות שוות, יש אומדנים יותר יעילים (בהתאם לגודל המדגם), אך עקרונית אם הם אומדים את אותה שונות זה לא משנה. באמצעות כלל האומדנים נוכל לאמוד את השונות בקרב האוכלוסייה.

 

 

השוואות מרובות

כאשר היה לנו פער בין 2 תוחלות ודחינו את H0, שם נעצרה העבודה שלנו. אם אמרנו שהם נבדלים זה מזה, הפער ביניהם שונה מ-0. ברגע שיש יותר מ2 קבוצות יש יותר מפער 1 לבדוק, ולכן אנחנו צריכים לבדוק בין מי למי הפערים. יש המון וריאציות ואנחנו נכנסים לתהליך נוסף של הסקה שנקרא "השוואות מרובות".

 

בהשוואות מרובות יש המון שיטות, עם כל מיני הבדלים בין השיטות. במסגרת הקורס נלמד 2 שיטות בלבד, כאשר שתיהן מסוג "השוואות זוגיות". כלומר בכל פעם נשווה 2 קבוצות בלבד.


"אפריורי"- כלומר 'לפני'. "פוסטפריורי"– כלומר 'אחרי'. במבחן הזה אנחנו נעשה בדיקה שהיא פוסטפריורית, רק לאחר שנדע אם דחינו או לא דחינו H0.

 

מספר ההשוואות שיש לבצע במבחנים להשוואות זוגיות

כשיש לנו C קטגוריות נבצע השוואה של:

C(c-1)/2 קטגוריות.

 

בכל השוואה שאנו מבצעים קיימת אפשרות לטעות מסוג ראשון α. להבדיל מבדיקת פער 1, כאשר נמצאים במערכת של השוואות ההסתברות לטעות מסוג 1 עולה ככל שמספר ההשוואות גדל.

במסגרת הקורס נלמד 2 מבחנים לביצוע ההשוואות המרובות:

  1. L.s.d
  2. Tukey

ההבדל בין השיטות הוא ששיטת הTUKEY מחמירה יותר מאשר הLSD. שכן, בצורת החישוב השיטה לוקחת בחשבון את מספר ההשוואות שיש לבצע וככל שהמספר גדול יותר, מתבצעת החמרה בחישוב ויותר קשה לדחות את H0.

בשיטת הLSD, אין התחשבות כלל במספר ההשוואות. גישה זו מחמירה פחות ויותר קל למצוא בה הבדלים. יחד עם זאת, הסיכוי לטעות מסוג 1 בשיטה זו גדול יותר ולכן נגביל את השימוש ל4 קטגוריות.

טבלת ההשוואות המרובות

העמודה הראשונה (mean difference)- בוחנת את גודל הפער במדגם. אם במדגם נקבל הפרש 0, מובן מאליו שלא קיים פער.

 

משמעות *- כלי עזר, סוג של כלל הכרעה. הכוונה היא שאם ב0.05 נותנים לבחון השערה מסוימת, אנחנו יכולים להחליט על סמך כוכבית זו.

כלומר אם יש כוכבית אז דחינו H0 ברמת מובהקות 0.05.

החיסרון הוא שאנו יכולים לבחון רק על בסיס השערה ברמת מובהקות 0.05.

 

  • ניתן להניח שאם ראינו כוכבית בtukey, אז בוודאי שנדחה גם בLSD. הסיבה לכך היא שtukey מחמיר יותר.

 

עמודת הsig, זו בעצם עמודת כלל ההכרעה. אם sig<α, נדחה H0.

נבחן את ההשוואה בין קבוצה 2 לקבוצה 3-

עקרונית אנו לא דוחים בtukey, לכן בLSD צריך לבדוק. ניתן לראות שהSIG בLSD יותר קטן, כלומר ההסתברות פחות קיצונית ויותר קל לדחות H0. במקרה הזה גם בLSD אנחנו לא דוחים H0.

 

על ידי רווח בר סמך אנו יכולים לבדוק האם הפרמטר תחת נכונות H0 מוכל מרווח (כלומר 0), אם הוא מוכל ברווח- לא דוחים. מוכל- דוחים. יש לשים לב כי ניתן להסתמך על כך רק אם מדובר ברמת מובהקות 0.05 על פי הפלט.

Post Hoc Tests


 

Homogeneous Subsets

 

הטבלה לא מוסיפה מידע חדש, אלא מסדרת אותם באופן מסודר.

הפלט מתייחס רק לTUKEY.

המחשב מחשב על פי ההשוואות המרובות תת קבוצות על פי דמיון ושוני.

מי שדומה יהיה באותה הקבוצה (השאלה האם אני שונה באופן מובהק? אם התשובה היא כן אז אני לא יהיה באותה הקבוצה, אם לא, כן אהיה באותה תת קבוצה)

 

הטבלה מראה מתוך ההשוואות כמה תת קבוצות נוצרו לנו.

במקרה הזה 1 בתת קבוצה 1 בעוד 2,3 יחד כיוון שאין ביניהם הבדל מובהק.

  • הדרך הנכונה לכתוב את הטבלה היא לסדר את הממוצעים מהנמוך לגבוה.

 

הsig הוא הSIG
שמבטא את ההבדל ביניהם הממוצעים באותה תת קבוצה. נצפה שהSIG תמיד יהיה גבוה מ0.05. כי אם הוא יהיה יותר קטן, אזי הממוצע היה בתת קבוצה אחרת. (כלומר הטבלה תסדר את הקבוצות באופן כזה שבין תתי הקבוצות יהיה הבדל מובהק ובתוך תתי הקבוצות מן הסתם שלא קיים הבדל כזה).


 

 

 

 

 

 

לצילום של ד"ר גילה קינן

 

לצילום של מר תמיר פראוי

 

 

 

 

 

 

 

 

 

 




6 − שש =

תואר ראשון
תואר שני
מרצים