שם הכותב: תאריך: 01 מרץ 2014

סטטיסטיקה 3- שיעור 1

 

ניתוח שונות חד כיווני-

One way analyst of variance = AOV

 

ניתוח שונות זהו מבחן המאפשר בדיקת השערות על הבדלים בין תוחלות מתוך C אוכלוסיות. פער בין שתי תוחלות (C=2) הינו מקרי פרטי של ניתוח שונויות.

  • הניתוח שונות הניסוח יהיה:
    • האם קיים הבדל בין התוחלות?
    • האם קיימת השפעה של המשתנה הב"ת על המשתנה התלוי?

 

חד כיווני- הכוונה שמדובר במשתנה ב"ת אחד בלבד.

השאלה שנשאלת תמיד היא "למה קיימים הבדלים?", "ממה ההבדלים נובעים?".

 

משתנה תלוי משתנה ב"ת
  1. משתנה כמותי

1. סולם איכותי

  1. הנחות מתייחסות למשתנה התלוי

2.C קטגוריות (רמות)

J:1—->C (אינדקס)

  1. משתנה מוסבר
3. משתנה מסביר מנבא (פקטור)

 

השערות למבחן ניתוח שונויות

 

H0: המשמעות שהמשתנה הב"ת לא משפיע בכלל על המשתנה התלוי, לכן אם לא נדחה H0 לא יהיה הבדל בין התוחלות, כלומר אין השפעה.

 

H0:

 

H1: יכולות להיות הרבה אפשרויות ולכן נרשום במילים "אחרת"

 

H1: "אחרת"

 

אפשרות H0 נוספת: עבור J:1—->C
HO:µJ-µ=0

 

צריך לבדוק עבור כל השערה, כלומר לבדוק עבור כל תוחלת את ההשערה הזו.

 

כשיש שתי קבוצות במשתנה הב"ת, גודל האפקט הוא: µ1-µ2.

כאשר יש מעל 2 קבוצות, כדי לחשב ערך אחד שישקף את גודל האפקט, לא ניתן לחבר פערים בין תתי הממוצעים לממוצע הכללי, שכן פערים אלה מתקזזים. לכן, בכדי לחשב גודל אפקט ממוצע- נחשב את השונות בין הקבוצות.

 

(µ1- µ)^2+(µ2- µ)^2+(µ3- µ)^2……+(µC- µ)^2]/C]

 

הנחות המודל

 

  1. מודל קבוע- המשמעות היא שנוכל להסיק על האוכלוסייה רק לגבי אותן קטגוריות של המשתנה הב"ת שנכללו במדגם.
  2. דגימה מקרית של תצפיות בכל אחת מC האוכלוסיות
  3. מדגמים ב"ת
  4. התפלגות ערכי המשתנה הב"ת בכל אחת מC האוכלוסיות הינה נורמאלית (מצריך בדיקה, נבדוק על ידי פלט)
  5. שונויות המשתנה הב"ת בכל C האוכלוסיות שוות.

 

רכיבי השונות הכללית

 

1*1

3

פרונטאלי

2

לימוד עצמי

1

שיטת הוראה\
מס' נבדק J
80 70 60

1

80 70 60

2

80 70 60

3

ממוצע 3= 80 ממוצע 2= 70 ממוצע 1= 60

ממוצע מדגם

בהתפלגות כזו ניתן להסביר את ההבדלים אך ורק ע"י שיטת הלימוד. נעשה הבין בין
הקבוצות לבין תוך הקבוצות. כאן השינוי הוא בין הקבוצות בלבד ולכן נובע משיטת הלימוד.

 

1*1

3

פרונטאלי

2

לימוד עצמי

1

שיטת הוראה\
מס' נבדק J
60 60 60

1

70 70 70

2

80 80 80

3

ממוצע 3= 70 ממוצע 2= 70 ממוצע 1= 70

ממוצע מדגם

הבדלים אינדיבידואלים שלא ניתן להסביר, כיוון שמדובר בהבדלים בתוך הקבוצה. יכולים להיות גורמים מתערבים שישפיעו על ההבדלים הללו. אין הבדלים בממוצע ולכן ההבדלים נובעים בתוך הקבוצה.

 

1*1

3

פרונטאלי

2

לימוד עצמי

1

שיטת הוראה\
מס' נבדק J
80 60 60

1

70 70 70

2

80 80 60

3

ממוצע 3= 76.7 ממוצע 2= 70 ממוצע 1= 63.3

ממוצע מדגם

ההבדלים נובעים בין הקבוצות וכן בתוך הקבוצות. גם וגם.

 

השונות הכללים מורכבת משני רכיבים, הבדלים בין הקבוצות והבדלים בתוך הקבוצות. ההבדל בין
הקבוצות מכונה אפקט הטיפול. זהו הבדל בין התצפיות הנובע משיוכם לקטגוריות שונות של המשתנה הב"ת או מכך שקיבלו "טיפולים" שונים.

 

ההבדל בתוך
הקבוצות מכונה אפקט הטעות. זהו הבדל בין התצפיות שלא ניתן להסביר ע"י המשתנה הב"ת ונובע מהבדלים בין אישיים או טעויות דגימה.

 

 

I= ב"ת

J= תלוי

 

מרכיב מוסבר, הבדל בין הקבוצות.

מרכיב לא מוסבר, הבדל בתוך הקבוצות.

 

ההבדל בין הקבוצות יהיה הבדל בין הממוצע של הקבוצה אל מול הממוצע הכללי, הוא יהיה ההסבר החלקי של "למה יש הבדל בין הקבוצות?", כלומר הוא יהיה המרכיב המוסבר בשאלה זו. המרכיב שאינו מוסבר יהיה ההבדל בתוך הקבוצה, כלומר, אני אצליח להסביר את ההבדל רק ע"י ההבדל בין הקבוצות, שאר ההבדל ינבע מהדל בתוך הקבוצה.

 

לדוגמה: אני יכולה להסביר למה נדגם 1 בתרגול של 1*1 קיבל 76.7 (מתוך 80 הנקודות) ולא 70 כמו הממוצע המשוקלל, וזאת ע"י ההסבר של סוג הלימוד. אך אני לא יכולה להסביר למה הוא קיבל 80. כלומר 6.7 מהציון (ההבדל בציון) יהיה מוסבר, בעוד ששאר ההבדל יהיה לא מוסבר וינבע מהבדל בתוך הקבוצה.

 

המודל הליניארי של ניתוח שונות

ניבוי של תצפית מסוימת—>

 

 

= בין=α

=בתוך=ε

 


 

במדגם

באוכלוסייה כנחשב את הביטוי ונמצא כי הוא לא 0, אין ספק כי יש הבדל בוודאות. כאשר נחשב במדגם, כלומר חישוב האומדן
להבדלים, ישנה בעייתיות של טעויות דגימה:

(xij-x(bar))=(xj-x(bar))+(xij-x(bar))

 

Xij-X͞= אומדן להבדל בתוך הקבוצות- טעויות דגימה (A)

 

Xj-X͞= אומדן להבדל בין הקבוצות- טעויות דגימה (A)+ גודל אפקט(B).

 

כשמדובר באוכלוסייה, "בדבר האמיתי", אין הפרעות- כלומר טעויות דגימה. במדגם הן קיימות ולכן יוצרות בעייתיות. האומדן להבדל בין הקבוצות לא יהיה 'נקי', יכול להיות שהוא יכלול טעויות דגימה נוספות להבדל בתוך הקבוצות. אם נקבל 0, לא נדע בוודאות כי אין הבדל בין השונויות, לכן נהייה חייבים להשתמש במבחן F. אם היחס בין השונויות גדול מ-1, אזי קיימת הפרעה, כלומר טעות דגימה והאומדן להבדל בין הקבוצות הוא לא באמת 0, אלא יש רעש (ולהפך).

 

(B+A)/A>1

 

ה-A לא חייב להיות שווה זה לזה, כמו כן מה שיגרום להבדל העיקרי הוא הB במידה והוא קיים, כלומר במידה וקיים גודל אפקט.

 

בניתוח שונות ניעזר בסטטיסטי F לבדיקת היחס בין שני האומדנים- השונות בין הקבוצות בתוך הקבוצות. המונה מבטא את האומדן לשונות בין הקבוצות (אומד את גודל האפקט באוכ') וכן את ההבדלים האישיים. המכנה מבטא את האומדן לשונות בתוך הקבוצות (^2σ) הנובעת מהבדלים בינאישיים.

תחת נכונות H0, שני האומדנים הם אומדנים לאותה שונות כיוון שהB לא יתקיים, היחס בין ההבדלים הבינאישיים יהיה קרוב ל1.

 


לצילום של מר תמיר פראוי

 

לצילום של ד"ר גילה קינן

 



+ 4 = שתיים עשרה

תואר ראשון
תואר שני
מרצים