שם הכותב: תאריך: 16 דצמבר 2013

ססטיסטיקה 2

ד"ר גילה קינן

16.12.13

 

מבחן לאי תלות (המשך…)

 

בדגימה מקרית של 150 עובדים בקו ייצור אוטומטי 58% מהם הגיבו בצורה פאסיבית לאירועים מסוימים. במדגם אחר שבו אין קו ייצור אוטומטי- 45% מ120 עובדים שנגדמו באופן מקרי הראו תגובה פאסיבית.

 

נבנה טבלה של הנתונים Oi:

סה"כ לא אוטומטי אוטומטי קו יצור (ב"ת)\

סוג תגובה

141 54

45%

87

58%

פאסיבית
129 66

55%

63

42%

לא פאסיבית
270 120 100% 150 100% סה"כ

 

שאנחנו מדברים על תלות- אנחנו מתייחסים לכך שגם X תלוי בY, וכן גם Y תלוי בX.

מדובר ביותר מ"השפעה", צריך להסתכל על שני הצדדים מבחינה מהותית.

 

יש לבנות טבלה חדשה באופן כזה שלא יהיה תלות- כלומר הפערים באחוזים יהיו שווים ל0.

לאחר מכן נשווה בין הטבלאות ונבדוק האם מתקיים פער ביניהם.

יש לשים לב כי הפער צריך להיות מספיק משמעותי בכדי שייפול בשטח הדחייה.

הטבלה של המדגם תסומן: Oi (מה שקיבלנו בפועל)

הטבלה המלאכותית: Ei (מהמילה expected, מה אנחנו מצפים לקבל)

 

Ei

סה"כ לא אוטומטי אוטומטי קו יצור (ב"ת)\

סוג תגובה

141

 

100%

Y=62.7

52%

44.5%

X=78.3

52%

55.5%

פאסיבית
129

 

100%

b=73.3

48%

44.5%

a=71.7

48%

55.5%

לא פאסיבית
270 120

100%

150

100%

סה"כ

 

x/150=141/270

x=(150*141)/270

x=78.3

 

y/120=141/270

y=(120*141)/270

y=62.7

 

a/150=129/270

a=71.7

 

b/120=129/270

b=73.3

 

בדרך הנ"ל ניצור פער 0 לשני הכיוונים. אין צורך להוכיח את הפער מכיוון שעצם בניית הטבלה באופן זה תביא לכך בהכרח שהפער יהיה 0.

 

לאחר שבנינו את שני הטבלאות נבצע השוואה בין הטבלאות על ידי השוואה בין כל תא לתא המקביל לו:

Oi-Ei=

 

אם נסכם את כל ההפרשים (סיגמה), נקבל 0 בהכרח, לכן עלינו לעלות את התוצאה בריבוע.

לכן הסטטיסטי יהיה:

 


 

נחשב על פי הדוגמה שלהלן:

 


 

 

שלבים לחישוב מבחן לאי תלות על פי הדוגמה הנ"ל:

 

  1. הנחות:
  2. דגימה מקרית של עובדים

     

  3. אילוצים:
  4. אסור שב-למעלה מ20% מהתאים תהייה שכיחות צפויה (Ei) קטנה מ-5.
  5. אסור שבאף תא תהייה שכיחות צפויה (Ei) קטנה מ-1.

     

*האילוצים האלו הם בדומה לאילוצים שלמדנו בפרופורציות, אך הם מתורגמים למבחנים הללו.

20% מ-9 תאים קיימים הם 2 תאים, אם ב2 תאים יש ערך שחישבתי שהוא קטן מ5, הטבלה לא עומדת באילוצים, אם מדובר בתא אחד הטבלה עומדת באילוצים.

במידה והערך קטן מ5\1, ניתן לחבר משתנים סודרים, אך לא ערכים שמיים וכך לפתור את האילוץ. כמו כן, אם איחדתי שורה, אחבר גם את העמודה בכדי שיהיו לי אותו יחס מספר תאים.

 

  1. השערות:

ההשערות ייכתבו במילים.

 

H0: אין תלות בין קו ייצור לסוג תגובה

H1: יש תלות בין קו יצור לסוג תגובה.

 

תמיד השערת ה0 תציג "אין".

 

דרגות חופש בטבלה: (C-1)(R-1)

הפחתה ממספר העמודות 1, כפול הפחתה ממספר השורות 1.

כלומר אם הטבלה היא 3*3, דרגת החופש תהייה 2*2=4.

אם נבצע איחוד, נבצע את החישוב על הטבלה הסופית.

מספר עמודות ושורות לא חייב להיות סימטרי!!!

 

  1. אזורי דחייה וקבלה:

 

ההשערות תמיד יהיו דו כיווניות מכיוון שמדובר באי תלות\תלות.

מכיוון שמעלים בריבוע אין משמעות לצד "הנמוך" של ההתפלגות, לכן נעביר את אזור הדחייה השמאלי לאזור הדחייה הימני. כלומר נעביר את ה2/α מהצד השמאלי לצד הימני וכך אזור הדחייה שלנו יהפוך לα שלמה מהצד ה"גדול" של ההתחייבות.

תיווצר לנו השערה שתהייה דמוי השערה חד כיוונית.

 

אזור דחייה:

 


 

α=0.05

 


 

אזור קבלה:

 


 


 

  1. חישוב סטטיסטי:

     



     

  2. מסקנה:

     

    4.7>3.84 ולכן יש סיבה מספקת לדחות את H0 ברמת מובהקות α=0.05, כלומר יש תלות בין קו ייצור לסוג תגובה באוכלוסייה.

     

    *במבחנים הרבה פעמים השאלה תהייה מנוסחת במונחים של פרופורציות. במקום שישאלו האם יש תלות בין א' לב', ישאלו האם יש הבדל בין פרופורציה א' לפרופורציה ב' . זוהי בדיוק אותה שאלה המתייחסת לתלות כאשר מדברים אתנו על ההפרש. בשאלות של פרופורציות אנחנו מתייחסים לפרופורציה אחת, לכן במידה ואנחנו נשאלים על הבדל בין 2 פרופורציות אין ברירה אלא לבצע זאת על ידי מבחן תלות CHI בריבוע. את שאר המבחנים הנוגעים בדבר לא למדנו.

    הטעות הנפוצה היא לבצע פעמיים מבחן פרופורציה ולכן יש לשים לב לכך- כשיש הפרש הכוונה היא לCHI בריבוע.

    ברוב המקרים השאלה של הפרופורציות תכלול גם שאלה על CHI בריבוע.

     

 

לקראת יום הסטודנט דואגים על המשועממים למסיבות. 200 סטודנטים נשאלו מה דעתם על מסיבות האגודה. 80 מהם בגיל 30+, 50 בגיל 25-30 והשאר בגיל 20-25.

מבין גילאי 30+, 15 סטודנטים אוהבים מסיבות, 50 שונאים מסיבות והשאר אדישים. מבין גילאי 25-30, 20 סטודנטים אדישים למסיבות, 5 שונאים מסיבות והשאר אוהבים.

מבין גילאי 20-25, 40 אוהבים מסיבות, 5 שונאים והשאר אדישים למסיבות.

  1. האם יש השפעה של גיל הסטודנט על יחסו למסיבות במדגם?
  2. האם יש תלות בין גיל הסטודנט לבין היחס למסיבות באוכלוסייה? בדוק ברמת מובהקות α=0.05.

 

ה100% יחושב עבור המשתנה הבלתי תלוי.

 


  1. יש השפעה של גיל הסטודנט על יחסו למסיבות במדגם מכיוון שהאחוזים לא זהים. ניתן לראות שגילאי 20-25 אוהבים בעיקר מסיבות כאשר גילאי 30+ נמצאים בתחתית הרשימה וכד'.

     


 

  1. הנחות:
  2. דגימה מקרית של עובדים

     

  3. אילוצים:
  4. אסור שב-למעלה מ20% מהתאים תהייה שכיחות צפויה (Ei) קטנה מ-5.
  5. אסור שבאף תא תהייה שכיחות צפויה (Ei) קטנה מ-1.

     

    לכן הטבלה עומדת באילוצים.

     

  6. השערות:

 

H0: אין תלות בין גיל הסטודנט לאהדתו למסיבות.

H1: יש תלות בין גיל הסטודנט לאהדתו למסיבות.

 

  1. אזורי דחייה וקבלה:

     

    דרגת חופש: 2*2=4

     

    אזור דחייה:


     

    אזור קבלה:


     

  2. חישוב סטטיסטי:

     


     

  3. מסקנה:

     

9.488<70.25 ולכן יש סיבה מספקת לדחות את H0 ברמת מובהקות α=0.05, כלומר יש תלות בין גיל הסטודנט לאהדתו למסיבות.

 

לצילום השיעור

 




+ 5 = שתיים עשרה

תואר ראשון
תואר שני
מרצים