שם הכותב: תאריך: 09 דצמבר 2013

ססטיסטיקה 2

ד"ר גילה קינן

9.12.13

 

אמידה ובדיקת השערות על מדגמים מזווגים (תלויים)- המשך…

לאחר שנבצע את המחקר, המידע שיעניין אותנו הוא האם יש הפרש בין התוצאות. אם יהיה הפרש- אזי קרה משהו בין מה שהיה לפני למה שהיה אחרי. לכן אנחנו נמצא את ההפרש di, ונמצא את הממוצע של di.



 

דוגמה: בדגימה מקרית של 13 עובדים מארגון מסוים, נבדקו אחוזי התפוקה שלהם. ההנהלה לא הייתה שביעת רצון מהתוצאות והחליטה לתת להם הכשרה. העובדים קיבלו הכשרה ונבדקה התפוקה בשנית. האם ההכשרה העלתה את אחוזי התפוקה? בדוק ברמת מובהקות α=0.05

 

 

לפני אחרי Di – אחרי פחות לפני
1 63 68 5
2 41 49 8
3 54 53 -1
4 71 75 4
5 39 49 10
6 44 41 -3
7 67 75 8
8 56 58 2
9 46 52 6
10 37 49 12
11 61 55 -6
12 68 69 1
13 51 57 6

 

יש לבחור את מה אנחנו מפחיתים ממה- מכיוון שכיוון ההשערה ישתנה.

 

 

 

סוגי השערות:

הd יעמוד את התוחלת.

 

חד כיוונית חיובית:

H0: d0µ d≤µ

H0: d0µ d>µ

 

חד כיוונית שלילית:

H0: d0µ d≥µ

H0: d0µ d<µ

 

דו כיוונית:

H0: d0µ d=µ

H0: d0µ d≠µ

 

הנחות:

  1. דגימה מקרית של עובדים.

 

  1. מדגמים מזווגים.
  2. הפרשי אחוזי התפוקה מתפלגים נורמלית.

 

נתונים:

ממוצע ההפרשים= 4


N=13

α=0.05

 

אזורי דחייה וקבלה:

 

אזור דחייה: t12>1.782

אזור קבלה: t12≤1.782

 

חישוב סטטיסטי:


 

מסקנה:

2.758>1.782 ולכן יש סיבה מספקת לדחות את h0 ברמת מובהקות 0.05, כלומר ההכשרה העלתה את אחוזי התפוקה.

 

רווח בר סמך

 


 

בהמשך לנתונים הקודמים- בהנחה שהתוחלת לא ידועה, בהתבסס על אותם הנתונים, בנה רווח בר סמך ברמת ביטחון של 95% לתוחלת הפרשי אחוזי התפוקה.

 


 


 

מסקנה:

מתוך אינסוף דגימות חוזרות של מדגמי עובדים בגודל 13, תוחלת הפרשי אחוזי התפוקה תימצא ברווח המקרי שבין 0.84 ל7.16 ברמת ביטחון של 95%.

 

נניח כי הנתונים שרשמנו קודם הם מדגמים ב"ת- כלומר שנדגמו אנשים שונים, מדובר בשתי קבוצות שונות כאשר קבוצה אחת עברה הכשרה והקבוצה השנייה לא.

 

הנחות:

  1. דגימה מקרית של עובדים לפני ושל עובדים אחרי.
  2. מדגמים ב"ת.
  3. אחוזי התפוקה מתפלגים נורמלית לפני ואחרי.
  4. שונויות אחוזי התפוקה שוות

 

השערות:

H0: µx-µy≤0

H1: µx-µy>0

 

נתונים:

X- אחרי– ממוצע=57.6, ס.ת=10.8, n=13

Y- אחרי– ממוצע=53.69, ס.ת=11.7, n=13

 

 


 


ניתן לראות כי סטיית התקן קטנה עבור מדגמים מזווגים, לכן אם לחוקר יש בעייתיות לקחת מדגם גדול- עדיף לו לבצע מדגמים מזווגים שיקטינו לו את סטיית התקן של המדגם וכך ההסתברות לדחות את השערת ה0 תהייה גדולה יותר. במדגמים קטנים שווה לחוקר להשקיע במערך מזווג.

 

אזורי דחייה וקבלה:

אזור דחייה: t24>1.711

אזור קבלה: t≤1.711

 

חישוב סטטיסטי:

 


 

לא דוחים h0!

 

מבחנים א-פרמטרים

 

מבחן לאי תלות

 

התפלגות χ (CHI) בריבוע

נניח שיש התפלגות ערכים, כאשר שולפים תצפית אחת. לאותה התצפית עושים טרנספורמציה לZ- ולבסוף מעלים אותה בריבוע. בפעם השנייה נשלוף תצפית חדשה, נעשה טרנספורמציה לZ ונעלה בריבוע- כך נבצע את ההליך אינסוף פעמים. נקבל אינסוף CHI בריבוע בדרגות חופש1. כאן נוכל לחזור אחורה על ידי שורש לתוצאה שתחזיר אותנו לZ המקורי.

 

כאשר נשלוף כל פעם 2 תצפיות ונבצע את אותו ההליך של העלאה בריבוע- נחבר אותם זו לזו ונעשה זאת אינסוף פעמים- נקבל CHI בריבוע בדרגות חופש 2. במקרה זה לא נוכל לחזור לZ מכיוון שזהו חיבור של שני Z- לא ניתן לחזור אחורה על ידי ביצוע של שורש.

התפלגות CHI בריבוע תמיד תהייה חיובית מכיוון שמעלים את הZ בריבוע, ותנוע מ0 לאינסוף. כמו כן ברובה היא א-סימטרית חיובית. ככל שנגדיל את גודל המדגם היא תשאף להתפלגות נורמלית כאשר כל ההתפלגות תימצא על החלק החיובי של ציר המספרים. את ההתפלגות נסמן תמיד כא-סימטרית חיובית.

 

לסיכום:

  1. ההתפלגות מבוססת על Z בריבוע.
  2. ההתפלגות תנוע בין 0 לאינסוף.
  3. ככל שדרגות החופש הולכות וגדלות היא תשאף לנורמליות.
  4. נסמן אותה תמיד כא- סימטרית חיובית מכיוון שאנחנו נתעסק בדרגות חופש קטנות במבחן לאי תלות.
  5. נבדוק את ערך הCHI על ידי התפלגות χ בריבוע.

     

     

בדגימה מקרית של 150 עובדים בקו ייצור אוטומטי 58% מהם הגיבו בצורה פאסיבית לאירועים מסוימים. במדגם אחר שבו אין קו ייצור אוטומטי- 45% מ120 עובדים שנגדמו באופן מקרי הראו תגובה פאסיבית.

  1. האם יש הבדל בתגובה בין קהל ייצור אוטומטי ללא אוטומטי במדגם?
  2. האם יש השפעה של קו יצור על סוג תגובה במדגם?
  3. האם יש הבדל בפרופורציית התגובה הפאסיבית בקו יצור אוטומטי ללא אוטומטי במדגם? באוכלוסייה?
  4. האם יש תלות בין קו יצור לסוג תגובה באוכלוסייה?

 

נבנה טבלה של הנתונים:

סה"כ לא אוטומטי אוטומטי קו יצור (ב"ת)\

סוג תגובה

141 54

45%

87

58%

פאסיבית
129 66

55%

63

42%

לא פאסיבית
270 120 100% 150 100% סה"כ

 

תשובות:

  1. נגיד שאין הבדל כאשר האחוזים יהיו זהים. נבחין בפער בין הנתונים התלויים- במקרה שלנו באחוזים של התנהגות פאסיבית בקו יצור אוטומטי ולא אוטומטי, ההפרש הוא 13% (58-45), לכן יש הבדל בתגובה בין קהל יצור אוטומטי ללא אוטומטי.
  2. ניסוח אחר של שאלה א'- אם יש הבדל יש השפעה. התשובה תהייה כמו בא'.
  3. ההבדל בפרופורציה במדגם היא כמו שנשאל על ההבדל בתגובה- גם כאן מדובר באותה שאלה א' רק בניסוח אחר. (לגבי האוכלוסייה נענה בהמשך!!!!).
  4. בגדול אם יש השפעה חייבת להיות תלות, כיוון שהתגובה תלויה בקו היצור, הבעיה היא שתלות היא יותר מאשר השפעה. השפעה נותנת כיוון של בדיקה ומגדירה את המשתנה הב"ת והתלוי- קו יצור על סוג תגובה. כאשר אנחנו מדברים על תלות אנחנו לא מגדירים ב"ת ותלוי- אלא שואלת האם שניהם תלויים. התלות אומרת כי לא רק X משפיע על Y, אלא גם Y משפיע על X בו זמנית. שאלת התלות היא יותר רחבה משאלת ההשפעה.

    המבחן לאי תלות מתייחס לשני הצדדים של התלות מבלי להתייחס לתוכן המשתנים.

שיטת העבודה במבחן זה היא על ידי בניית טבלה חדשה- כאשר בונים באופן מלאכותי מצב של אי תלות. כלומר פער באחוזים= 0. על ידי השוואה בין טבלת הנתונים לטבלה שבנינו באופן מלאכותי ואנו יודעים כי אין תלות. אם יש פער בין הטבלאות נגיד כי יש תלות, אם נבחין כי הטבלאות זהות או בעלות פערים קטנים- אין תלות.

 

לצילום השיעור

 

 



שמונה − 4 =

תואר ראשון
תואר שני
מרצים