שם הכותב: תאריך: 25 נובמבר 2013

ססטיסטיקה 2

ד"ר גילה קינן

25.11.13

 

הסתברות, אמידה ובדיקת השערות על הפרש תוחלות מדגמים בלתי תלויים כאשר שנויות האוכלוסיות ידועות

 

מדובר על מצב ששונות אוכלוסייה ידועה, לכן אנחנו נמצאים בהתפלגות Z .

עד היום כשבדקנו השערות, בדקנו כאשר יש תוחלת אחת. כעת נעבור למצב שבו יש שתי תוחלות.

משתנה בלתי תלוי– שהוא משתנה שמי\סודר עם 2 קטגוריות (משתנה איכותי).

משתנה תלוי- משתנה כמותי.

 

למשל: משתנה בלתי תלוי- ותק כאשר יש שני קטגוריות- גבוה ונמוך, ומשתנה תלוי- תפוקה.

כך נקבל שני ממוצעים של שני הקטגוריות ונבחן את ההפרש בין שניהם.

הפרש חיובי- התפוקה של בעלי הותק הגבוה יותר גבוהה.

הפרש שלילי- התפוקה של בעלי הותק הנמוך יותר גבוהה.

  1. הותק לא משפיע על התפוקה.

 

מדגמים בלתי תלויים- המדגם שדגמתי צריך להיות בלתי תלוי במדגם השני. כלומר המדגם של בעלי הותק הגבוה הוא בלתי תלוי במדגם של בעלי הותק הנמוך (קבוצה אחרת).

למשל מחקר על חינוך ילדים על ידי דגימה של אימהות וילדים, כאשר החוקר מחליט לתשאל גם את האבות. יש שני קבוצות- גברים ונשים כאשר חינוך ילדים הוא מצב תלוי. אך המדגמים תלויים אחד בשני מכיוון שהורים משותפים לילדים חולקים דעות משותפות לגבי חינוך ילדים, כלומר קיימת תלות. להורים יש דעות משותפות וייווצר מצב בו ההורים יענו בהתאם לשאלות- קיימת תלות בין התשובות שלהם.

אם החוקר היה רוצה לעשות את המחקר על מדגמים בלתי תלויים הוא היה דוגם אימהות ואבות שלא קשורים אחד לשני.

 

מאחר מה שמעניין אותנו הוא ההפרש- נבנה התפלגות אחת שהיא תהייה התפלגות ההפרשים.


אנחנו צריכים למצוא את השונות:


רו= הr של פירסון באוכלוסייה. רו בודק את הקשר בין המשתנים. מכיוון שיש מצב בו המדגמים בלתי תלויים, הקשר יהיה 0. לכן אין כאן לרו משמעות והוא תמיד יהיה שווה 0 .

 


 

התפלגות הדגימה

 


 

בדיקת התפלגות נורמלית

  1. נאמר בשאלה
  2. כל מדגם X וY גדול או שווה ל30 (בנפרד)
  3. אם לא ידוע גודל המדגם, או שנתון שגודל קבוצה אחת קטנה מ30, צריך לבדוק אם אותו מדגם מתפלג נורמלית.

 

הסתברות

נבדוק הסתברות כמו שעשינו עד היום, אך רק על הפרשים.

 

בדיקת Z

 


 

דוגמה: נבחר מדגם מקרי של 16 אנשים מאוכלוסייה מתפלגת נורמלית, כאשר תוחלת האוכלוסייה (Y) הוא 50 וסטיית התקן של הערכים באוכלוסייה היא 3. נדגם מדגם מקרי של 25 אנשים מאוכלוסייה אחרת המתפלגת נורמלית בלתי תלויה בראשונה, כאשר תוחלת האוכלוסייה (X) היא 55 וסטיית התקן של הערכים היא 5. מה ההסתברות שפער ממוצעי המדגם ינוע בין 3-6?

 


רווח בר סמך

  • מה שמעניין אותנו הוא ההפרש בין התוחלות ולא כל תוחלת בפני עצמה. לכן ההפרש לא ידוע ונרצה לאמוד אותו על סמך ההפרש במדגם.

 


 

דוגמה: חשב רווח בר סמך להפרש תוחלות התפוקות ברמת ביטחון של 98% כאשר ממוצע התפוקות שיתקבל במדגם מקרי של 100 גברים הוא 8. ידוע ששונות התפוקה באוכלוסייה זו היא 25. ממוצע התפוקה שהתקבל ממדגם מקרי של 72 נשים הוא 10, ידוע ששונות התפוקה באוכלוסייה זו היא 36.

 

הנחות:

  1. דגימה מקרית של גברים ושל נשים (בנפרד!).
  2. מדגמים בלתי תלויים.
  3. כל אחד מן המדגמים גדול מ30 (משפט הגבול המרכזי), לכן ההפרשים של ממוצעי התפוקות מתפלגים נורמלית (nx>30, ny>30).

 

  • אפשר להגדיר את X וY לפי ראות עינינו, אך יש לשים לב כי אנחנו שומרים על הקביעה שלנו לאורך כל התרגיל בכדי שלא ייווצרו טעויות.

     

X=נשים

Y= גברים

 


 

מסקנה:

מתוך אינסוף דגימות חוזרות של מדגמי נשים בגודל 72 ומדגמי גברים בגודל 100, הפרש תוחלות התפוקות יימצא ברווח המקרי שנע בין -0.017 ל4.017 ברמת ביטחון של 98%.

 


  • מכיוון שה0 נמצא בתוך הרווח בר סמך, התפוקה שווה.

 

בדיקת השערות

 

השערה דו כיוונית

 

H0: x-µy=µ0µ

H1: x-µy≠µ0µ

 

השערה חד כיוונית חיובית

 

H0: x-µy≤µ0µ

H1: x-µy˃µ0µ

 

השערה חד כיוונית שלילית

 

H0: x-µy≥µ0µ

H1: x-µy<µ0µ

 

דוגמה: נבדקה השפעה של הכשרת עובדים על גודל המכירות. לשם כך נבחרו שני מדגמים באופן מקרי ובלתי תלוי. מדגם אחד כלל 30 עובדים שעברו הכשרה. ממוצע המכירות שהתקבל בו הוא 106.9. מדגם שני שלא עבר הכשרה כלל 20 עובדים והתקבל בו ממוצע מכירות 102.8.

ידוע שהמכירות מתפלגות נורמלית בכל אחת משתי האוכלוסיות וסטיית התקן בכל אחת מהן היא 15. האם ממצאים אלה מעידים על כך שההכשרה מעלה את המכירות? בדוק ברמת מובהקות α=0.05.

 

הנחות:

  1. דגימה מקרית של עובדים שעברו הכשרה ושל עובדים שלא עברו הכשרה.
  2. מדגמים בלתי תלויים.
  3. התפלגות הדגימה של הפרשי ממוצעי המכירות מתפלגת נורמלית.

 

השערות:

  • יש להחליט לפני שלב ההשערות מהו X ומהו Y, מכיוון שההחלטה תקבע לנו את כיוון ההשערות.

 

X- עברו הכשרה

Y- לא עברו הכשרה

מכיוון שX גדול מY מדובר בהפרש חיובי.

 

H0: x-µy≤0µ

H1: x-µy˃0µ

 

  • כל הפרש שיהיה בין התוחלות יוכיח כי הכשרה מעלה את המכירות. רוב השאלות יהיו בנוסח כזה שµ יהיה שווה ל0.
  • אם היינו מחליפים בין X ל לY ההשערה הייתה הפוכה- שלילית.

     

נתונים:

 

ממוצע X= 106.9

ממוצע Y= 102.8

X=σy=15σ

Ny=30

Nx=20

α=0.05

 

תיאור התפלגות הדגימה:

 


 

תיאור התפלגות הדגימה תחת נכונות h0:

 


 

אזורי דחייה וקבלה:

אזור דחייה: z>1.645

אזור קבלה: z≤1.645

 

חישוב סטטיסטי:

 


 

מסקנה:

 

0.947<1.645 ולכן אין סיבה מספקת לדחות את H0 ברמת מובהקות α=0.05. לכן אין עדות לכך שההכשרה מעלה את המכירות.

 

רווח בר סמך-בדיקת השערות

 

במדגם מקרי של 15 אנשים מאוכלוסייה נורמלית בעלת סטיית תקן 8, נמצא ממוצע 75. במדגם מקרי שני בלתי תלוי בראשון של 40 אנשים מאוכלוסייה נורמלית אחרת בעלת סטיית תקן 5, נמצא ממוצע מדגם 80.

  1. חשב רווח בר סמך ברמת ביטחון של 94% להפרש התוחלות.
  2. האם לאור הרווח שמצאת תדחה או לא תדחה את ההשערה שאין הבדל בין התוחלות ברמת מובהקות α=0.06.
  3. בדוק את ההשערה הזו עבור α=0.06.
  4. חזור על ב' וג' לגבי ההשערה האלטרנטיבית האומרת שתוחלת האוכלוסייה השנייה שונה מתוחלת הראשונה בשתי יחידות.

 

תשובות:

 

  1. X= אוכלוסייה 1

    Y= אוכלוסייה 2

     



     

  2. α=0.05

    h0:µx-µy=0

    h1: µx-µy≠0

     

    ה0 לא מוכל ברווח בר סמך ולכן נדחה את h0.

     

  3. חישוב סטטיסטי:


     

    אזורי דחייה וקבלה:

     

    אזור דחייה:

    z<-1.88

    z>1.88

    אזור קבלה:

    -1.88≤z≤1.88

     

    המסקנה תהייה כמו בסעיף ב'.

     

  4. ב. מכיוון שהגדרנו את X כאוכלוסייה 1 ואת Y כאוכלוסייה 2, יש לבצע היפוך של הסימן. כלומר:

     

    h0:µx-µy=-2

    h1: µx-µy≠-2

     

    דבר נוסף הוא שהרווח הוא במינוס, ולכן לא יכול להיות שנבחן את התוחלת על פי פלוס. ההשערה שלי בצד אחד ולא יכול להיות שהחישוב יהיה בצד השני.

    יש לשים לב להגדרה של המחקר לעומת החישוב שעשיתי.

     

    המסקנה תהייה שלא נדחה את h0, מכיוון ש2- מוכל ברווח בר סמך.

     

    ג. חישוב סטטיסטי:

     


     

    אזורי דחייה וקבלה:

     

    אזור דחייה:

    Z<-1.88

    z>1.88

     

    אזור קבלה:

    -1.88≤z≤1.88

     

    לכן לא נדחה את H0.

לצילום השיעור



− ארבע = 1

תואר ראשון
תואר שני
מרצים