שם הכותב: תאריך: 04 נובמבר 2013

ססטיסטיקה 2

ד"ר גילה קינן

4.11.13

המשך מבחן סטטיסטי- בדיקת השערות

 

אפשרות נוספת בשיטת בדיקת השערות

 

ישנה אפשרות של מדגם שייערך על בסיס תוצאה. כלומר אם אצליח למצוא תוצאה מסוימת אזי דחיתי את H0, ולאו דווקא α מסוימת (הסתברות).

ערך התוצאה יקבע על בסיס מחקרים קודמים או רצון של חברה להשיג תוצאה מסוימת ולא הסתברות מסוימת. אם החוקר ימצא נקודה מסוימת בה שווה למספר מסוים אזי הוא דחה את השערת H0.

 

דוגמה: כדי לבדוק האם ממוצע ציונים באנגלית בבגרות בשנה מסוימת שונה משנה קודמת שהיה 70.5, נבחר מדגם מקרי של 400 מבחנים. ידוע שסטיית התקן של ציוני המבחן היא 10.

חוקר א' קבע רמת מובהקות של α=0.05, חוקר ב' קבע שאם יהיה בין 69 ל72, לא תדחה השערת ה0 האומרת שאין הבדל בין הממוצעים.

  1. מי מהחוקרים עובד עם רמת מובהקות גבוהה יותר?
  2. מי מהחוקרים עובד עם אזור קבלה רחב יותר?
  3. התקבל= 71 מה יחליט חוקר א'?

 

חוקר א' חוקר ב'
α=0.05 α=0.0026
אזור דחייה: z˃1.96

z˂-1.96אזור דחייה: (קריטיc ( < c >

72 < 69> אזור קבלה: -1.96≤z≤1.96אזור קבלה: 69≤≤72

 

H0: µ=70.5

H1: µ≠70.5

 

P(z≥3)=0.0013

 

H0: µ=70.5

H1: µ≠70.5

 

P(z≥3)=0.0013
מסקנה: לא דוחים H0. לחוקר ב' יש α יותר קטנה והוא לא הצליח לדחות את הטענה, ולכן יכול להיות שב α יותר גדולה כן נצליח לדחות את H0.


 

  1. חוקר א' שעבד עם רמת מובהקות α=0.05, עובד עם רמת מובהקות גדולה יותר (יותר גדול מ0.0026)
  2. חוקר ב' שיש לו רמת מובהקות יותר קטן, כלומר אזור דחייה קטן יותר, אז יש לו אזור קבלה גדול יותר.
  3. חוקר ב' לא ידחה כיוון ש=71 נופל באזור קבלה אבל אצל חוקר א' כאשר α=0.05, כלומר יותר גדולה, לא ניתן לדעת וייתכן כי כאשר =71 הוא ייפול באזור דחייה. לאחר בדיקה התברר כי הוא נפל באזור קבלה ולכן אין דחייה.

 

טעויות אפשריות בהסקת מסקנות בתהליך בדיקת השערות

 

טעות מסוג 1- α: דוחים את H0 כאשר H0 נכונה. ישנה אפשרות שהסקנו כי יש דחייה של המצב הקיים, אך ייתכן שזו טעות ומדובר בקבלה של המצב הקיים. הדבר אפשרי כאשר הסתברות המחקר נופלת בקצוות הגבולות שקבענו.

 

טעות מסוג 2- β: לא דוחים את H0 כאשר H1 נכונה. ישנה אפשרות שהסקנו כי אין דחייה של המצב הקיים, אך ייתכן שזו טעות ומדובר בדחייה של המצב בקיים. הדבר אפשרי כאשר הסתברות המחקר נופלת בקצוות הגבולות שקבענו.

 

*המסקנות שהסקנו הם בדרך כלל נכונות. אך בכל זאת יש סיכוי שמדובר בטעות ולא ניתן לדעת בוודאות אם היא קיימת. כמו כן, יש לקחת בחשבון את הטעויות ואת הסיכוי לטעות. על פי רמת המובהקות ניתן לדעת כי רוב הסיכויים שלא טעינו (בדרך כלל 95% למסקנה נכונה).

 

בטעות מסוג 1 החוקר יודע את גודל הטעות מכיוון שהוא קובע את גודלה של α. כך הוא קובע את ההסתברות לטעות מסוג 1. כמו כן- מכיוון שברוב המקרים קיימת בעיה למצוא את µ1, לא ניתן לחשב את ההסתברות לטעות מסוג 2.

טעות מסוג 2 היא פחות בשליטה מבחינת החוקר מכיוון שהיא נקבעת מתוקף מיקומו של µ1.

 

הפער בין µ1 ל µ0 נקרא: גודל אפקט. ככל שגודל האפקט יותר גדול, שטח החפיפה יהיה יותר קטן ולהפך.


משמעות שטח החפיפה: שישנם תוצאות שיכולות להשתייך גם לH1 וגם לH0 .

 

לα וβ יש קו משותף שמשפיע על הגודל של שניהם. כלומר הן באות אחת על חשבון השנייה. (לא ביחס ישר, אלא אם נגדיל את הα בהכרח β תקטן ולהפך.)

 

השפעה של הגדלת גודל מדגם

 

*גודל האפקט נקבע לחוקר, אך אם הוא בכל זאת מעוניין להקטין את ההסתברות של β, איך ניתן לעשות זאת? התשובה היא להגדיל את N, כלומר את גודל המדגם.

 

אם נגדיל את גודל המדגם ההתפלגויות יהיו יותר צרות, כלומר הממוצעים יהיו קרובים יותר לתוחלת. בנוסף שטח החפיפה בין ההתפלגויות יהיה קטן יותר.

 


  • אם החוקר קבע α הסתברותית, הגדלת גודל המדגם לא משפיעה על גודלה של α אך β קטנה.

     

  • אם החוקר קבע c (כשהחוקר קובע תוצאה ולא הסתברות מסוימת), אזי הגדלת גודל המדגם תקטין את α. כמו כן β תקטן. הקו של התוצאה שנקבע לא יזוז, אלא רק ההתפלגויות יזוזו סביבו, לעומת מצב בו אנחנו מחליטים על הסתברות מסוימת וההתפלגויות יתאימו עצמם לאותה הסתברות גם אם גודל המדגם יגדל. (כלומר מובן מאליו שα תישאר בהינה).

     

  • בכמה צריך להגדיל את המדגם: ישנה נוסחה (שלא נלמדת) שעל ידה מחליטים מה גודל המדגם שיש בו צורך בכדי להקטין את β, כלומר שיהיה שטח חפיפה שמתאים לחוקר.

     

 

חישוב β

 


(תחת H0)

(תחת H1) =60.51µ

 

H0: 60µ≤

H1: 60˃µ

 

 



 

Z0=1.645

Z1=-1.11

 


 


 


 


0.206=β

 

 

חוקר א' חוקר ב'
α=0.05
α=0.027
0.1335=β 0.206=β

 

 

שאלה לדוגמה

ידוע כי שכרם של עובדי סקטור יצור מתפלג נורמלית עם תוחלת של 19,000$ לשנה וסטיית תקן 4,000$. עובדי סקטור זה בארגון מסוים טענו כי הם משתכרים פחות מהתוחלת של הסקטור לו הם משתייכים וכי תוחלת השכר שלהם עומדת על 18,050$. לבדיקת טענתם נדגם מדגם מקרי של 100 עובדים והתקבל ממוצע שכר 18,500$.

  1. בדוק את טענת העובדים ברמת מובהקות α=0.01
  2. מהי הטעות העלולה להתרחש במסקנה שקיבלת בסעיף א? מהי ההסתברות לכך?

 

הנחות:

  1. דגימה מקרית של עובדים.
  2. ממוצעי השכר מתפלגים נורמלית.

 

השערות:

 

H0: 19,000µ≥

H1: 19,000˂µ

 

נתונים:

ממוצע: 18,500

N= 100

σ= 4000

α=0.01

תיאור התפלגות דגימה:


תיאור התפלגות דגימה תחת נכונות H0:

 


 

אזורי קבלה ודחייה:

דחייה: z˂-2.33

קבלה: z≥-2.33

 

חישוב סטטיסטי:

 


 

מסקנה:

-1.25˃-2.33 ולכן אין סיבה לדחות את H0 ברמת מובהקות α=0.05. לכן טענת העובדים לא נכונה.

 

*איזה טעות יכולה להתקבל במסקנה?- יכול להיות שלא דחינו את הטענה, אך היינו אמורים לדחות אותה. כשיש מסקנה אני יכולה לטעות רק טעות אחת משני הסוגים (או סוג 1 או סוג 2).

 


 


 


β=0.484

 

ההסתברות לטעות במסקנה היא כמעט 50%, אך המסקנה לא משתנה!

 

עוצמה

H1

H0

השערת החוקר\מצב העולם
טעות מסוג 1 אין טעות

H0

אין טעות- (עוצמה): דחינו את H0 כאשר H1 נכונה. טעות מסוג 2

H1

1-β

כשאנחנו מגדילים את גודל המדגם אנחנו מקטינים את β ולכן העוצמה גודלת. (ניתן להגיד במקום להגדיל את N – להקטין את הפיזור. זה אותו הדבר.)

ככל ש β יותר קטנה, העוצמה יותר גדולה ולכן השאיפה היא ל- β קטנה ככל האפשר.

 

לצילום השיעור



שלוש × 2 =

תואר ראשון
תואר שני
מרצים