שם הכותב: תאריך: 29 אוקטובר 2013

ססטיסטיקה 2

ד"ר גילה קינן

28.10.13

 

תזכורת שיעור 2: בהסקה סטטיסטית יש שתי חטיבות מרכזיות-

אמידה: פרמטר לא ידוע שאנחנו רוצים לגלות על סמך התוצאה של המדגם. (רווח בר סמך)

בדיקת השערות: יש פרמטר ידוע ונשאלת השאלה האם בעקבות שינוי שנעשה חל שינוי גם בפרמטר.

 

 

שלבים בבדיקת השערות

 

הנחות-
דרישות הכרחיות כדי שהמבחן הסטטיסטי יתקיים (יהיה תקף)- הדרישות חייבות להתקיים.

דגימה מקרית- אומד חסר הטיה.

התפלגות הדגימה של הממוצעים יתפלגו נורמאלית. כדי שממוצעים יתפלגו נורמאלית יכולות להיות מספר אפשרויות (עפ"י משפט הגבול המרכזי):

אם הערכים במקור מתפלגים נורמאלית- הממוצעים יתפלגו נורמאלית.

לא ניתן לדעת האם הערכים מתפלגים נורמאלית\יודעים שהם לא מפלגים נורמאלית- נשתמש במשפט הגבול המרכזי- כלומר אם ניקח מדגם גדול מ30 הממוצעים יתפלגו נורמאלית.

כאשר לא ידוע אם הערכים מתפלגים נורמאלית ויש לי מדגם פחות מ30- יש תהליך (מבחן סטטיסטי) שבודק האם הערכים מתפלגים נורמאלית.

 

הצבת השערות יש 3 סוגים של הצבת השערות:

השערה חד כיוונית חיובית (חד צידית): החוקר טוען טענת גדול. כלומר שהתוחלת תהיה יותר גדולה ממשהו (לדוגמה שהמכונית תיסע יותר מ10 קילומטרים).

: µ≤ (טענת שוויון, אך נרשום את גם את סימן הקטן בכדי לכסות את כל ההתפלגות. השוויון תמיד ימצא ב).

:
µ˃

השערה חד כיוונית שלילית: החוקר טוען טענת קטן. כלומר שמה שיימצא יהיה קטן יותר ממה שהיה. (תרופה שתוריד את תוחלת החולים לדוגמה).

: ≤µ

:
›µ

 

 

השערה דו כיוונית: החוקר לא יודע לקבוע את הכיוון ולכן הוא לא יודע אם מדובר בגדול\קטן. החוקר קובע שני אזורי דחייה. מדובר בטענת שונה. החוקר "משלם" מחיר כאשר בכל צד יש לו רק חצי אלפא, כלומר הסיכוי לטעות נשאר אותו סיכוי, אך הסיכוי שלו לדחות את הופך לקטן יותר.

:

:
≠µ

 

*משתמשים בהשערות דו כיוונית כאשר משתמשים בבדיקות שמתבססות על הנחות. בדיקה ששואלת האם יש\אין- היא בדיקה דו כיוונית.

 

מה קובע את כיוון ההשערה?

מה שהחוקר קובע. במחקר יהיה אחד מן השלושה ולא שלושתן יחד.

 

*כשאנחנו מדברים על השערות אנחנו בדרך כלל מדברים על ערכים מספריים- כלומר קטן\גדול מערך מספרי כלשהו.

 

נתונים:
כל הנתונים שיש במדגם (ממוצע, גדול מדגם, סטיית תקן, שונות, אלפא וכו')

 

תאור התפלגות הדגימה: להראות מהו המודל שאני הולכת לעבוד אתו. (רושמים את המודל).

 

תיאור התפלגות הדגימה תחת נכונות

 

(בסוגריים רושמים את ערכי המדדים)

 

קביעת אזורי דחייה וקבלה:

 

לקבוע את הגבול- כלומר אם התוצאה תצא בתוך הגבול קיבלתי את השערת העולם, ומחוצה לו- דחיתי אותה. הקביעה קשורה בהשערה שקבעתי (סעיף 4). נשווה את האזורים על ידי חישוב הZ (ציון תקן).

 

טענת גדול (חד כיוונית חיובית):

דחייה (דוחה את המצב כיום):z˃z(α)

קבלה (מקבל את המצב כיום):
z≤z(α)

 

טענת קטן (חד כיוונית שלילית):

דחייה (דוחה את המצב כיום):z˂-z(α)

קבלה (מקבל את המצב כיום):
z≥-z(α)

 

טענת שונה (דו כיוונית):

 

דחייה (דוחה את המצב כיום):

z˃z()

z˂-z()

 

קבלה (מקבל את המצב כיום):

 

 

חישוב הסטטיסטי:

 

כלל החלטה-
השוואה בין ציון התקן שחישבתי לבין ציון התקן של אלפא.

 

מסקנה:

דוחים\לא דוחים (דחיתי או לא את (H0.

ברמת מובהקות (באיזו אלפא התבצעה ההחלטה הזו? באיזו רמת מובהקות).

מסקנה מילולית (מה המשמעות במונחי השאלה).

 

דוגמה: דוחים את H0 ברמת מובהקות של ___. כלומר החוקר צודק- ____.

 

 

כללים:

אם דחינו את H0 ברמת מובהקות מסוימת, אזי בטוח שנדחה ברמת מובהקות גבוהה יותר.
ברמת מובהקות נמוכה יותר, נצטרך לבדוק.

אם לא דחינו את H0 ברמת מובהקות מסוימת, אזי ברמת מובהקות נמוכה יותר בוודאי שלא נדחה. ברמת מובהקות גבוהה יותר נצטרך לבדוק.

 

דוגמה:

במשרד המסחר והתעשייה, התקבלו תלונות צרכנים כי חברת מתוק-לי לא עומדת במתכוון בהתחייבויותיה ומשקלו של החטיף טוב-לי נמוך במתכוון מ-200 גרם. חברת הממתקים טוענת מצידה שהיא כן עומדת בהתחייבויותיה אלא שמשקלו של החטיף הינו משתנה מקרי עם סטיית תקן של 20 גרם.

מר חקרני במשרד המסחר והתעשייה מתכוון לשקול 100 חפיסות טוב-לי ולאחר מכן להגיע להחלטה.

 

במדגם של 100 חטיפים התקבל ממוצע של 195 גרם.

 

  1. בדוק את טענת הצרכנים ברמת מובהקות α=0.05
  2. האם ממוצע המדגם סוטה במובהק מתוחלת האוכלוסייה? בדוק ברמת מובהקות α=0.05. האם ניתן להסיק על סמך סעיף א'?
  3. מהי הα המינימאלית בה ניתן לטעון שהצרכנים אכן צודקים?
  4. מהי הα המינימאלית בה ניתן לטעון שיש הבדל בין ממוצע המדגם לתוחלת האוכלוסייה?

 

תשובות:

  1. הצרכנים טוענים שבמכוון משקל החטיף נמוך מ200 גרם. מר חקרני בודק האם טענתם נכונה. תהליך בדיקת ההשערות הוא בעצם בדיקת השערת הצרכנים. נעבוד על פי הסעיפים:

הנחות:

דגימה מקרית של חטיפים.

ממוצעי משקל החטיפים מתפלג נורמלית (n˃30).

 

השערות:

מדובר בהשערה חד כיוונית שלילית מכיוון שהצרכנים טוענים שהמשקל של החטיף נמוך מ200 גרם.

: 200≤µ

: 200˂µ

 

נתונים:

ממוצע= 195

גודל מדגם= 100

ס.תקן= 20

α=0.05

 

תיאור התפלגות הדגימה:


 

תיאור התפלגות הדגימה תחת נכונות H0

 

קביעת אזורי קבלה ודחייה:

 

אזור דחייה: Z˂-1.645

אזור קבלה: Z≥-1.645

(חישוב על פי טבלת Z, כאשר α=0.05)

 

חישוב סטטיסטי:

 

כלל החלטה:

-2.5˂-1.645 (אזור דחייה)

לכן יש סיבה מספקת לדחות את h0 ברמת מובהקות α=0.05.

כלומר, הצרכנים צודקים. (משקל החטיף אכן נמוך מ200 גרם.)

 

ב. מה הכוונה סוטה ומובהק? למילה סוטה אין כיוון, כלומר יכול להיות סוטה כלפיי מטה\למעלה. המילה סוטה מצביעה על סוג השערה דו כיוונית. השאלה הנשאלת היא האם התוצאה היא שונה באופן מהותי ממה שהיה קודם? הכוונה במובהק היא האם התשובה באמת נופלת באזור המובהקות.

 

כאשר בדקנו השערה חד כיוונית, נמצא כי ההשערה דוחה את H0.

עכשיו נאמר שיש לבדוק על השערה דו כיוונית את אותם הנתונים. כעת נקטין את שטח הדחייה כאשר האלפא תתחלק בשתיים.

 

2. השערות:

µ=200 :H0

µ≠200 :H1

 

סעיפים 1,3,4,5,7 נשארים כשהיו.

6. קביעת אזורי דחייה וקבלה:

אזור דחייה:

Z˃1.96

Z˂-1.96

אזור קבלה:

-1.96≤Z≤1.96

 

8. כלל החלטה:

-2.5˂-1.96

לכן יש סיבה מספקת לדחות את H0 ברמת מובהקות α=0.05.

כלומר, ממוצע המדגם סוטה במובהק מתוחלת האוכלוסייה.

 

ג. כמה אני אוכל להקטין את האלפא ועדיין לדחות את השערת העולם (H0)? התשובה תהייה הZ שמצאנו בסעיף 7 בחישוב הסטטיסטי. על פי לוח Z נבדוק מה ערך האלפא והיא תהייה האלפא המינימאלית. המשמעות של התוצאה היא שאם אני אקח אלפא יותר גדולה ממנה, אנחנו נדחה את H0 ואם ניקח אלפא קטנה ממנה לא נדחה את H0.

כלומר: Z=2.5-

α=0.0062

ולכן היא תהייה הα המינימאלית שבה עדיין נצליח לדחות את H0.

 

Sig=p. value=0.0062=min α

 

ד. מדובר על α מינימלית בהשערה הדו כיוונית. (הבדל- יכול להיות למטה\למעלה, אין כיוון ולכן מדובר במצב דו כיווני.) השאלה היא אם ב'זנב' יש לי 0.0062, כמה יש לי בכל הגבול שקבעתי אם מדובר בהשערה דו כיוונית? לכן נכפיל את התוצאה ב2.

 

Sig=p. value=2*0.0062=0.0124=min α

 

כללים לשאלות בנושא α מינימאלית

– אם יש השערה חד כיוונית, אזי הα המינימאלית היא ההסתברות של הסטטיסטי (ס' 7).

– אם ההשערה היא דו כיוונית, אזי הα המינימאלית היא ההסתברות של הסטטיסטי*2.

 

לצילום השיעור




7 × שמונה =

תואר ראשון
תואר שני
מרצים