שם הכותב: תאריך: 18 נובמבר 2013

ססטיסטיקה 2

ד"ר גילה קינן

18.11.13

 

הנחות לגבי t

בt נכתוב את אותם ההנחות כמו בz. כמו כן, בכל מבחני הt יש להניח שערכים מתפלגים נורמלית, מכיוון שאם הערכים מתפלגים נורמלית- הממוצעים מתפלגים נורמלית. לכן נניח הערכה לגבי הממוצעים על ידי הערכים. זאת מכיוון שאין את משפט הגבול המרכזי עבור t. כמו כן אם ידוע שהממוצעים מתפלגים נורמלית אין לנו בעיה כי ההתפלגות נתונה. בהמשך נלמד איך לבדוק האם הממוצעים מתפלגים נורמלית על ידי חישוב.

 

הקשר בין רווח בר סמך לבדיקת השערות

כאשר ידועה התוחלת אין שום משמעות לבנות רווח בר סמך, כלומר מטרת הרווח בר סמך היא למצוא את התוחלת. בסוף שיעור קודם מצאנו תוחלת: .

ברווח בר סמך יש את הסיכון שהפרמטר לא נמצא ברווח שנמצא, כמו כן הסיכון הוא סימטרי לכל צד.

כשאנחנו בדוקים השערות יש לנו גם α שנמצאת בקצה, כאשר בדקתי השערות ונפלתי בשטח של ה α, בעצם המשמעות היא שמצאתי µ אחר. למרות שרווח בר סמך ובדיקת השערות אלו שתי פרוצדורות שונות, יש קשר ביניהם על ידי אותו α שנקבעת מראש כרמת סיכון.

ישנה אפשרות לבדוק השערות דרך הרווח בר סמך

כאשר מצאתי כבר רווח בר סמך, וכן הנתונים נשארים כאותם נתונים- כלומר הα שווה, ההשערה שווה וכו' (תנאי חובה כדי להסיק לגבי בדיקת השערות)- במקרה שלנו- וכן מדובר בהשערה דו כיוונית. לאחר מכן נבדוק האם הנתון שיש בh0 נמצא ברווח, אם הוא נמצא ברווח לא נדחה את הh0, אם הוא לא נמצא ברווח- נדחה את h0. לכן במקרה שלנו 27 נמצא ברווח ולכן לא נדחה h0.

 

לגבי השערה חד כיוונית: ברווח בר סמך אנחנו מסתכלים על שני צדדים לעומת בדיקת השערות שהיא חד כיוונית. לכן הα בבדיקת השערות תהייה חייבת להיות חצי מα ברווח בר סמך (חצי זנב). בכל זאת, למרות שיש לנו רק 'זנב' אחד, אנחנו נבדוק אותו באותו אופן כמו בהשערה דו כיוונית- האם הנתון בh0 מוכל ברווח בר סמך.

 

הסתברות, אמידה ובדיקת השערות על פרופורציה באוכלוסייה

 

פרופורציה זה בעצם יחס. הבעיה עם פרופורציה היא שהיא בדרך כלל משתנה בדיד (לא כמותי) ובמקרים מסוימים נייחס אותו למשתנה כמותי על ידי תנאי מסוים:

-המשתנה יהיה דיכוטומי (שתי קטגוריות בלבד- גברים\נשים וכד')

 

P= הסתברות להצלחה בודדת (אוכלוסייה) – כלומר אם נדבר על מכונה שמייצרת ברגים ויש ברגים פגומים ולא פגומים- אז ההסתברות שאייצר בורג פגום הוא הp. ההסתברות שאייצר בורג לא פגום יהיה 1-p במדגם-

q=ההסתברות לכישלון (אוכלוסייה)– כלומר- q=1-p. במדגם-

 

התפלגות הפרופורציות יהיה:


בכדי לעבוד עם לוח z נצטרך שהפרופורציות יתפלגו נורמלית.

נשאלת השאלה האם הפרופורציות מתפלגות נורמלית- גם עבור פרופורציות יש את משפט הגבול המרכזי- אם ניקח מדגם מספיק גדול הפרופורציות יתפלגו נורמלית.

כלומר אם התנאים הבאים מתקיימים יחד מתקיימת התפלגות נורמלית:

np≥10

nq≥10

כלומר אם p יהיה שווה 0.1 הn חייב להיות שווה ללפחות 100 (לבדוק על פי הנמוך שמבין p וq מכיוון ששניהם משלימים ל1). כלומר אין גודל מדגם קבוע, אלא כל פעם יש לבדוק בהתאם לפרופורציה הספציפית שיש באותה האוכלוסייה.

 

רווח בר סמך


 

דוגמה:

נבחר מדגם מקרי של 121 אנשים. אחוז המצליחים שהתקבל במדגם הוא 55%. בנה רווח בר סמך לפרופורציית המצליחים באוכלוסייה ברמת ביטחון של 96%.

 

הנחות:

  1. דגימה מקרית של אנשים.
  2. מכיוון שp הוא נעלם שאנחנו צריכים לגלות- נשתמש ב בכדי להניח הנחה לגבי התפלגות נורמלית:

    n≥10

    n≥10

     

    121*0.55>10

    121*0.45>10

     

    לכן התפלגות הדגימה של הפרופורציות שואפת להתפלגות נורמלית.

     


0.457≤p≤0.643

 

מסקנה:

מתוך אינסוף דגימות חוזרות של מדגמי אנשים בגודל 121, הפרופורציה באוכלוסייה\תוחלת הפרופורציות תימצא ברווח המקרי שנע בין 0.457 ל0.643 ברמת ביטחון של 96%.

 

כאשר אנחנו נשאלים לגבי גודל המדגם שייצור לנו סטייה ספציפית שקבענו:

הסטייה=

 

הבעייתיות היא שאין לנו את מכיוון שעוד לא עשינו את המדגם, לכן נחשב:

 


כאשר 0.5*0.5 זוהי המכפלה הכי גדולה שיכולה לצאת במונה, כלומר הn יהווה את המדגם המקסימלי האפשרי. הn שאחשב יהיה מדגם אולי יותר גדול ממה שנצטרך, אך הוא בוודאות יספיק לי לכל פרופורציה אחרת גם היא לא 0.5.

 

מבחינה סטטית אין בעיה, אך בכל זאת מתקיימת בעיה פרקטית. מה שקורה הוא שלפעמים ניקח מדגם הרבה יותר גדול ממה שנצטרך, וכן גודל המדגם יעלה לנו בכספים וזמן. לכן נבדוק מה נוכל לעשות ברמה הפרקטית כדי שלא ניקח מדגם יותר גדול ממה שיש בו צורך.

 

מה שנעשה ברמה הפרקטית הוא שנעריך את הפרופורציה וכך נקבל גודל מדגם קטן יותר.

 

לכן שנשאל על גודל מדגם:

  1. אם אין כל אינפורמציה לגבי האוכלוסייה- נשתמש ב0.5*0.5.
  2. אם יש נתוני הערכה, נשתמש בהם (נעריך מה הp).

 

דוגמה:

  1. מהו גודל המדגם הדרוש כדי לקבל רמת ביטחון של 95% בתנאי שאורך הרווח לא יעלה על 0.06? (אורך הרווח= פעמיים הסטייה).

 


N=1067.11~1068

 

קיבלנו את גודל המדגם המקסימלי עבור תנאי רמת ביטחון ואורך הרווח הספציפיים.

 

  1. קיימת הערכה שהסיכוי לקבל הצלחה הוא 1 מתוך 20.

 

כלומר נשתמש באותה רמת ביטחון וסטייה רק שעכשיו יש לנו הערכה שנשתמש בה.

1:20=0.05

19:20=0.95

 


N=203

 

בדיקת השערות

 

דו כיוונית

H0: p=p0

H1: p≠p0

 

חד כיוונית חיובית

H0: p≤p0

H1: p>p0

 

חד כיוונית שלילית

H0: p≥p0

H1: p<p0

 

סטטיסטי:


דוגמה: במרכז לגמילה נבחר מדגם מקרי של 125 אנשים. אחוז ההצלחה שהתקבל הוא 55%, כאשר ידוע שהסטנדרט הרגיל להצלחה הוא 60%. האם ניתן להסיק שההצלחה במרכז שנבחר פחותה מהסטנדרט הרגיל? בדוק ברמת מובהקות α=0.02.

 

הנחות:

  1. דגימה מקרית של נגמלים
  2. np≥10

    nq≥10

     

    125*0.6>10

    125*0.4>10

     

    התפלגות הדגימה של הפרופורציות שואפת להתפלגות נורמלית.

 

השערות:

H0: p≥0.6

H1: p<0.6

 

נתונים:

= 0.55

=0.45

N= 125

α=0.02

 

 

תיאור התפלגות הדגימה:


 

תיאור התפלגות הדגימה תחת נכונות H0:


 

אזור דחייה וקבלה:

אזור דחייה:

Z<-2.055

אזור קבלה:

z≥-2.055

 

חישוב סטטיסטי:


 

מסקנה: -1.14>-2.055 ולכן אין סיבה מספקת לדחות את h0 ברמת מובהקות α=0.02, כלומר לא ניתן לומר שההצלחה במרכז שנבחר פחותה מהסטנדרט.

 

דוגמה: מורה העביר לתלמידים מבחן עם 64 שאלות סגורות ולכל שאלה שתי תשובות אפשריות- כן ולא. כמו כן יש לסמן אחת מהן. תלמיד מסוים ענה נכון על 37 מתוך 64 השאלות. האם הישג זה מתיישב עם ההשערה שהתלמיד ניחש את כל התשובות או שהיה לו ידע באופן מובהק מעל ניחוש מקרי? בדוק ברמת מובהקות α=0.05

 

בניסוח של השאלה יש את שני ההשערות- גם h0 וגם h1. כאשר לתלמיד אין ידע מובהק הסיכוי שלו להצלחה הוא 50%. לכן אם יש לו ידע מובהק השערת הh1 צריכה להיות גדולה מ50%. לכן:

H0: p≤0.5

H1: p>0.5

 

חישוב סטטיסטי:

 


 

אזור דחייה: z>1.695

אזור קבלה: z<1.645

 

כלומר לא דוחים את h0, לכן התלמיד ניחש את תוצאות המבחן.

 

הסתברות

דוגמה: ידוע שאחוז התומכים במפלגה מסוימת הוא 40%, מה ההסתברות שבקבוצה מקרית של 50 אנשים נמצא שמספר התומכים גדול מ25?

 

P=0.4

=0.5

 

הנחות:

50*0.4>10

50*0.6>10

 


 

P(≥0.5)=p(z≥1.43)=0.0764

 

בשאלות הסתברות ישאלו- מה ההסתברות ש…? לא יהיו השערות- רק הנחות! בשאלות של בדיקת השערות ייכתב- בדוק ברמת מובהקות…

 

  • במקום יהיה c.
  • יש לחשב טעויות מסוג ראשון ושני גם עבור פרופורציות באותו אופן שבו חישבנו בz.
  • בפרופורציות לא ניתן להסיק מרווח בר סמך על בדיקת השערות מכיוון שהנתונים לא אותו דבר. ברווח בר סמך נשתמש ב כאשר בבדיקת השערות נשתמש בp.

    רווח בר סמך:

    בדיקת השערות:

לצילום השיעור



2 + שמונה =

תואר ראשון
תואר שני
מרצים