שם הכותב: תאריך: 22 אוקטובר 2013

סטטיסטיקה 2

ד"ר גילה קינן

14.10.13

 

חזרה על סטטיסטיקה 1

סטטיסטי

פרמטר

מדד שחושב על מדגם מדד על האוכלוסייה כולה
משתנה מקרי- תוצאה שמשתנה עפ"י המדגם תוצאה קבועה- עד שחל שינוי באוכלוסייה כולה
נרשם באותיות לטיניות נרשם באותיות יווניות
(ממוצע)

(תוחלת)

(שונות)

(סטיית תקן)

 

סטיית תקן: הסטייה הממוצעת של כל תצפית מהממוצע.

שונות: מה מידת הפיזור שבין התצפיות?, עד כמה התצפיות שונות זו מזו?

 

ציוני תקן: מדד טהור למיקום יחסי. זהו מדד שאינו תלוי בסולם מדידה, ולכן ניתן להשוות בין פרמטרים שאינם ברי השוואה. (מלפפון ארוך או ירוק יותר?).

 


 

התוצאה האפשרית היא: חיובי\שלילי\אפס.

 

*טרנספורמציה לציוני תקן אינה משנה את צורת ההתפלגות.

* (Z~(0, התוחלת תמיד שווה 0 (ממוצע של האוכלוסייה) והשונות תמיד תהייה 1.

 

התפלגות נורמלית: התפלגות סימטרית שבה הממוצע, החציון והשכיח נופלים באותה הנקודה.

  • 100% מהמקרים נמצאים מתחת לעקומה.



ממוצע+חציון+שכיח

מכיוון שהטרנספורמציה לציוני תקן אינה משנה את צורת ההתפלגות, ביצעו טרנספורמציה לינארית להתפלגות הנורמלית כך שהתוחלת והשונות יהיו 0 ו-1 וצורת ההתפלגות תישאר בהינה.

כך התקבלה התפלגות קבועה שנקראת התפלגות נורמלית סטנדרטית. מכיוון שההתפלגות קבועה, ההסתברויות נשארות קבועות וניתן לחשב אותן.

דרגות חופש:
תמיד!

לכן החליטו לעלות את הנוסחה בריבוע. =>

בכדי לנטרל את גודל המדגם מחלקים בn-1.

לכאורה ניתן לחלק בn וזו לא טעות.

אבל כשמדברים על הסקה סטטיסטית צריך לחלק בn-1. הסיבה נובעת מתלות בין האינפורמציה לתצפיות. בכדי לבטל את התלות, אנחנו "נוותר על אינפורמציה" ע"י החסרה של 1 מ n , וכך התלות תתבטל.

הממוצע תלוי בתצפיות שממנו הוא חושב, כלומר כל תצפית הכרחית לחישוב הממוצע, ולכן אנחנו חייבים להשתמש בדרגות חופש בכדי שלא נעוות את תוצאות המדגם. דרגת החופש הראשונה היא n-1, הבאה n-2 וכן הלאה. נשתמש בהן לפי מידת התלות בין האינפורמציה לתצפיות.

= מסמל את העובדה שהחישוב חולק בדרגות חופש נכונות. "אומדן חסר הטיה"= א.ח.ה

התפלגות דגימה

ההתפלגות של הממוצעים.

תוחלת:



 

ממוצע הממוצעים: ממוצע האוכלוסייה ביחידים.

 

שונות: —– <ערכים

—– > ממוצעים

מכיוון שהשונות מחושבת על ידי גודל המדגם (n), ומדובר בהתפלגות של ממוצעים, שונות הערכים והממוצעים לא תהייה שווה.

 

סטיית תקן:
—-> ערכים

——> ממוצעים (טעות תקן (S.E

 

 

 

התפלגות : ——–> ערכים

 


———> ממוצעים

 

האם הממוצעים מתפלגים נורמלית בהכרח?

  1. כאשר קיימת אינפורמציה על התפלגות הערכים, כלומר ידוע שהמשקל לדוגמה מתפלג נורמלית, אז בהכרח גם הממוצעים מתפלגים נורמלית.
  2. אם אין אינפורמציה על הערכים- משפט הגבול המרכזי.

    אם מתוך אוכלוסייה בעלת פרמטרים: תוחלת (µ) ושונות() היינו מוציאים את כל המדגמים האפשריים באותו גודל (n), ובכל מדגם מחשבים את ממוצע המדגם, אז סדרת מוצעי כל המדגמים עבור n מספיק גדול שואפת להתפלגות נורמלית עם תוחלת (µ), שונות ) וסטיית תקן הנקראת: טעות תקן ().

     

    כלומר אם ניקח n מספיק גדול, התפלגות הממוצעים תשאף להתפלגות נורמלית. המשפט לא אומר מהו n מספיק גדול ולכן נניח שכאשר N≥30 , מדובר בn מספיק גדולה והממוצעים יתפלגו נורמלית.

     

  • אם ידוע כי הערכים אינם מתפלגים נורמלית, הn הגדול יגרום לכך שהממוצעים יתפלגו נורמלית. (ללא קשר לגדול המדגם של הערכים).

     

    לסיכום:

  1. אם ידוע שהערכים מתפלגים נורמלית, אזי התפלגות הממוצעים תהייה נורמלית (ללא קשר לגודל המדגם.
  2. אם לא ידוע איך הערכים מתפלגים או לחילופין ידוע שהערכים מתפלגים לא נורמלית, אם ניקח N≥30, הממוצעים יתפלגו נורמלית בהכרח.

     

——> ערכים

——> ממוצעים

 

כעת ניתן לחשב הסתברות לקבלת ערכים מעל\מתחת הממוצעים. ציר ההתפלגות כעת הוא ממוצעים ולא ערכים.

 

לצילום השיעור



× 8 = ארבעים שמונה

תואר ראשון
תואר שני
מרצים