סטטיסטיקה 2
מושגים בסיסיים מסטטיסטיקה 1-
-
ממוצע- מדד למיקום מרכזי.
-
תוחלת- הערך שנצפה לקבל בממוצע (E) מתוך אינסוף דגימות של המשתנה המקרי.
-
שונות- מדד לפיזור הערכים סביב הממוצע (ממוצע ריבועי הסטיות מהממוצע).
* שונות גדולה = פיזור גדול = מדגם הטרוגני, שונות קטנה = פיזור קטן = מדגם הומוגני.
-
סטיית תקן- שורש חיובי של השונות הנותן את הסטייה הממוצעת של כל התצפיות מהממוצע.
-
ציון תקן (Z)- מדד למיקום משתנה כמותי ביחס לממוצע (בכמה סטיות תקן מרוחק ממנו). ציון התקן משמש מדד להשוואה בין התפלגויות שונות כיוון שלא תלוי בסולם מדידה ובנתונים.
* Z>0 = ערך התצפית גדול מהממוצע, Z<0 = ערך התצפית קטן מהממוצע.
* טרנספורמציה ליניארית לציון תקן לא משנה את צורת ההתפלגות.
-
התפלגות נורמלית- התפלגות סימטרית ופעמונית (שכיח = חציון = ממוצע)
* התפלגות נורמלית סטנדרטית- Z N(0,1)
התפלגות דגימה של ממוצע-
התפלגות ממוצעי כל המדגמים המקריים האפשריים בגודל n מתוך האוכלוסייה.
* משפט הגבול המרכזי- אם דוגמים באופן מקרי מאוכלוסייה את כל המדגמים האפשריים במדגם בגודל n ומחשבים לכל מדגם את הממוצע () => תשאף להתפלגות נורמלית:
* במדגמים מגודל 30 ומעלה, התפלגות הדגימה של ממוצע תהיה נורמלית (בקירוב) גם אם התפלגות הערכים אינה נורמלית.
* במדגמים עד גודל 30, התפלגות הדגימה של ממוצע תהיה נורמלית רק אם התפלגות הערכים תהיה נורמלית. ההנחה היא שמדובר בהתפלגות ערכים נורמלית.
*השאלה הנשאלת בהתפלגות ערכים-
מה ההסתברות לקבל ערך של תצפית מעל/מתחת/בין שני ערכים שונים.
* השאלה הנשאלת בהתפלגות דגימה של ממוצע-
מה ההסתברות לקבל ממוצע מעל/מתחת/בין שני ממוצעים שונים.