שם הכותב: תאריך: 31 אוקטובר 2013

בס"ד, יום חמישי כ"ז בחשוון תשע"ד, 31.10.13

שיעור שלישי

מדד מסכם הוא ערך (לרוב מספרי) שמסכם את הנתונים, נותן לנו תחושה שאנחנו יודעים מה מתרחש שם.

ישנם שני סוגים: מדדי מרכז ומדדי פיזור. היום אנחנו נדבר על שלושה סוגים של מדדי מרכז.

  1. שכיח Mode – קל לאיתור. לא צריך לחשב כלום, רק להסתכל. בסולם שמי, זהו המדד היחיד שאפשר להשתמש בו. אם יש ערך אחד מתוך מאה לדוג', והוא חוזר על עצמו 50 פעמים, אז קל לראות שהוא שכיח. כאשר יש טבלה, והקטגוריות אינן שוות רוחב, המחלקה הצפופה ביותר היא המחלקה השכיחה ביותר.
  2. חציון Mediam – חציון הוא הערך של המשתנה אשר מחצית מן התצפיות שוות לו או קטנות ממנו ומחצית מן התצפיות שוות לו או גדולות ממנו. ניתן להשתמש בחציון רק בסולם סודר ומשתנים כמותיים. כדי למצוא את החציון: גודל המדגם+אחת / 2 = מיקום החציון. התצפית השלישית היא החציון (כמובן שצריך לסדר את התצפיות בסדר עולה). כאשר גודל המדגם זוגי, התוצאה תהיה אי זוגית: במקרה זה יש לקחת את שתי התצפיות משני צידי החציון, ולעשות ממוצע ביניהן. כלומר: החציון לא חייב להיות ערך שקיים בנתונים. בטבלת שכיחויות זה מאוד פשוט: מסתכלים על השכיחות המצטברת באחוזים, ובודקים מהו הערך הראשון שבו התוצאה עולה על 50%. כלומר 50% נמצאים מתחת לערך זה, ו-50% מעל לערך זה – וזהו המשתנה שמייצג את החציון. בד"כ החציון לא מייצג, בגלל שהוא לא מושפע מערכים קיצוניים למטה ולמעלה.
  3. ממוצע – סופרים את סכום כל הערכים, ומחלקים בגודל המדגם. צריך לקחת כל ערך ולהכפיל במספר המופעים שלו, ואז לחלק בגודל המדגם. כאשר יש לנו טבלה שמקבצת ערכים, אנחנו צריכים למצוא את נקודת האמצע של כל מקבץ ערכים (אם, נניח, אנחנו שואלים כמה אנשים שוקלים בין 60-80 ק"ג, נקודת האמצע היא 70). את נקודת האמצע נכפיל במספר המופעים של אותו ערך, ונסכום את נקודות האמצע של כל המופעים. את התשובה, כמובן, נחלק ב-n. ניתן לחשב ממוצע במשתנים כמותיים בלבד. לעיתים, איננו מהווה ערך הגיוני בנתונים (אין במשפחה 2.5 ילדים). מושפע מערכים קיצוניים. זהו ערך שסכום הסטיות ממנו שווה ל-0.

צורת התפלגות בכל אחד מהמדדים:

  1. בהתפלגות חד שיאית סימטרית, השכיח, הממוצע והחציון שווים.
  2. בהתפלגות אסימטרית ימנית, הממוצע גדול מהחציון שגדול מהשכיח.
  3. בהתפלגות אסימטרית שמאלית, הממוצע קטן מהחציון שקטן מהשכיח.
  4. בהתפלגות אחידה, אין שכיח. הממוצע והחציון שווים.
  5. בהתפלגות סימטרית דו שיאית, הממוצע שווה לחציון וישנם שני שכיחים.

ממוצע של ממוצעים:

כאשר הנתונים שמופיעים בפנינו הם כבר ממוצעים, ישנה דרך מיוחדת לחשב את ממוצע הממוצעים.

נתקבלו הממוצעים הבאים, מתוך n תלמידים בכל כיתה:

כיתה

ציונים

א'

ב'

ג'

= ממוצע

n

= מספר תלמידים

100

200

150

מהו ממוצע הציונים של 3 הכיתות?

צריך לכפול כל ממוצע במספר המשתנים, לסכום את התוצאות, ולחלק במספר המשתנים הכולל.


מדדי פיזור:

מדדים שמאפיינים את מידת ההטרוגניות של קבוצת נתונים (עד כמה הנתונים שונים/רחוקים מהמדד המרכזי בו בחרנו לתאר את הקבוצה). ככל שערך המדד גדול יותר הקבוצה הטרוגנית יותר (פיזור גדול) ככל שערך המדד נמוך יותר הקבוצה הומוגנית יותר (פיזור קטן).

תכונות המשותפות לכל מדדי הפיזור:

1.     מקבלים ערכים חיוביים (כולל 0) בלבד (בוחנים מרחק/סטייה/פיזור).

2.     כאשר כל התצפיות שוות, מדדי הפיזור מקבלים את הערך 0 .

3.     בכל התפלגות נהוג להציג מדד מרכז יחד עם מדד פיזור על מנת לקבל תמונה טובה יותר על צורת התפלגות הכוללת גם התייחסות אל הקצוות/פיזורה של ההתפלגות.

סוגים של מדדי פיזור:

  1. תחום: ההפרש בין הערך המקסימאלי בנתונים לערך המינימאלי.
    לדוג': תחום הציונים בקורס הוא 20. כלומר התלמיד הכי טוב קיבל 20 נק' יותר מהתלמיד הגרוע. התחום נותן מעט מידע, ולכן בצמוד לתחום קבעו מדד נוסף:
  2. תחום בין רבעוני:
    על מנת לחשב את התחום הבין רבעוני יש לחשב את הרבעונים של ההתפלגות:

    – הרביע (הרבעון) הראשון (Q3): הערך שעד אליו 25% ומעליו 75% מהתצפיות בהתפלגות
    – הרביע (הרבעון) השלישי
    (Q3): הערך שעד אליו 75% ומעליו 25% מהתצפיות בהתפלגות
    התחום הבין רבעוני הוא ההפרש בערך מוחלט בין הרביע (הרבעון) השלישי לראשון:

    IQR=Q3-Q1

ש.ב.

תרגיל 3, תרגיל 4 שאלות 1, 3,5.

לצילום שיעור סמסטר א'

 

לצילום שיעור סמסטר ב'

 



7 + = ארבע עשרה

תואר ראשון
תואר שני
מרצים