שם הכותב: תאריך: 06 נובמבר 2014

סטטיסטיקה 1 – שיעור 1

 

 

חשיבות לימודי הסטטיסטיקה-

להבין כיצד לשפוט את התוצאות בצורה אחראית ולקבל כלים לניתוח הנתונים.

מדע הסטטיסטיקה עוסק בשיטות לאיסוף, לארגון, לתיאור ולהסקת מסקנות מתוך נתונים אמפיריים.

 

סטטיסטיקה תיאורית-

ענף שעוסק בדרכים לארגון, תיאור והצגת הנתונים שנאספו במחקר מהאוכלוסייה או ממדגם מסוים. זה נעשה ע'י טבלאות, ממדים (ממוצע, אך לא תמיד הוא יישקף את כלל הנתונים) והצגת גרפים של נתונים.

 

הסקה סטטיסטית-

ענף שעוסק בשיטות לקבלת המסקנות מממצאי המדגם (שנבחר מתוך כלל האוכלוסייה ושעליו בוצע המחקר). ההסקה הסטטיסטית מבוססת על תורת ההסתברות מכיוון שאת אותן המסקנות מכלילים על האוכלוסייה כולה וקיימת ההסתברות לכך שתהיה טעות.

לדוגמא: השפעה של תרופה מסוימת- לא ניתן לבדוק את השפעותיה של התרופה על כלל האוכלוסייה ולכן לוקחים למשל 100 איש ובודקים עליהם את ההשפעות.

* לעיתים אנשים יעדיפו מדד אחד על אחר מתוך אינטרסים.

 

שאלת המחקר-

שאלה כללית המתייחסת לאוכלוסייה מסוימת ולתכונותיה וכדי לבדוק אותה יש צורך במדגם.

 

אוכלוסייה-
אוסף של כל הפרטים אליהם מתייחס המחקר. יש להסביר מי זו האוכלוסייה אותה בודקים (לדוגמא: אם בודקים אנשים מבוגרים יש לציין את גילם או את טווח גילם).

 

מדגם-
אוסף הפרטים הלקוחים מהאוכלוסייה שהשתתפה במחקר. מדגם צריך להיות:

  • מייצג- יישקף בצורה ברורה יותר את השאלה הנבדקת.
  • מקרי- לכל תצפית (התשובה לשאלה שנשאלה) יש את אותה ההסתברות להיכלל במדגם, אם ניקח למשל אנשים שקרובים אלינו אז זה לא יהיה מקרי.
  • גדול- התפלגות האחוזים תהיה קרובה יותר לאחוזי כלל האוכלוסייה.

כל זאת נעשה במטרה שיהיה ניתן להסיק את מסקנות המדגם על כלל האוכלוסייה.

 

משתנה-

השאלה הנשאלת. כל מדגם מקבל משתנים שונים בהתאם לאוכלוסייה הנחקרת ובעזרתם ניתן לנתח את הנתונים. את המשתנה מסמנים ב X,Y,Z וכו'.

 

תצפית-
הערך של המשתנה (התשובה לשאלה שנשאלה).

 

שלבי החקירה הסטטיסטית-

 


 

 

 

 

סיווג משתנים-

 

סיווג המשתנים נעשה לפי אופן המדידה. בתהליך זה מייחסים ערכים מספריים לתופעות או לתכונות, כך שהיחסים בין המספרים משקפים את היחס בין התופעות.

חשוב לדעת מה סוג המשתנה מכיוון שהוא משפיע על אופן הניתוח והיכולת להסיק מסקנות (לדוגמא: שכר- אנשים יעדיפו לא לנקוב בשכר הספציפי שהם מקבלים). ישנם כמה סוגים של משתנים:

 

  1. משתנה איכותי-

    משתנה שערכיו מבוטאים במילים (זיהוי במספרים יהווה תחליף לשמות ולא יהיה בעל משמעות מספרית). לדוגמא: מגדר, דרגה בצבא, מס' אוטובוס וכו'. ישנם 2 סוגים של משתנה איכותי:

  • משתנה בסולם שמי (נומינלי)- סולם ששומר על הזהות ועונה על השאלה מי שונה ממני. על כן ערכיו שונים זה מזה, אין חשיבות לסדר ביניהם ולא ניתן לבצע פעולות חשבון על אותם הערכים. לדוגמא: עיר מגורים, ת"ז, מס' אוטובוס.

    * משתנה שמי דיכוטומי- משתנה בעל 2 ערכים בלבד (לדוגמא: מגזר- גברים ונשים).

  • משתנה בסולם סדר (אורדינאלי)- סולם ששומר על הזהות ועל הסדר ועונה על השאלה מי גדול ממי אך לא בכמה גדול (להפרש אין משמעות). על כן ערכיו שונים זה מזה גם מבחינה איכותית (זהות) וגם מבחינת הסדר ביניהם (ניתן לדרג את הערכים מנמוך לגבוה). לדוגמא: דרגות בצבא, שביעות רצון.

     

  1. משנה כמותי-

    משתנה שערכיו מבוטאים במספרים המייצגים את הכמויות. ישנם 2 סוגים של משתנה כמותי:

  • משתנה כמותי בדיד- משתנה שבין כל שני ערכים שלו יש מס' סופי של ערכים.

    לדוגמא: מס' עובדים בחברה.

  • משתנה כמותי רציף- משתנה שבין כל שני ערכים שלו יש אינסוף ערכים אפשריים. לדוגמא: משקל, גיל, זמן המתנה.

     

    * כשיש הרבה ערכים אפשריים למשתנה כמותי בדיד מתייחסים אליו לפעמים כמשתנה כמותי רציף (לדוגמא: במבחן עם 100 שאלות ישנן מס' אפשרויות לכמות התשובות הנכונות שניתן לקבל בסופו של דבר ולכן מתייחסים לזה כמשתנה כמותי רציף).

     

    ארגון והצגה של נתונים-

     

    ערך חסר (Missing/נֶפֶל)- מצב בו אין תצפית למשתנה. הערך החסר יכול להיות מקרי (מישהו דילג בטעות על השאלה/טעות הקלדה) או מכוון (לא לענות בכוונה. במצב כזה אפשר להגיד לנשאלים שהמחקר הינו אנונימי/חסוי).

    אם ישנו נפל עד 5% אז ניתן להתעלם מהתצפית מבלי לאבד מיכולת ההכללה.

    ככל שהנפל קטן יותר אז ההבדלים בשכיחויות היחסיות יהיה קטן.

     

    טבלת שכיחות- טבלה המקשרת בין כל ערך של המשתנה למס' הפעמים שהוא הופיע בנתונים.

  • השורות יתארו את המדגמים בעוד שהעמודות יתארו את המשתנים.
  • Frequency/שכיחות (f) – מספר הפעמים בו הופיע הערך.
  • שכיחות מצטברת (F)- כמות הנבדקים עד לערך מסוים (כולל הערך). הערך האחרון מהווה את סך גודל המדגם.
  • Percent/שכיחות יחסית (f%) מסך כל המקרים, כולל הנפל

    (חישוב האחוז: חילוק השכיחות בסך הכל כולל הנפל והכפלה ב100)

  • Valid Percent- שכיחות יחסית מסך המקרים התקפים, ללא הנפל.

    (חישוב האחוז: חילוק השכיחות בסך הכל ללא הנפל והכפלה ב100)

  • Cumulative Percent- שכיחות יחסית מצטברת (F%). זהו האחוז של כמות הנבדקים עד לערך מסוים (כולל הערך), כשהערך האחרון מהווה 100%. לא תהיה רלוונטית למשתנה בסולם שמי (כי הסדר לא חשוב).

    (חישוב: חיבור סה"כ של הערכים ואז חילוק בסך הכל ללא הנפל והכפלה ב100)

    דיאגרמת עוגה-

    גרף בו כל ערך של המשתנה מקבל פלח בהתאם לשכיחות היחסית שלו.

    (חישוב הזווית: 360 כפול אחוז השכיחות לחלק ל100)

    אם המשתנה נמדד על מספר רב של ערכים אז דיאגרמה זו תהיה יעילה יותר.

     

    דיאגרמת מקלות-

    גרף בו ערכי המשתנה נמצאים על ציר הX ומעל לכל ערך יש עמודה (מקל) בגובה השכיחות או השכיחות היחסית (עדיף לרשום את השכיחות היחסית). הרוחב של העמודות צריך להיות שווה ובין כל עמודה לעמודה צריך להיות רווח. ניתן לחבר את קצוות ההתפלגות בקו מקווקו כדי לקבל התרשמות מהתפתחותו של המשתנה.

    * במשתנה בסולם סדר עדיף להשתמש בסוג זה של דיאגרמה משום שכך ניתן לראות בצורה טובה יותר את התפתחותו של המשתנה (צורת התפלגותו).

    * לא ניתן להשוות שכיחות אלא רק שכיחות יחסית.



שש − = 1

תואר ראשון
תואר שני
מרצים