שם הכותב: תאריך: 27 אוקטובר 2013

 

בס"ד, יום חמישי כ' בחשוון תשע"ד, 24.10.13.

שיעור שני:

עד היום למדנו להשתמש בטבלת שכיחויות, היום נלמד גם שיטות נוספות: גרפים, עוגות וכו'.

ארגון והצגה של נתונים:

בצד שמאל של הטבלה, אנחנו כותבים Xi, שזהו מושא המחקר (ארץ מוצא, דת וכו').
כדי לחדש באחוזים את השכיחות של ממצא מסוים: F(xi)/n (כאשר n מספר הנתונים במאגר). כאשר המשתנה הוא שמי, אין משמעות לסדר, ולכן אין משמעות לעמודה "שכיחות מצטברת" (אי אפשר להגיד "כמה אנשים עונים לשם יגאל ומטה").

 

גרף:

גרף נותן לנו הצגה חזותית של הנתונים. כאשר המשתנה שמי, יש לנו שתי אפשרויות של גרפים:

עוגה: מתייחסים לעוגה כ-100%, ומחלקים אותה לפי הגדלים של הקטגוריות. אולם שיטה זו לא טובה כאשר יש משתנים רבים.
דיאגרמת מקלות / עמודות: מבטא תמיד שכיחות יחסית, ככל שהעמודה גבוהה יותר – כך השכיחות שלה במדגם גדולה יותר. היתרון הוא שקל להבחין בהבדלים קטנים בין עמודות. אפשר לעשות שציר ה-y ייצג את השכיחות, את השכיחות היחסית, או את השכיחות היחסית המצטברת.

משתנה סדר: כאשר יש משמעות למיקומם של הערכים (מהנמוך לגבוה, לדוג')

 


בשכיחות יחסית מצטברת אנחנו מוסיפים לכל קטגוריה את השכיחויות של הקטגוריות הקודמות.

 

במקרה הזה, נוכל לעשות דיאגרמת עוגה ולצבוע כל קטגוריה בצבע שונה.

 

 

 

 

 

 

דוגמה: מס' ילדים במשפחת המוצא

טבלת שכיחות

מס' ילדים במשפחת המוצא

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

1

6

5.8

5.8

5.8

2

38

36.5

36.9

42.7

3

37

35.6

35.9

78.6

4

16

15.4

15.5

94.2

5

4

3.8

3.9

98.1

6

2

1.9

1.9

100.0

Total

103

99.0

100.0

Missing

System

1

1.0

Total

104

100.0

 

 

 

 

 

 

 

 

 

 

 

 

 

במקרה הזה, לא נוכל להשתמש בדיאגרמת עוגה. יש משמעות לצורת ההתפלגות של המשתנה: הרוב נמצאים באמצע, עם 2-3 ילדים, ובעוגה לא נוכל לראות את זה. במשתנים כמותיים בדידים צריך להשתמש בדיאגרמת מקלות.


בדוגמה שלנו יש לנו התפלגות אסימטרית שמזדנבת ימינה, חיובית (הקו הכחול). כלומר: בדיאגרמה, ציר ה-X "נופל" אחרי 3 ילדים, ומגיע לערכים נמוכים מאוד בכיוון החיובי של הציר (יש מעט משפחות עם 4 ילדים ויותר).

עכשיו נעבור לדבר על משתנה כמותי רציף:

כאשר יש לנו משתנה עם יותר מדי נתונים (לדוג': יש 600 ציוני פסיכומטרי שונים), ניתן לקבץ מספר קטגוריות ביחד: כמה אנשים קיבלו בטווח של 200-300. לפעמים החוקר מחליט לנו מה יהיה הטווח של כל קטגוריה, ולפעמים נוכל לחלק אותן בצורה שווה. עכשיו נלמד איך לקבץ ערכים לקטגוריות שוות ברוחבן:

אם במחקר אני בודק כמה אנשים קיבלו 542-710 בפסיכומטרי, דהיינו יש לי 168 קטגוריות שונות. כאשר אנחנו בונים מחלקות (קטגוריות) חדשות, עלינו להחליט מה יהיו הגבולות של כל קטגוריה, ולדאוג לכך שלא תהיה קטגוריה שתיפול על שתי קטגוריות או שלא תהיה באף קטגוריה.

לדוג':

540 עד 560 לא כולל, 560 עד 580 לא כולל וכו'.

אם נרצה לבדוק כמה יש בנקודה 550 – נעשה אומדן, לפי כל השכיחויות של 540-560. אמנם ככה אני מאבדים נתונים, אבל זוכים בתמורה לבהירות. "כובע" שמופיע מעל אות בסטטיסטיקה מסמל האומדן.

היסטוגרמה: דיאגראמה להצגת משתנה כמותי רציף. זו דיאגראמה בה על ציר ה- X מצויים ערכי המשתנה ומעל לכל מחלקה משורטט מלבן ששטחו מייצג את השכיחות של המחלקה (ולא רק הגובה קובע). במידה והקטגוריות שוות ברוחבן, אזי גם שטח המלבנים וגם הגובה שלהם ייצגו שכיחות או שכיחות יחסית.

פוליגון: מצולע שכיחויות, קו שעובר בין האמצעים של רום המלבנים.


700-720 680-700 660-680 640-660 620-640 600-620 580-600 560-580 540-560

 

צפיפות: d=f/l היחס שבין שכיחות המחלקה לטווח שלה. מתקבל ערך שמייצג את מס' הפרטים/נבדקים עבור יחידת משתנה באותה מחלקה.

כאשר מחלקות אינן שוות רוחב: כדי לבנות את ההיסטוגרמה צריך לחשב את ערך הצפיפות לכל מחלקה, וזה ציר ה-y. לכל מחלקה יש לשרטט מלבן שגובהו כגובה הצפיפות. במצב בו המחלקות אינן שוות ברוחבן, הגובה של המלבן ייצג את הצפיפות של כל מחלקה ואילו שטח המלבן ייצג את שכיחות המחלקה או את שכיחותה היחסית.

במצב זה, כאשר הקטגוריה תהיה רחבה יותר, הצפיפות תהיה קטנה יותר – ולכן המלבן יהיה נמוך יותר.

 

סימטרית חד שיאית:
התפלגות סימטרית עם שיא בודד באמצע (כמו טווח הגילאים במכללה: הרוב המוחלט בגילאי 21-30, ובכל קטגוריה אחרת תהיה שכיחות נמוכה.
אחידה:
התפלגות אחידה, הערכים דומים זה לזה.
דו שיאית:
ישנם שני שיאים – בשני הקצוות. המרכז נשאר נמוך.

 

כללי סכימה:

a

X

i

10

6

1

10

7

2

10

9

3

10

4

4


סימן המייצג פעולת סכימה- חיבור/סיכום


כללים:


לצילום שיעור סמסטר א'

 

לצילום סמסטר ב'

 

 



8 − אחד =

תואר ראשון
תואר שני
מרצים