בס"ד, יום חמישי י"ח בכסלו תשע"ד, 21.11.13
שיעור שישי
ברגע שיש לנו משתנה, שיש משמעות לסדר של הערכים שלו, נסדר אותו בסדר עולה. את השתנה השני, המושפע, לא נוכל לסדר בסדר עולה, ונהיה חייבים לסדר אותו בהתאם למשתנה המשפיע.
כאשר אנחנו מנסים לנבא משתנה, נקבל תשובה לא מדויקת: תהיה סטייה בין הניבוי לבין הערך בפועל. כדי לחשב את הסטייה נצטרך לקחת מקרה פרטי, שבו אנחנו יודעים מה התוצאה, ולבדוק כמה היא רחוקה מהניבוי.
בנוסחת הניבוי, חלים הכללים הבאים:
a יכול להיות מושפע מכל טרנספורמציה ליניארית.
b מושפע אך ורק מהכפלה וחילוק של X או Y.
טבלאות פלטים:
נתון פלט SPSS המתאר תוצאה של ניתוח הקשר הלינארי בין שני המשתנים הבאים:
X – ותק העובד אצל המעסיק הנוכחי
Y – חובות בכרטיסי אשראי (באלפי $)
א. השלימו את הערכים החסרים בפלט (1M – 9M) על פי הערכים הנתונים.
ב. מהו גובה החוב בכרטיסי אשראי הצפוי לעובד שהותק שלו אצל המעסיק הנוכחי הוא 10.5 שנים.
ג. מה תהיה משוואת קו הניבויים ותוצאת סעיף ב' אם החובות ימדדו ב $ ולא באלפי $?
אנחנו יודעים ש-X זה הוותק, Y חוב בכרטיס אשראי (מכיוון ש-X משפיע על Y).
Descriptive Statistics |
|||
Mean |
Std. Deviation |
N |
|
Years with current employer |
8.57 |
M1 |
850 |
Credit card debt in thousands |
M2 |
2.12584 |
850 |
Correlations | ||||||||
Years with current employer |
Credit card debt in thousands |
|||||||
Years with current employer |
Pearson Correlation |
M5 |
M3 |
|||||
Sum of Squares and Cross-products |
39002.811 |
4669.834 |
||||||
Covariance |
45.940 |
5.500 |
||||||
N |
850 |
850 |
||||||
Credit card debt in thousands |
Pearson Correlation |
M4 |
M6 |
|||||
Sum of Squares and Cross-products |
M8 |
3836.797 |
||||||
Covariance |
5.500 |
M7 |
||||||
N |
850 |
850 |
||||||
Coefficients |
||||||||
Model |
Unstandardized Coefficients |
|||||||
B |
Beta |
|||||||
1 |
(Constant) |
.551 |
||||||
Years with current employer |
M9 |
קשר בין משתנים איכותיים:
ראשית, צריך להגדיר מהו המשתנה הבלתי תלוי ומהו המשתנה התלוי.
לאחר מכן יש לחשוב את השכיחות היחסית (אחוזים) של התפלגות המשתנה התלוי בכל קטגוריה של המשתנה הבלתי תלוי.
כאשר קיימים פערים משמעותיים בהתפלגות האחוזים של המשתנה התלוי בין הקטגוריות של המשתנה הבלתי תלוי נאמר שיש יש קשר בין המשתנים. כאשר אין הבדל בהתפלגות השכיחות היחסית של המשתנה התלוי בכל הקטגוריות של המשתנה הבלתי תלוי נאמר שאין קשר.
בדיקת הקשר באמצעות הגרף,
ככל שההבדלים בין 3 המקלות גדולים יותר, עצמת הקשר חזקה יותר. כאשר אין השפעה , בכל קטגוריה של המשתנה התלוי 3 המקלות, המייצגים את 3 הקטגוריות של המשתנה הבלתי תלוי שווים.
לדוג':
חברה מעוניינת לשווק חומר ניקוי חדש. כחלק ממחקר השוק אותו היא עורכת, אוספת החברה נתונים ביחס לחומר הניקוי המוביל כיום בשוק. המשתנים אותם חקרה החברה:
תדירות השימוש בחומר הניקוי: לעתים קרובות, מידי פעם, לעתים רחוקות.
מתן ציון לחומר הניקוי ע"י הלקוחות: סביר, טוב, מצוין.
ציון החומר ע"י הלקוחות
סביר |
טוב |
מצוין |
|||
לעתים רחוקות |
60 |
101 |
163 |
324 |
|
תדירות השימוש |
מידי פעם |
119 |
292 |
105 |
516 |
לעתים קרובות |
131 |
41 |
253 |
425 |
|
310 |
434 |
521 |
1265 |
האם לתדירות השימוש בחומר יש השפעה על מתן הציון עבורו?
אנו רואים ש:
שהם 24.5% מדרגים את החומר כסביר.
שהם 34.3% מדרגים את החומר כטוב.
שהם 41.2% מדרגים את החומר כמצוין.
אם אין השפעה של תדירות השימוש על מתן הציון לחומר, היינו מצפים לדפוס דומה של ההתפלגות: בערך 25%, 34%, 41% בכל רמה של המשתנה הבלתי תלוי.
נראה מה קורה בפועל:
נבדוק את התפלגות המשתנה התלוי בכל קטגוריה של המשתנה הבלתי תלוי:
ציון החומר ע"י הלקוחות
סביר |
טוב |
מצוין |
|||
לעתים רחוקות |
18.5% |
31.2% |
50.3% |
100% |
|
תדירות השימוש |
מידי פעם |
23.1% |
56.6% |
20.3% |
100% |
לעתים קרובות |
30.8% |
9.6% |
59.6% |
100% |
|
התפלגות שולית |
24.5% |
34.3% |
41.2% |
100% |
שלוש השורות מייצגות שלוש התפלגויות שונות (שונות ביניהן, ולכן, בהכרח שונות מההתפלגות השולית של המשתנה התלוי), דבר המעיד על השפעה של תדירות השימוש על אופן הערכת החומר.
תיאור מילולי
המשתמשים בתדירות של "לעתים רחוקות" נוטים לדרג את החומר כטוב או כמצוין (מחציתם כמצוין וכשליש מהם כטוב).
המשתמשים בתדירות של "מדי פעם" נוטים לדרג את החומר כטוב (57%) כאשר יתר 43% מתפלגים בצורה דומה בין דירוגו כסביר לדירוג מצוין. כלומר, הרוב מדרג אותו כטוב או כסביר
בקרב המשתמשים בתדירות של "לעתים קרובות בולטת הערכה של החומר כמצוין (60%) והערכה נמוכה כסביר (כ-31%). ברמת הערכה בינונית- טוב, 10% בלבד.
בהתפלגות זאת עיקר המסה בקצוות.
לצילום שיעור סמסטר א'
לצילום שיעור סמסטר ב'