שם הכותב: תאריך: 28 נובמבר 2013

בס"ד, יום חמישי י"ח בכסלו תשע"ד, 21.11.13

שיעור שישי

ברגע שיש לנו משתנה, שיש משמעות לסדר של הערכים שלו, נסדר אותו בסדר עולה. את השתנה השני, המושפע, לא נוכל לסדר בסדר עולה, ונהיה חייבים לסדר אותו בהתאם למשתנה המשפיע.

כאשר אנחנו מנסים לנבא משתנה, נקבל תשובה לא מדויקת: תהיה סטייה בין הניבוי לבין הערך בפועל. כדי לחשב את הסטייה נצטרך לקחת מקרה פרטי, שבו אנחנו יודעים מה התוצאה, ולבדוק כמה היא רחוקה מהניבוי.

בנוסחת הניבוי, חלים הכללים הבאים:
a יכול להיות מושפע מכל טרנספורמציה ליניארית.
b מושפע אך ורק מהכפלה וחילוק של X או Y.

טבלאות פלטים:

נתון פלט SPSS המתאר תוצאה של ניתוח הקשר הלינארי בין שני המשתנים הבאים:

X – ותק העובד אצל המעסיק הנוכחי

Y – חובות בכרטיסי אשראי (באלפי $)

א.     השלימו את הערכים החסרים בפלט (1M – 9M) על פי הערכים הנתונים.

ב.     מהו גובה החוב בכרטיסי אשראי הצפוי לעובד שהותק שלו אצל המעסיק הנוכחי הוא 10.5 שנים.

ג.     מה תהיה משוואת קו הניבויים ותוצאת סעיף ב' אם החובות ימדדו ב $ ולא באלפי $?

אנחנו יודעים ש-X זה הוותק, Y חוב בכרטיס אשראי (מכיוון ש-X משפיע על Y).

Descriptive Statistics

Mean

Std. Deviation

N

Years with current employer

8.57

M1

850

Credit card debt in thousands

M2

2.12584

850

 

 

Correlations

Years with current employer

Credit card debt in thousands

Years with current employer

Pearson Correlation

M5

M3

Sum of Squares and Cross-products

39002.811

4669.834

Covariance

45.940

5.500

N

850

850

Credit card debt in thousands

Pearson Correlation

M4

M6

Sum of Squares and Cross-products

M8

3836.797

Covariance

5.500

M7

N

850

850

 

Coefficients

Model

Unstandardized Coefficients

B

Beta

1

(Constant)

.551

Years with current employer

M9


קשר בין משתנים איכותיים:

ראשית, צריך להגדיר מהו המשתנה הבלתי תלוי ומהו המשתנה התלוי.

לאחר מכן יש לחשוב את השכיחות היחסית (אחוזים) של התפלגות המשתנה התלוי בכל קטגוריה של המשתנה הבלתי תלוי.

כאשר קיימים פערים משמעותיים בהתפלגות האחוזים של המשתנה התלוי בין הקטגוריות של המשתנה הבלתי תלוי נאמר שיש יש קשר בין המשתנים. כאשר אין הבדל בהתפלגות השכיחות היחסית של המשתנה התלוי בכל הקטגוריות של המשתנה הבלתי תלוי נאמר שאין קשר.

בדיקת הקשר באמצעות הגרף,

ככל שההבדלים בין 3 המקלות גדולים יותר, עצמת הקשר חזקה יותר. כאשר אין השפעה , בכל קטגוריה של המשתנה התלוי 3 המקלות, המייצגים את 3 הקטגוריות של המשתנה הבלתי תלוי שווים.

לדוג':

חברה מעוניינת לשווק חומר ניקוי חדש. כחלק ממחקר השוק אותו היא עורכת, אוספת החברה נתונים ביחס לחומר הניקוי המוביל כיום בשוק. המשתנים אותם חקרה החברה:

תדירות השימוש בחומר הניקוי: לעתים קרובות, מידי פעם, לעתים רחוקות.

מתן ציון לחומר הניקוי ע"י הלקוחות: סביר, טוב, מצוין.

ציון החומר ע"י הלקוחות

סביר

טוב

מצוין

לעתים

רחוקות

60

101

163

324

תדירות

השימוש

מידי

פעם

119

292

105

516

לעתים קרובות

131

41

253

425

310

434

521

1265

האם לתדירות השימוש בחומר יש השפעה על מתן הציון עבורו?

אנו רואים ש:

שהם 24.5% מדרגים את החומר כסביר.

שהם 34.3% מדרגים את החומר כטוב.

שהם 41.2% מדרגים את החומר כמצוין.

אם אין השפעה של תדירות השימוש על מתן הציון לחומר, היינו מצפים לדפוס דומה של ההתפלגות: בערך 25%, 34%, 41% בכל רמה של המשתנה הבלתי תלוי.

נראה מה קורה בפועל:

נבדוק את התפלגות המשתנה התלוי בכל קטגוריה של המשתנה הבלתי תלוי:

ציון החומר ע"י הלקוחות

סביר

טוב

מצוין

לעתים

רחוקות

18.5%

31.2%

50.3%

100%

תדירות

השימוש

מידי

פעם

23.1%

56.6%

20.3%

100%

לעתים קרובות

30.8%

9.6%

59.6%

100%

התפלגות

שולית

24.5%

34.3%

41.2%

100%

שלוש השורות מייצגות שלוש התפלגויות שונות (שונות ביניהן, ולכן, בהכרח שונות מההתפלגות השולית של המשתנה התלוי), דבר המעיד על השפעה של תדירות השימוש על אופן הערכת החומר.

תיאור מילולי

המשתמשים בתדירות של "לעתים רחוקות" נוטים לדרג את החומר כטוב או כמצוין (מחציתם כמצוין וכשליש מהם כטוב).

המשתמשים בתדירות של "מדי פעם" נוטים לדרג את החומר כטוב (57%) כאשר יתר 43% מתפלגים בצורה דומה בין דירוגו כסביר לדירוג מצוין. כלומר, הרוב מדרג אותו כטוב או כסביר

בקרב המשתמשים בתדירות של "לעתים קרובות בולטת הערכה של החומר כמצוין (60%) והערכה נמוכה כסביר (כ-31%). ברמת הערכה בינונית- טוב, 10% בלבד.

בהתפלגות זאת עיקר המסה בקצוות.

לצילום שיעור סמסטר א'

 

לצילום שיעור סמסטר ב'

 

 

 

 



+ אחד = 7

תואר ראשון
תואר שני
מרצים