שם הכותב: תאריך: 27 נובמבר 2014

שיעור 5

        מבוא לדגימה סטטיסטית

בשיעור זה נלמד, בין היתר, לענות על השאלות הבאות:

  1. מהן שלושת שיטות הדגימה שנלמד ומה מאפיין כל אחת מהשיטות?
  2. מה ההבדל בין אמידה שמבוססת על דגימה מקרית פשוטה ללא החזרה, לבין דגימה מקרית פשוטה עם החזרה?
  3. כיצד מחשבים אומד חסר הטיה לתוחלת, שמבוסס על דגימה מקרית פשוטה ללא החזרה?
  4. כיצד מחשבים את רמת הדיוק של האומד?
  5. מהו גודל המדגם המינימלי שיש לדגום, על מנת להשיג אומד עם רמת דיוק נתונה?

מבוא

דגימה סטטיסטית היא אמידת הפרמטרים באוכלוסיה באמצעות נתונים מהמדגם. מטרתנו היא להסיק מקבוצה זו על האוכלוסייה.

קיימים 3 שיטות דגימה:

  1. דגימה מקרית ללא החזרה מאוכלוסיה סופית– כלומר לכל פרט באוכלוסיה יש סיכויי להדגם.
  2. דגימת שכבות– נחלק את כל האוכלוסייה לשכבות. כאשר לכל שכבה יש מאפיינים דומים אך בין השכבות יהיו מאפיינים שונים.
  3. אומדן רגרסיה-הסתמכות על מדגמים קודמים שנעשו ומהם נסיק לגבי המדגם החדש.

     

דוגמא 1

נניח אוכלוסיה בגודל 6, המתארת סכומים של חשבוניות באלפי ₪.

להלן החשבוניות עם הסכומים השונים:

F

E

D

C

B

A

12

10

10

8

6

2

 

  1. חשב את התוחלת של האוכלוסיה
  2. חשב את שונות האוכלוסיה
  3. הוחלט לדגום, מדגם מקרי פשוט ללא החזרה מאוכלוסיה סופית, בגודל 2 , במטרה לאמוד את תוחלת האוכלוסייה באמצעות ממוצע המדגם. כמה מדגמים בגודל 2 ניתן לדגום מאוכלוסיה בגודל 6 ?
  4. בנה את התפלגות הדגימה של הממוצע וחשב את התוחלת, השונות וסטיית התקן של התפלגות זו (יש לערוך רשימה של כל המדגמים האפשריים).

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

מספר מדגם

 E

 

F

 D

 

F

 D

 

E

C

 

F

 C

 

E

 C

 

D

 B

 

F

 B

 

E

 B

 

D

B

 

C

 A

 

F

 A

 

E

 A

 

D

 A

 

C

 A

 

B

מדגם

10 

 

11

10

 

11

10

 

12


 

12


 

10

8

 

10

6

 

12

6

 

10

6

 

10

6

 

8


 

12


 

10


 

10


 

8


 

6

תצפיות

11 

 11

 11

 10

 10

 9

 9

 9

 8

 8

 7

 7

 6

5

 4

ממוצע

שונות

    

  1. כיצד מחשבים אומד חסר הטיה לתוחלת, שמבוסס על דגימה מקרית פשוטה ללא החזרה מאוכלוסיה סופית?
  2. כיצד מחשבים את רמת הדיוק של האומד?

 

פיתרון -דוגמא 1

  1. נגדיר: N- גודל האוכלוסיה

    µ- תוחלת באוכלוסיה.


 

8=


  1. 10.666=

 

  1. נחשב זאת על פי הנוסחה –המקדם הבינומי:

     


  1. בטבלה.

 

חישוב התוחלת של כל הממוצעים:


 

חישוב השונות של התפלגות הדגימה של הממוצע:

 


 

הבעיה בנוסחה זו היא: מכוון שבפועל נדגום מדגם אחד בלבד ולא את כלל האוכלוסייה לא נוכל לחשב את השונות באוכלוסיה. ולכן נחליף את השונות באוכלוסיה באומדן.

 

האומדן של שונות האוכלוסייה הוא:

  1. נחשב אומדן חסר הטיה לתוחלת באמצעות ממוצע המדגם.


  1. רמת הדיוק של האומדן=טעות התקן. נחשבה באמצעות הנוסחה הבאה:

     


 

 

דוגמא 2

רשת מסעדות גדולה, המפעילה מסעדות ברחבי הארץ, מעוניינת לאמוד את סך ההכנסות בחודשים יולי-אוגוסט 2102 (חודשי הקיץ) באוכלוסיית 30 המסעדות שברשותה. מתוך אוכלוסיה זו, נדגמו 10 מסעדות ונמצא כי ממוצע ההכנסות למסעדה הוא 55000 ₪ עם סטיית תקן 8000 ₪ .

א. חשב אומדן חסר הטיה, לשונות התפלגות דגימת ההכנסות של הרשת?

ב. עפ"י תוצאות המדגם, מהו אומדן חסר הטיה לשונות התפלגות הדגימה של ממוצעי המדגמים?

ג. בנה רווח סמך לתוחלת ההכנסות של 21 המסעדות, ביולי-אוגוסט 2102

ד. מהו גודל המדגם המקרי הפשוט המינימלי שיש לדגום, על מנת שהסטייה המקסימאלית מהתוחלת תהיה 3500 ₪, בהסתברות של 0.95.

פיתרון דוגמא 2

נתונים

 

N=30 , n=10, =8,000,

  1. א.ח.ה לשונות=


  2. אומדן חסר הטיה לשונות התפלגות הדגימה של ממוצעי המדגמים:

 

  1. בקורס תמיד נדבר על רמת סמך של 95%. ולכן הנוסחה לחישוב הרב"ס:



גבול תחתון- 50,868.818

גבול עליון- 59,131.182

  1. D- נוסחה הכוללת את הסטייה

B- הסטייה המקסימאלית



מכוון שגודל מדגם חייב להיות שלם נעגל תמיד כלפי מעלה. ולכן גודל המדגם הינו 13 מסעדות.



+ שלוש = 12

תואר ראשון
תואר שני
מרצים