ההסבר מתייחס לדוגמא של הדגים בים. 

אילו החוקר היה יכול לדגום במחקר שלו את כל אוכלוסיית הדגים בים, התוצאה היתה נותנת תמונת מצב מדוייקת לגבי הקשר הקיים בין אורך ומשקל באוכלוסיית הדגים.

אילו היינו מחשבים קו על בסיס נתוני כלל אוכלוסיית הדגים היינו יכולים לקרוא לו הקו האמיתי, ולסמלו: `Y =alpha+betaX`  , אך החוקר מתבסס במחקר שלו רק על מדגם של 100 דגים, ולפיכך הקו שקיבל הוא קו רגרסיה שמהווה רק אומדן לקו האמיתי

אילו החוקר יחזור על הניסוי עוד פעמיים הוא יקבל, קרוב לוודאי, נתוני תצפיות שונים ובעקבותיהם יתקבלו 2 קווי רגרסיה שונים זה מזה. בתום 3 המחקרים יהיו בידי החוקר 3 קווי רגרסיה שונים זה מזה, שכל אחד מהווה אומדן לקו האמיתי.

הבחנה בסימולים המתייחסים למדגם ולכלל האוכלוסיה

כלל האוכלוסייה

מדגם

הקו

קו אמיתי:

קו רגרסיה:

גורם המקריות

u

גורם המקריות בתצפית 1

גורם המקריות בתצפית i

דוגמאות נוספות

נציג בהמשך תוצאות מחקרים שנעשו ב- 2 ענפים, ענף הדגים וענף החצילים.

בכל ענף בוצעו 3 מחקרים זהים בידי 3 מדענים שונים.

  1. ענף הדגים – נבדק הקשר בין אורך הדגים (בס”מ) ומשקלם (בגרמים).
  2. ענף החצילים – נבדק הקשר בין כמות ההשקייה ותנובת החצילים.
  1. ענף הדגים – נבדק הקשר בין אורך הדגים (בס”מ) ומשקלם (בגרמים).

    חוקרים שונים ערכו את אותו מחקר. כל מחקר התבסס על מדגם של 1,000 דגים. לכל דג נרשמו אורכו במ”מ ומשקלו בגרמים. מהמדגם נאמד קו רגרסיה.

    טבלה 2 מציגה את אומדני הפרמטרים של קו הרגרסיה שהתקבלו אצל כל אחד מ- 3 החוקרים.

    טבלה 2

    החוקרים

    (שיפוע הקו)

    (היחידות: גר' למ”מ)


    (נקודות החיתוך)

    (היחידות: גרמים)

    חוקר א'

    5.70

    300

    חוקר ב'

    6.04

    303

    חוקר ג'

    5.65

    298

    מסקנות ממבט ראשון

    ההבדלים באומדנים אינם גדולים. הסיבה לכך היא שגורם המקריות באוכלוסייה אינו גדול. בשפת הסטטיסטיקה אומרים שהשונות של u קטנה. ככל שהשונות של u קטנה, התצפיות תתקרבנה לקו הרגרסיה.

  2. ענף החצילים – נבדק הקשר בין כמות ההשקייה ותנובת החצילים.

    כל אחד מ- 3 החוקרים גידל חצילים ב- 21 ערוגות, שיח אחד בכל ערוגה. 

    כל ערוגה הושקתה בכמות יומית שונה של מים:

    ערוגה 0 לא הושקתה כלל.

    ערוגה 1 הושקתה ב- 1 ליטר מים כל יום.

    ערוגה 2 הושקתה ב- 2 ליטר מים כל יום.

    ערוגה 3 הושקתה ב- 3 ליטר מים כל יום, וכך הלאה.

    בתום תקופת הגידול נקטפו החצילים, ועבור כל ערוגה נרשם משקל החצילים שגדלו בה. לכל חוקר היו 21 תצפיות כאשר כל תצפית כללה משתנה מסביר (כמות המים היומית בליטרים) ומשתנה מוסבר (משקל החצילים בק”ג). עבור כל אחד משלושת המדגמים נאמד קו רגרסיה.

    טבלה 3 מציגה את אומדני הפרמטרים של קו הרגרסיה שהתקבלו אצל כל אחד מ- 3 החוקרים.

    טבלה 3

    החוקרים

    (היחידות: ק”ג לליטר)

    (היחידות: ק”ג)

    חוקר א'

    2.49

    15.74

    חוקר ב'

    2.95

    5.36

    חוקר ג'

    3.19

    3.16

    .

    מסקנות ממבט ראשון

    קיימים הבדלים גדולים באומדנים, והסיבה לכך היא שבאוכלוסיית החצילים גורם המקריות גדול מאוד. בשפת הסטטיסטיקה, השונות של u גדולה.

    אנו נשוב ונעזר בדוגמת החצילים בהמשך. זכרו אותה!