קו הרגרסיה – דוגמא

שתפו, חבל שתישארו עם כל הידע הזה לבד

Facebook
WhatsApp
Email
הבנת קו הרגרסיה והשפעתו על הקשרים בין משתנים במדגם דגים.

דוגמא : מחקר אמיתי

חוקר ערך מחקר לגבי הקשר בין אורך של דגים ומשקלם. הוא דג 100 דגים ורשם את נתוני האורך והמשקל שלהם.

תוצאות המדגם נרשמו בטבלה שאינה מוצגת כאן ומקביל הן הוצבו בתרשים 3 המוצג להלן.

בכל מידת אורך נמצאו בין 2 ל- 4 דגים, כשמשקלם שונה זה מזה. לדוגמא, באורך 500 מ"מ נמצאו 3 דגים, האחד במשקל 1,001 גרם, השני במשקל 1,003 גרם והשלישי במשקל 980 גרם.

בתרשים 3 אין נקודות שהתלכדו. ישנן בו 100 נקודות כמספר הדגים במדגם.

בסידור הנוכחי של הנקודות אין אפשרות לשרטט קו ישר שיחבר את כולן כפי שקרה במחקר הדמיוני.

עם זאת גם במבט חטוף ניתן להבחין שבאופן כללי ככל שאורך הדגים עולה, עולה גם משקלם. החוקר ביקש משלושת עוזרי המחקר שלו להעביר קו ישר שיחצה את "ים הנקודות" כך שהקו ישקף טוב ככל האפשר את הקשר בין האורך למשקל.

שלושת העוזרים שרטטו 3 קווים שונים, די קרובים זה לזה (בתרשים משורטט רק אחד הקווים).

לאור ההבדלים בקווים החוקר פנה לעזרת סטטיסטיקאי. הסטטיסטיקאי סיפר לו שכבר לפני שנים רבות הסטטיסטיקאים פיתחו נוסחה לשרטט קו ישר בתוך מצבור של נקודות, שמשקף בצורה הטובה ביותר את הקשר בין 2 המשתנים. הקו מכונה: קו הרגרסיה.

הסברים על קו הרגרסיה

בתרשים 4 מוצג מדגם בעל 4 תצפיות וקו רגרסיה המתאים למדגם (הקו שמשקף את המדגם בצורה הטובה ביותר).

עבור כל תצפית מוצגת הסטיה שלה מקו הרגרסיה.

בקו הרגרסיה סכום כל הסטיות בריבוע הוא הקטן ביותר מבין כל הקווים האפשריים.

קו הרגרסיה נקרא גם קו הריבועים הפחותים.

השם של הקו נגזר מהמאפיין שלו, שלפיו סכום ריבועי הסטיות של תצפיות המדגם מהקו הוא הפחוּת (הקטן) ביותר.

הייעוד של קו הרגרסיה

קו הרגרסיה אמור לתת אינדיקציה לגבי סוג הקשר ועוצמת הקשר שבין המשתנה המוסבר למשתנה המסביר.

ככל שפיזור התצפיות לאורך קו הרגרסיה קטן יותר כך עוצמת הקשר ביניהם גדולה יותר. כאשר כל התצפיות נמצאות על גבי קו הרגרסיה כמו בדוגמא של המחקר הדמיוני, הקשר בין המשנה המסביר למשתנה המוסבר מושלם.

2 הפרמטרים של קו הרגרסיה

קו הרגרסיה, כמו כל קו ישר, מאופיין ב-2 פרמטרים:

  1. שיפוע הקו
  2. נקודת החיתוך

הבחנה בין קו הרגרסיה המבוסס על מדגם לבין "הקו האמיתי"

ההסבר מתייחס לדוגמא של הדגים בים.

אילו החוקר היה יכול לדגום במחקר שלו את כל אוכלוסיית הדגים בים, התוצאה היתה נותנת תמונת מצב מדוייקת לגבי הקשר הקיים בין אורך ומשקל באוכלוסיית הדגים.

אילו היינו מחשבים קו על בסיס נתוני כלל אוכלוסיית הדגים היינו יכולים לקרוא לו הקו האמיתי, אך החוקר מתבסס במחקר שלו רק על מדגם של 100 דגים, ולפיכך הקו שקיבל הוא קו רגרסיה שמהווה רק אומדן לקו האמיתי.

אילו החוקר יחזור על הניסוי עוד פעמיים הוא יקבל, קרוב לוודאי, נתוני תצפיות שונים ובעקבותיהם יתקבלו 2 קווי רגרסיה שונים זה מזה. בתום 3 המחקרים יהיו בידי החוקר 3 קווי רגרסיה שונים זה מזה, שכל אחד מהווה אומדן לקו האמיתי.