אקונומטריקה · פרק 6 מ-7

רגרסיה מרובה

כשיש יותר ממשתנה מסביר אחד — מודל הרגרסיה המרובה.

רגרסיה מרובה (מודלים המבוססים על יותר ממשתנה מסביר אחד)

בדוגמת החצילים בפרקים הקודמים בחנו את הקשר בין כמות המים שמקבלת ערוגת חצילים (המשתנה המסביר) לבין משקל החצילים הגדלים בערוגה (המשתנה המוסבר). אבל, כמות המים איננה הגורם היחיד המשפיע על משקל החצילים. למשל, גם הטמפרטורה השוררת באזור הערוגה עשויה להשפיע על משקל החצילים. חוקר המתמחה בגידול חצילים החליט לבדוק זאת ולשם כך הוא ניסח את המודל הבא: \(Y_i = \alpha + \beta X_i + \gamma Z_i + u_i\). \(Y_i\) מייצג את משקל החצילים (בק"ג) שגדלים בערוגה ה-\(i\); \(X_i\) מייצג את כמות המים היומית (בליטרים) שמקבלת הערוגה ה-\(i\); \(Z_i\) מייצג את הטמפרטורה (במעלות צלזיוס) ששוררת בחממה שבה נמצאת הערוגה ה-\(i\) )החוקר מגדל כל ערוגה בחממה אחרת, ובכל חממה שוררת טמפרטורה קבועה שנבחרת ע"י החוקר(. המשמעות של \(\alpha\): משקל החצילים שיגדלו בערוגה אם הערוגה לא מקבלת מים (\(X=0\)) ואם הטמפרטורה בחממה שבה נמצאת הערוגה היא 0 (\(Z=0\)). המשמעות של \(\beta\): העליה במשקל החצילים שיגדלו בערוגה אם נגדיל את כמות המים בליטר אחד, כאשר הטמפרטורה נשארת ללא שינוי. המשמעות של \(\gamma\): העליה במשקל החצילים שיגדלו בערוגה אם נעלה את הטמפרטורה במעלה אחת, כאשר כמות המים נשארת ללא שינוי. לסיכום, כל מקדם מייצג את ההשפעה של המשתנה שאליו הוא קשור, כאשר יתר המשתנים נשארים ללא שינוי. )האקונומטריקאים משתמשים בביטוי הלטיני, ceteris paribus כדי לציין שיתר המשתנים נשארים ללא שינוי(. כדי לאמוד את המודל אסף החוקר נתונים מ-10 ערוגות: משקל החצילים הטמפרטורה השוררת כמות המים היומית מספר שגדלו בערוגה בחממה שבה נמצאת הערוגה שמקבלת הערוגה הערוגה ( ) Yi ( ) Zi ( ) Xi ( )i

מספר הערוגה (i) כמות המים היומית (Xᵢ) הטמפרטורה השוררת (Zᵢ) משקל החצילים (Yᵢ)
הערוגה שמקבלת הערוגה בחממה שבה נמצאת הערוגה שגדלו בערוגה
)i( i ) X( i ) Z( i ) Y(
1 1 15 4.3
2 1 16 4.6
3 2 17 6.6
4 2 18 6.6
5 3 19 8.8
6 3 20 8.7
7 4 21 10.7
8 4 22 10.9
9 5 23 12.7
10 5 24 12.9

בכל תצפית יש ערך לכמות המים, לגובה הטמפרטורה ולמשקל החצילים. החוקר אמד את המודל באמצעות תוכנת, excel תוך שימוש בסדר הפעולות הבא: ( 1) הקלדת הנתונים לגליון: בטור – A המספר הסידורי של הערוגה. בטור – B כמות המים שקיבלה (משתנה מסביר). בטור – C הטמפרטורה ששררה בערוגה (משתנה מסביר). בטור – D משקל החצילים (משתנה מוסבר). ( 2) סימון של אזור בעל שתי שורות ובעל 3 עמודות. הסבר: מספר העמודות צריך להיות כמספר הפרמטרים שיש במודל. במקרה הנ"ל יש 3 פרמטרים (\(\hat\alpha\), \(\hat\beta\), \(\hat\gamma\)), ולכן מספר העמודות יהיה 3. ( 3) הקלדת פונקציית האמידה (.=linest)D2: D11, B2: C11,1,1 הסבר:

  • האיבר הראשון מציין את המיקום בגליון האקסל של התא הראשון והתא האחרון בטור המשתנה המוסבר. המשתנה המוסבר נמצא באזור.D2: D11
  • האיבר השני מציין את המיקום בגליון האקסל של התא הראשון בקבוצה ואת התא האחרון באזור של המשתנים המוסברים. המשתנים המסבירים כקבוצה נמצאים באזור ) B2: C11 המים נמצאים באזור B2: B11 והטמפרטורה באזור.(C2: C11
איור
  • האיבר השלישי מציין שבמודל יש חותך.
  • האיבר הרביעי מציין שאנו מעוניינים לקבל גם את סטיות התקן של האומדים. ( 4) לחיצה על SHIFT + CNTRL + ENTER האומדנים שהתקבלו הם: \(\hat\gamma = 0.12\), \(\hat\beta = 1.85\), \(\hat\alpha = 0.79\):

משמעות האומדנים. המשמעות של \(\hat\alpha\): אם לא נשקה את הערוגה ונקבע בחממה טמפרטורה של 0 מעלות, יגדלו 0.79 ק"ג חצילים. המשמעות של \(\hat\beta\): כל ליטר נוסף של מים שנשקה את הערוגה ביום יגרום לעליה של 1.85 ק"ג במשקל החצילים (וזאת, בתנאי שלא נשנה את הטמפרטורה). המשמעות של \(\hat\gamma\): כל מעלה נוספת של טמפרטורה שתשרור בחממה תגרום לעליה של 0.12 ק"ג במשקל החצילים (וזאת, בתנאי שלא נשנה את כמות המים).

איור

שימוש בתוצאות האמידה לביצוע תחזית נוכל להשתמש בתוצאות אלה כדי לחזות את משקל החצילים שיגדלו בערוגה תחת רמת השקיה מסויימת ובטמפרטורה מסויימת. לדוגמה, נחשב מהו משקל החצילים שצפויים לגדול בערוגה אם נקבע בחממה טמפרטורה של 17 מעלות צלזיוס ונשקה את הערוגה ב-4.5 ליטר כל יום: \[\hat Y = 0.79 + 1.85 \cdot 4.5 + 0.12 \cdot 17 = 11.115\]

תרשים 8
תרשים 8

לפי החישוב, הכמות הצפויה בתנאים הנ"ל היא 11.155 ק"ג חצילים. תחזית זו הינה הערכה בלבד, ובפועל עשויים לגדול קצת יותר או קצת פחות חצילים, בשל גורם המקריות. תאור גרפי כאשר במודל יש יותר ממשתנה מסביר אחד איננו יכולים להתוות את נתוני המדגם ואת קו הרגרסיה בתרשים. עם זאת, אנו יכולים להציג קווי רגרסיה שמציגים את \(Y\) (המשתנה המוסבר) כפונקציה של משתנה מסביר אחד (\(X\) או \(Z\)) כאשר המשתנה המסביר השני הוא נתון קבוע. לדוגמה בתרשים 8 מותווים 2 קווי רגרסיה שמייצגים את משקל החצילים כפונקציה של הטמפרטורה. האחד, כאשר \(X=3\) ליטר, והשני כאשר \(X=1\) ליטר.

תרשים 9
תרשים 9

בתרשים 9 מותווה קו רגרסיה שמייצג את משקל החצילים כפונקציה של כמות המים (\(X\)), כאשר \(Z\) קבוע על 20. תרשים 8

גילוי נאות: התוכן באתר אינו ייעוץ פיננסי, פנסיוני, מסים או השקעות. החלטות פיננסיות אישיות מומלץ לקבל בליווי בעל מקצוע מוסמך.