)או: בניית מרווחי סמך ובדיקת השערות
כאשר סטיית התקן אינה ידועה(
בפרקים על מרווחי סמך ועל בדיקת השערות עשינו לעצמנו "חיים קלים" והנחנו שאנו יודעים את סטיית התקן של ההתפלגות, אך בד"כ במציאות אנו לא יודעים מהי סטיית התקן של ההתפלגות ואנו אומדים אותה באמצעות מדגם מתוך האוכלוסיה. לתוצאה המתקבלת באומדן קוראים: טעות תקן (ולא סטיית תקן)). תזכורת: דרך החישוב של טעות תקן מוסברת בפרק (.4 = טעות תקן נסמל = 2 הדבר משפיע על מיקומם של הגבול העליון ושל הגבול התחתון במרווחי סמך, ועל המיקומים של הקווים האדומים בבדיקת השערות. הסטטיסטיקאים פיתחו טבלה המכונה טבלה ( t רצ"ב), שעוזרת לנו למצוא את המיקומים הנ"ל.
טבלה t
המיקומים תלויים בשני גורמים:
- דרגות החופש -דרגות החופש משקפות את גודל המדגם ששימש לחישוב טעות התקן פחות 1 לדוגמא, אם טעות התקן חושבה ממדגם בן 10 תצפיות, מספר דרגות החופש הוא 9
- רמת המובהקות המבוקשת, עבור בדיקת השערות (בד"כ 5%או 10)%או רמת הסמך המבוקשת עבור מרווחי סמך (בד"כ 95%או 90)%
טבלה t
רמת מובהקות רמת מובהקות לבדיקת השערות עם של 5% של 10% קו אדום אחד רמת מובהקות רמת מובהקות לבדיקת השערות עם של 5% של 10% שני קווים אדומים רמת סמך רמת סמך של 95% של 90% למרווחי סמך דרגות חופש הערה: עבור מספר דרגות חופש הגדול מ 120-משתמשים בשורת ה.∞-
הסבר לשימוש בטבלה t
בערכים שבטור משתמשים ל:
- בדיקת השערות עם קו אדום אחד ברמת מובהקות 10% בערכים שבטור משתמשים ל:
- בדיקת השערות עם קו אדום אחד ברמת מובהקות 5%
- בדיקת השערות עם שני קווים אדומים ברמת מובהקות 10%
- בניית מרווח סמך עם רמת סמך של 90% בערכים שבטור משתמשים ל:
- בדיקת השערות עם שני קווים אדומים ברמת מובהקות 5%
- בניית מרווח סמך עם רמת סמך של 95% דוגמא: אם אנו נדרשים לבצע בדיקת השערות ברמת מובהקות 10%עם קו אדום אחד שממוקם מימין לתוחלת, וגודל המדגם שלפיו חושבה טעות התקן היא,20 אזי הקו האדום ימוקם 1.328 טעויות תקן מימין לתוחלת. הסבר: לבדיקת השערות עם קו אדום אחד ברמת מובהקות 10%משתמשים בטור. מכיוון שבמדגם היו 20 תצפיות אז מספר דרגות החופש הוא 19 אם נסתכל בטור, בשורה של 19 דרגות חופש, נמצא את המספר 1.328
מרווחי סמך כאשר סטיית התקן לא ידועה
דוגמא הגובה של תלמידי כיתה ג' בבית-ספר מסויים (משתנה הבסיס) מתפלג נורמלית עם תוחלת לא ידועה ועם סטיית תקן לא ידועה. במדגם של 9 תלמידים התקבלו הגבהים הבאים (בס"מ).138,127,135,136,128,132,136,139,126: יש לבנות מרווח סמך לתוחלת ברמת סמך של 90% פתרון = ( 1) נחשב את הממוצע= 133: נסמל את משתנה הבסיס ב, G1-ואת משתנה הממוצע ב. G9- ( 2) נמצא את הערך המתאים בטבלה: t מכיוון שגודל המדגם הוא,9 אז מספר דרגות החופש הוא 8 מכיוון שמבוקשת רמת סמך של 90%יש להשתמש בטור של טבלה. t הערך הנמצא בטור בשורה של 8 דרגות חופש הוא 1.86 מכאן, שהגבול העליון של מרווח הסמך יהיה 1.86 טעויות תקן מעל 133 ס"מ )הממוצע שחישבנו( והגבול התחתון של מרווח הסמך יהיה 1.86 טעויות תקן מתחת ל 133-ס"מ. ( 3) נחשב את טעות התקן של משתנה הבסיס (: )G1 ריבוע ההפרש ההפרש מהממוצע הגובה הממוצע הגובה של כל ילד = השונות (של משתנה הבסיס) תהיה= 24.25: טעות התקן של משתנה הבסיס היא שורש השונות שלוσ G = 24.25 = 4.92:
σ G1 4.92 4.92 = σ G9 = = ( 4) נחשב את טעות התקן של משתנה הממוצע = 1.64: עצוממה ןקתה הלבטמ t תועט ( 5) הגבול העליון של מרווח הסמך הוא 133 + 1.86 ⋅ 1.64 = 136.05 עצוממה ןקתה הלבטמ t תועט ( 6) הגבול העליון של מרווח הסמך הוא 133 − 1.86 ⋅ 1.64 = 129.95 מרווח הסמך הוא בין 129.95 ס"מ לבין 136.05 ס"מ, כלומר בהסתברות של 90%תוחלת התפלגות הגובה של התלמידים נמצאת בתחום זה. לסיכום כדי למצוא מרווח סמך לתוחלת של משתנה מסויים מתוך מדגם יש לבצע את הפעולות הבאות: ( 1) לחשב את ממוצע המדגם. ( 2) למצוא את הערך הרלוונטי בטבלה, t לפי רמת הסמך המבוקשת ומספר דרגות החופש (גודל המדגם פחות 1) ( 3) לחשב את טעות התקן של משתנה הבסיס. ( 4) לחשב את טעות התקן של משתנה הממוצע )ע"י חלוקת טעות התקן של משנה הבסיס בשורש של גודל המדגם(. ( 5) הגבול העליון של מרווח הסמך הוא הממוצע (שמצאנו בסעיף 1) ועוד המכפלה של הערך המתאים מטבלה ( t שמצאנו בסעיף 2) עם טעות התקן של משתנה הממוצע )שמצאנו בסעיף.(4 ( 6) הגבול התחתון של מרווח הסמך הוא הממוצע (שמצאנו בסעיף 1) פחות המכפלה של הערך המתאים מטבלה ( t שמצאנו בסעיף 2) עם טעות התקן של משתנה הממוצע (שמצאנו בסעיף 4)
בדיקת השערות כאשר סטיית התקן לא ידועה
דוגמא ידוע שגובהם של ילדים בני 10 מתפלג נורמלית עם תוחלת של 120 ס"מ ( ) µ = 120 ועם סטיית תקן שאינה ידועה. חוקר רפואי טוען שפיתח תרופה להגבהת הילדים בצורה משמעותית, ולראיה הוא הביא מדגם של 4 ילדים שקיבלו את התרופה. הגבהים של הילדים שבמדגם (בס"מ) היו 129, : האם, ברמת מובהקות של,5%צודק החוקר בטענתו, והתרופה אכן מגביהה את הילדים? פתרון ( 1) השערת ה 0-היא שהתרופה לא מגביהה ותוחלת הגובה של ילדים שקיבלו את הטיפול היא 120 ס"מ (כמו התוחלת המקורית). ( 2) ההשערה הנגדית היא שהתרופה מגביהה, ותוחלת הגובה של ילדים שקיבלו את הטיפול גדול מ 120-ס"מ. מכאן ניתן לדעת שיהיה קו אדום אחד מימין לתוחלת. ( 3) נמצא את הערך המתאים בטבלה: t מכיוון שגודל המדגם הוא,4 אז מספר דרגות החופש הוא 3 מכיוון שיש למקם קו אדום אחד מימין לתוחלת ורמת המובהקות המבוקשת היא,5%הטור המתאים בטבלה, t הוא טור.הערך הנמצא בטור בשורה של 3 דרגות חופש הוא 2.353 מכאן, שהקו האדום ימוקם 2.353 טעויות תקן מעל התוחלת (שהיא 120 ס"מ). = ( 4) נחשב את הממוצע= 130: נסמל את משתנה הבסיס ב, G1-ואת משתנה הממוצע ב. G4- ( 5) נחשב את טעות התקן של משתנה הבסיס (: )G1 ריבוע ההפרש ההפרש מהממוצע הגובה הממוצע הגובה של כל ילד השונות (של משתנה הבסיס) תהיה= = 15.33: טעות התקן של משתנה הבסיס היא שורש השונות שלוσ G = 15.33 = 3.92:
σ G 1 3.92 3.92 = σ G4 = = ( 6) נמצא את טעות התקן של משתנה הממוצע"= 1.96: עצוממה ןקתה הלבטמ t תועט ( 7) מיקום הקו האדום יהיה בערך של 120 + 2.353 ⋅ 1.96 = 124.61 התחום הסביר מכיל את כל הערכים הקטנים מ 124.61-ס"מ. התחום החריג מכיל את כל הערכים הגדולים מ 124.61-ס"מ. ( 8) נבדוק באיזה תחום נמצא הממוצע, ונקבל החלטה: הממוצע שהתקבל במדגם הוא 130 ס"מ והוא נמצא באזור החריג. לכן אנו דוחים את השערת ה,0-וטוענים שההשערה הנגדית היא הנכונה, והחוקר צודק (הטיפול מגביה את התלמידים). לסיכום לבדיקת השערות יש לבצע את הפעולות הבאות: ( 1) להגדיר את השערת ה( 0-אין סטייה מהתוחלת של המצב המקורי). ( 2) להגדיר את ההשערה הנגדית )התוחלת עלתה, התוחלת ירדה, התוחלת השתנתה כלפי מעלה או כלפי מטה(, ולקבוע כמה קווים אדומים יהיו ובאיזה צד של התוחלת. ( 3) למצוא את הערך הרלוונטי בטבלה, t לפי רמת המובהקות הנדרשת, מספר הקווים האדומים, ומספר דרגות החופש (גודל המדגם פחות 1) ( 4) לחשב את ממוצע המדגם. ( 5) לחשב את טעות התקן של משתנה הבסיס. ( 6) לחשב את טעות התקן של משתנה הממוצע )ע"י חלוקת טעות התקן של משנה הבסיס בשורש של גודל המדגם(. ( 7) להגדיר את מיקומם של הקווים האדומים: התוחלת המקורית שבהשערת ה 0-ועוד או פחות המכפלה של הערך המתאים מטבלה ( t שמצאנו בסעיף 3) עם טעות התקן של משתנה הממוצע (שמצאנו בסעיף 6) ( 8) לפי הקווים האדומים להגדיר את התחום הסביר ואת התחום החריג, לבדוק באיזה תחום נמצא הממוצע (שמצאנו בסעיף 4) אם הממוצע בתחום החריג – דוחים את השערת ה,0-אם הממוצע נמצא בתחום הסביר מקבלים את השערת ה 0.- דוגמה משך החיים של עכבר מתפלג נורמלית עם תוחלת של 30 יום, ועם סטיית תקן לא ידועה. חוקר טוען שפיתח תוסף מזון שמאריך את חיי העכברים. על בסיס מדגם שכלל 11 עכברים שקיבלו את התוסף התקבל כי ממוצע משך החיים הוא 35 יום וטעות התקן של משתנה הבסיס היא 3 ימים. נדרש לבדוק ברמת מובהקות של 10%האם התוסף יעיל? פתרון השערת ה 0-היא שהתוחלת של משך חייו של עכבר שקיבל תוסף מזון היא 30 ההשערה הנגדית היא שהתוחלת של משך חייו של עכבר שקיבל תוסף מזון גדולה 30 יהיה קו אדום אחד מימין ל 30.- הנתון הרלוונטי בטבלה t הוא ) 1.372 שורה – 10 כי יש 10 דרגות חופש, טור – כי מדובר בקו אדום אחד וברמת מובהקות של.(10% טעות התקן של משתנה הבסיס נתונה ( 3 ימים), טעות התקן של משתנה הממוצע היא תלחותה לש תועט תרעשה ה 0 – ןקתה הלבטמ t מיקום הקו האדום יהיה בערך של 120 + 1.372 ⋅ 0.9 = 121.23 התחום החריג מכיל את כל הערכים שגדולים מ 121.23-ימים. הממוצע ( 35 ימים) נמצא בתחום זה, ולכן דוחים את השערת ה,0-ומקבלים את ההשערה הנגדית. תוסף המזון מאריך את משך חיי העכברים.
השפעת גודל המדגם על נתוני טבלה t
ככל שהמדגם גֵַדל (=עליה במספר דרגות החופש), הנתונים בכל טור הולכים וקטנים והמרחקים הנדרשים בטעויות תקן הולכים ומתקרבים למרחקים בסטיות תקן. במילים אחרות, ככל שהמדגם גֵַדל, טעות התקן הופכת להיות אומדן יותר אמין לסטיית התקן באוכלוסיה. לדוגמה, בטור כאשר המדגם מכיל 120 דרגות חופש:
- המרחק הנדרש בטעויות תקן הוא 1.289
- המרחק הנדרש בסטיות תקן הוא ( 1.282 קרוב ל1.289)- כאשר המדגם קטן, נתוני טעות התקן אינם אמינים דיים, ונדרשים מקדמי ביטחון גדולים שמתבטאים בגידול במרחקים )של גבולות הסמך מהממוצע, או של הקווים האדומים מהתוחלת(.
דוגמאות נוספות
שאלה 1
ידוע כי מספר התפוזים על העצים בפרדס א' מתפלג נורמלית עם תוחלת ) 100 סטיית התקן לא ידועה(.בעקבות שימוש בזבל חדש הועלתה הטענה כי מספר התפוזים על העצים גדל. לשם בדיקת הטענה נערך מדגם על תשעה עצים. מספר התפוזים על עצי המדגם היו כדקלמן 110,108,115,109,105,117,111,110,108: יש לבדוק את הטענה ברמת מובהקות של 5% מהלכי הפתרון נסמל את משתנה הבסיס (מספר התפוזים על עץ בודד) ב. T1 – נסמל את משתנה הממוצע (מספר התפוזים הממוצע במדגם של 9 עצים) ב. T9 – ( 1) הגדרת השערת ה – 0-הזבל לא יעיל (התוחלת היא 100) ( 2) הגדרת ההשערה הנגדית – הזבל יעיל (התוחלת גדולה מ 100)-יהיה קו אדום אחד מימין
ל 100.- ( 3) יש קו אדום אחד, רמת מובהקות היא,5%מספר דרגות החופש הוא ) 8 גודל המדגם פחות.(1 הערך המתאים מטבלה t הוא 1.86 ( 4) ממוצע המדגם הוא 110 תפוזים(.וודאו את החישוב) ( 5) טעות התקן של משתנה הבסיס, T1, היא 3.5 תפוזים(.וודאו את החישוב) ( 6) טעות התקן של משתנה הממוצע, T9, היא 1.167 תפוזים = 1.167 ( 7) הקו האדום יקבע בערך של 102.17 תפוזים (. 100) + 1.86 ⋅ 1.167 = 102.17 ( 8) המסקנה הסטטיסטית היא שההשערה הנגדית מתקבלת (הזבל יעיל), כי הממוצע נמצא בתחום החריג..
σ T9 = 1.167 100 102.17 110 תפוזים (יח') תוצאת התצפית
שאלה 2
ממחקרים שנעשו בעבר ידוע כי מספר הגרעינים במלון מתפלג נורמלית עם תוחלת 200 (סטיית התקן לא ידועה). חוקר טוען כי עקב התחממות כדור הארץ, השתנה מספר זה והוא איננו 200 לצורך כך הוא ערך מדגם בן 36 מלונים וספר את מספר הגרעינים בכל מלון. הוא חישב את הממוצע ומצא כי הוא 210 לאחר שמצא את הממוצע הוא חישב את סטיית התקן המוערכת (שהיא טעות התקן) של משתנה הבסיס ומצא שהיא 54 גרעינים. האם לפי תוצאות המדגם טענת החוקר נכונה ברמת מובהקות של ?5% מהלכי הפתרון נסמל את משתנה הבסיס (מספר הגרעינים במלון אחד) ב. T1 – נסמל את משתנה הממוצע (מספר הגרעינים הממוצע במדגם של 36 מלונים) ב. T36 – ( 1) הגדרת השערת ה – 0-ההתחממות לא משפיעה על מספר הגרעינים (התוחלת היא 200) ( 2) הגדרת ההשערה הנגדית – ההתחממות משפיעה על מספר הגרעינים )התוחלת שונה מ- .(100 יהיו שני קווים אדומים אחד מימין ל 200-ואחד משמאל ל 200.- ( 3) יש שני קווים אדומים אחד, רמת מובהקות היא,5%מספר דרגות החופש הוא ) 35 גודל המדגם פחות.(1 הערך המתאים אינו מופיע בטבלה t הנתונה בספר זה, לכן נשתמש בערך המתאים ל 30-דרגות חופש, כלומר 2.042 ( 4) ממוצע המדגם הוא 210 גרעינים(.נתון בשאלה) ( 5) טעות התקן של משתנה הבסיס, T1, היא 54 גרעינים(.נתון בשאלה) ( 6) טעות התקן של משתנה הממוצע, T36, היא 9 גרעינים = 9 ( 7) הקווים האדומים יקבעו בערכים הבאים: ( 8) המסקנה הסטטיסטית היא שהשערת ה 0-מתקבלת )המספר הגרעינים לא השתנה בעקבות הההתחממות(, כי הממוצע נמצא בתחום הסביר. σ T36 = 9 181 200 210 218 גרעינים (יח') קו תוצאות קו אדום המדגם אדום
שאלה 3
ידוע שהטמפרטורה בת"א ביום קיץ (מתחילת יוני ועד סוף ספטמבר) מתפלגת נורמלית. מטאורולוג מדד את הטמפרטורה ב-9 ימים בקיץ וקיבל את המדגם הבא( 26: מעלות),30, מצא את הרווח סמך לתוחלת הטמפרטורה ברמת סמך של 95% מהלכי הפתרון נסמל את משתנה הבסיס (הטמפרטורה ביום קיץ מסויים) ב. T1- נסמל את משתנה הממוצע (הטמפרטורה הממוצעת במדגם של 9 ימים) ב. T9- ( 1) ממוצע המדגם הוא 300 ( 2) רמת הסמך היא,95%מספר דרגות החופש הוא ( 8 גודל המדגם פחות 1) הערך המתאים מטבלה t הוא 2.306 ( 3) טעות התקן של משתנה הבסיס, T1, היא 2.9150 ( 4) טעות התקן של משתנה הממוצע, T9, היא 0.9720 ( 5) הגבול העליון של מרווח הסמך הוא 30 + 2.306 ⋅ 0.972 = 32.24 ( 6) הגבול התחתון של מרווח הסמך הוא 30 − 2.306 ⋅ 0.972 = 27.76 מרווח סמך לתוחלת הטמפרטורה 27.76ᵒ 30ᵒ טמפרטורה (מעלות) 32.24ᵒ גבול סמך תוצאות גבול סמך תחתון המדגם עליון
שאלה 4
לולן מעוניין למצוא את תוחלת משקל הביצים שמטילות התרנגולות בלול שלו. ידוע שמשקלן מתפלג נורמלית. היות והלולן יודע שלמצוא את התוחלת המדוייקת הוא לא יוכל, הוא מסתפק במציאת רווח סמך לתוחלת ברמת בטחון של 90%לשם כך, הלולן ערך מדגם שבמסגרתו נשקלו 16 ביצים. התוצאות (בגרמים), היו כדלקמן: מהלכי הפתרון נסמל את משתנה הבסיס (משקל של ביצה אחת) ב. B1- נסמל את משתנה הממוצע (משקל ממוצע של ביצה במדגם של 16 ביצים) ב. B16 – ( 1) ממוצע המדגם הוא 139 גרם ( 2) רמת הסמך היא,90%מספר דרגות החופש הוא ( 15 גודל המדגם פחות 1) הערך המתאים לא מופיע בטבלה, t נשתמש בערך המתאים ל 13-דרגות חופש, שהוא 1.771 ( 3) טעות התקן של משתנה הבסיס, B1, היא 8.892 גרם ( 4) טעות התקן של משתנה הממוצע, B16, היא 2.223 גרם ( 5) הגבול העליון של מרווח הסמך הוא 139 + 1.771 ⋅ 2.223 = 142.9 ( 6) הגבול התחתון של מרווח הסמך הוא 139 − 1.771 ⋅ 2.223 = 135.1 מרווח סמך לתוחלת המשקל 135.1 139 142.9 משקל הביצים (גרם) גבול סמך תוצאות גבול סמך תחתון המדגם עליון