בפרקים על מרווחי סמך ועל בדיקת השערות עשינו לעצמנו "חיים קלים" והנחנו שאנו יודעים את סטיית התקן של ההתפלגות, אך בד"כ במציאות אנו לא יודעים מהי סטיית התקן של ההתפלגות ואנו אומדים אותה באמצעות מדגם מתוך האוכלוסיה. לתוצאה המתקבלת באומדן קוראים: טעות תקן (ולא סטיית תקן). (תזכורת: דרך החישוב של טעות תקן מוסברת בפרק 4).
טעות תקן נסמל hatSigma[6/sqrt(9)=6/3=2]
.
הדבר משפיע על מיקומם של הגבול העליון ושל הגבול התחתון במרווחי סמך, ועל המיקומים של הקווים האדומים בבדיקת השערות.
הסטטיסטיקאים פיתחו טבלה המכונה טבלה t (רצ"ב), שעוזרת לנו למצוא את המיקומים הנ"ל.
טבלה t
המיקומים תלויים בשני גורמים:
- דרגות החופש – דרגות החופש משקפות את גודל המדגם ששימש לחישוב טעות התקן פחות 1. לדוגמא, אם טעות התקן חושבה ממדגם בן 10 תצפיות, מספר דרגות החופש הוא 9.
- רמת המובהקות המבוקשת, עבור בדיקת השערות (בד"כ 5% או 10%) או רמת הסמך המבוקשת עבור מרווחי סמך (בד"כ 95% או 90%).
טבלה t
דרגות חופש | (1) | (2) | (3) | |
1 | 3.078 | 6.314 | 12.709 | |
2 | 1.886 | 2.92 | 4.303 | |
3 | 1.638 | 2.353 | 3.182 | |
4 | 1.533 | 2.132 | 2.776 | |
5 | 1.476 | 2.015 | 2.571 | |
6 | 1.44 | 1.943 | 2.447 | |
7 | 1.415 | 1.895 | 2.365 | |
8 | 1.397 | 1.86 | 2.306 | |
9 | 1.383 | 1.833 | 2.262 | |
10 | 1.372 | 1.812 | 2.228 | |
11 | 1.363 | 1.796 | 2.201 | |
12 | 1.356 | 1.782 | 2.179 | |
13 | 1.35 | 1.771 | 2.16 | |
18 | 1.33 | 1.734 | 2.101 | |
19 | 1.328 | 1.729 | 2.093 | |
20 | 1.325 | 1.725 | 2.086 | |
21 | 1.323 | 1.721 | 2.08 | |
22 | 1.321 | 1.717 | 2.074 | |
23 | 1.319 | 1.714 | 2.069 | |
30 | 1.31 | 1.697 | 2.042 | |
40 | 1.303 | 1.684 | 2.021 | |
60 | 1.296 | 1.671 | 2 | |
120 | 1.289 | 1.658 | 1.98 | |
∞ | 1.282 | 1.645 | 1.96 |
הערה: עבור מספר דרגות חופש הגדול מ-120 משתמשים בשורת ה-∞.
הסבר לשימוש בטבלה t
בערכים שבטור 1 משתמשים ל:
- בדיקת השערות עם קו אדום אחד ברמת מובהקות 10%.
בערכים שבטור 2 משתמשים ל:
- בדיקת השערות עם קו אדום אחד ברמת מובהקות 5%.
- בדיקת השערות עם שני קווים אדומים ברמת מובהקות 10%.
- בניית מרווח סמך עם רמת סמך של 90%.
בערכים שבטור 3 משתמשים ל:
- בדיקת השערות עם שני קווים אדומים ברמת מובהקות 5%.
- בניית מרווח סמך עם רמת סמך של 95%.
דוגמא: אם אנו נדרשים לבצע בדיקת השערות ברמת מובהקות 10% עם קו אדום אחד שממוקם מימין לתוחלת, וגודל המדגם שלפיו חושבה טעות התקן היא 20, אזי הקו האדום ימוקם 1.328 טעויות תקן מימין לתוחלת.
הסבר: לבדיקת השערות עם קו אדום אחד ברמת מובהקות 10% משתמשים בטור 1 . מכיוון שבמדגם היו 20 תצפיות אז מספר דרגות החופש הוא 19. אם נסתכל בטור 1, בשורה של 19 דרגות חופש, נמצא את המספר 1.328.