מונחים מרכזיים – תזכורת
בפרק זה נרענן מונחים שהופיעו בספר "סטטיסטיקה למתחילים" ונרחיב את הדיון בהם.
משתנה מקרי
תוצאה מספרית של פעולה או של סדרת פעולות שאנחנו מבצעים ושיש בהן יסוד של מקריות נקרא משתנה מקרי. אנו מגדירים את המשתנה המקרי כרצוננו. דוגמאות דוגמא א': נגדיר משתנה מקרי שיקרא "משקל של דג בכנרת". אחרי ההגדרה נבצע את סדרת הפעולות הבאה: נסע לכנרת, נשליך חכה, נדוג דג ונשקול אותו. התוצאה שקיבלנו היא הערך של המשתנה המקרי "משקל של דג בכנרת". מדוע זהו משתנה מקרי? מפני שהתוצאה היא מקרית. אם, למשל, נבצע את אותה סדרת פעולות מחר, הרי שנדוג דג אחר, והמשקל שלו עשוי להיות אחר. ומחרתיים -התוצאה של סדרת הפעולות תהיה אחרת. ואם דייג אחר ילך לדוג וישקול את הדג הוא עשוי לקבל תוצאה אחרת. התוצאה משתנה באופן מקרי מדג לדג, ואי אפשר לצפות את התוצאות מראש. דוגמא ב': נגדיר משתנה מקרי שיקרא "משקל ממוצע של 10 דגים בכנרת". אחרי ההגדרה נבצע את סדרת הפעולות הבאה: נסע לכנרת, נשליך חכה, נדוג דג ונשקול אותו. אח"כ נשליך את החכה שוב, נדוג עוד דג ונשקול גם אותו. כך נעשה עבור 10 דגים. בסוף נחשב את המשקל הממוצע של 10 הדגים וזה יהיה הערך של המשתנה המקרי שלנו. דוגמאות נוספות של משתנים מקריים:
- משקל של דג בכנרת.
- הגובה של ילד בישראל.
- הגובה של ילד בכתה ג' בעולם.
- מספר התפוחים שנקטפו במטע התפוחים של קיבוץ כברי בשנה. בכל אחת מהדוגמאות הנ"ל התוצאה המספרית משתנה באופן מקרי ממדידה למדידה. אי אפשר לצפות את התוצאות מראש. השם משתנה מקרי בא לבטא את העובדה שהתוצאה משתנה באופן מקרי ממדידה למדידה.
אוכלוסייה
כל משתנה מקרי מתייחס לאוכלוסייה כלשהי. בדוגמאות לעיל האוכלוסיות הן:
- כל הדגים בכנרת (לכל דג יש משקל)
- כל ילדי ישראל (לכל ילד יש גובה)
- כל ילדי כיתות ג' בעולם (לכל ילד יש גובה)
- כל השנים שבהן היה מטע תפוחים בקיבוץ כברי )בכל שנה יש מספר מסויים של תפוחים שנקטפו(
פרמטר
הנתון (או התכונה) שאותה אנו מודדים נקרא בפי הסטטיסטיקאים פרמטר. המשקל בדוגמא 1 הוא פרמטר הגובה בדוגמא 2 ו 3-הוא פרמטר הכמות בדוגמא 4 היא פרמטר ערכי הפרמטר ערכי הפרמטר הם כל התוצאות האפשריות במדידה. לדוגמא: (המספרים הם רק להדגמה)
- משקל דג בכנרת -ערכי הפרמטר נעים בין 1 גרם ל 4,000 -גרם.
- גובה של ילד בישראל -ערכי הפרמטר נעים בין 80 ס"מ ל-165 ס"מ.
- גובה של ילד בכיתה ג' בעולם -ערכי הפרמטר נעים בין 90 ס"מ ל-140 ס"מ.
- כמות התפוחים -ערכי הפרמטר נעים בין 2,000 תפוחים ל 10,000 -תפוחים. ישנם פרמטרים שהערכים בהם יכולים להגיע למספרים גדולים מאוד. למשל, מספר החיידקים בבני אדם.

השם המלא של המשתנה המקרי
לכל משתנה מקרי יש שם שמכיל 2 מרכיבים:
- שם הפרמטר שאותו מודדים.
- האוכלוסייה שאליה הוא מתייחס. האוכלוסיה הפרמטר לדוגמה 1: גובה ילדי ישראל. האוכלוסיה הפרמטר
- מספר התפוחים שנקטפו בשנה במטע של קיבוץ כברי.
השם המקוצר
כאשר ברור באיזו אוכלוסייה מדובר, אפשר להסתפק בקיצור:
- גובה הילדים. במקום: גובה ילדי ישראל.
- כמות התפוחים. במקום: כמות התפוחים על העצים במטעי קיבוץ כברי.
סימול המשתנה המקרי
מקובל לסמל משתנה מקרי באות כלשהי. אם אפשר באות שמזכירה את המשתנה. כאשר אנו מתייחסים בו זמנית לכמה משתנים דומים, מקובל לסמל את כולם באותה אות, בתוספת מספור שונה לכל משתנה. המספור מוצב לימין האות ( H3, H2, H1 וכיוצ"ב). המספור יכול גם לעזור בהבלטת מידע נוסף ביחס למשתנה, כפי שנראה בהמשך. דוגמאות לסימול משתנים D משקל של דג בכנרת H1 גובה של ילד בישראל H2 גובה של ילד בכיתה ג' בעולם Q1 כמות התפוחים במטעי כברי בשנה Q2 כמות התפוחים במטעי ציפורי בשנה
משתנים המבוססים על אותה אוכלוסייה בסיסית ואותו פרמטר
דוגמאות משתנה:1 משקל דגי הכנרת האוכלוסיה – כל הדגים בכנרת הפרמטר – משקל (המשקל של כל דג) הסימול – D1 משתנה:2 המשקל הממוצע של דג בקבוצות בנות 25 דגים האוכלוסיה – כל הקבוצות בנות 25 דגים הפרמטר – משקל ממוצע (המשקל הממוצע של דג בודד בקבוצה של 25 דגים) הסימול – D25 משתנה:3 המשקל הממוצע של דג בקבוצות בנות 100 דגים בכנרת. אוכלוסיה – כל הקבוצות בנות 100 דגים הפרמטר – משקל משקל (המשקל הממוצע של דג בודד בקבוצה של 100 דגים) הסימול – D100 משתנה:4 המשקל הממוצע של דג בקבוצות בנות 625 דגים בכנרת אוכלוסיה – כל הקבוצות בנות 625 דגים הפרמטר – משקל ממוצע (המשקל הממוצע של דג בודד בקבוצה של 625 דגים) הסימול – D625 הערה: לצורך האחידות בשם הפרמטר בכל המשתנים המקריים לעיל, אפשר גם לומר ש-D1 הוא המשקל הממוצע של קבוצות בנות 1 דגים. וכך המשקל הממוצע הופך להיות פרמטר משותף למשתנים 1-4
משתנה בסיס ומשתנה מורכב
משתנה בסיס – המשתנה המקרי D1 נקרא משתנה הבסיס. כל ערך שלו נובע ממשקלו של דג בודד. דג בודד הוא היחידה הבסיסית מאוכלוסיית דגי הכנרת. האוכלוסייה של משתנה הבסיס מכונה: אוכלוסיית הבסיס או: האוכלוסייה הבסיסית. משתנה מורכב – כל שאר המשתנים המקריים ( ) D625, D100, D25 מכונים משתנים מורכבים, מהסיבה הפשוטה שהערך שלהם מחושב ע"י יותר מיחידה אחת מאוכלוסיית הבסיס: הערך של המשתנה המקרי D25 מחושב באמצעות 25 ערכים שונים של. D1 הערך של המשתנה המקרי D100 מחושב באמצעות 100 ערכים שונים של. D1 הערך של המשתנה המקרי D625 מחושב באמצעות 625 ערכים שונים של. D1
משתנים מקריים מאותה משפחה
למשתנים מקריים המבוססים על אותה אוכלוסייה ואותו פרמטר נקרא בהמשך גם משתנים מאותה משפחה. המשתנים המקריים D100, D25, D1 ו-D625 הם מאותה משפחה. בחרנו לסמל את המשתנים באופן זה מפני שכאשר האוכלוסייה מתייחסת לדגים, סביר לבחור באות ( D הצליל הראשון במילה "דג"). המספר הקטן המופיע מימין לאות, D יוצר את ההבדל בין המשתנים השונים: משתנה הבסיס המכיל דג אחד מסומל. D1 המשתנה המורכב המכיל 25 דגים מסומל. D25 המשתנה המורכב המכיל 100 דגים מסומל. D100 המשתנה המורכב המכיל 625 דגים מסומל. D625 כאשר אנו משרטטים התפלגות כלשהי שם המשתנה או הסימול שלו יוצגו לצד או מתחת לציר ה x. –
סימול תוחלת וסטיית תקן של משתנה מקרי
לכל משתנה מקרי יש התפלגות, ולכל התפלגות יש תוחלת וסטיית תקן (או בקיצור: ס"ת). בספר "סטטיסטיקה למתחילים" הסברנו את משמעות המושגים ואת הדרך לחישובם. נעסוק בכך גם בהמשך ספר זה. הסימול של התוחלת יעשה באמצעות האות E כאשר לימינה יופיע שם המשתנה המקרי שאליו היא מתייחסת. הסימול של התוחלת יעשה באמצעות האות ( σהאות היוונית "סיגמא") כאשר לימינה יופיע שם המשתנה המקרי שאליו היא מתייחסת. לדוגמא, בטבלה שלהלן מופיעים הסימולים של התוחלות ושל סטיות התקן של התפלגויות המשתנים המקריים שבהם עסקנו בפרק זה. E D625 E D100 E D25 E D1 סימול התוחלת σD625 σD100 σD25 σ D1 סימול סטיית התקן (ס"ת)
שימוש במונח משתנה מקרי כתחליף לשימוש במילה התפלגות
למעשה, כל התפלגות היא תוצר של משתנה מקרי כלשהו. לצורך הפשטות, הסטטיסטיקאים משתמשים במקרים רבים במונח משתנה מקרי )או בסימול שלו( במקום להשתמש במונח התפלגות. [לא מבטאים] דוגמאות שכיחות:
- אומרים: התוחלת של (המשתנה המקרי) D1 היא 1,000 גרם. במקום להגיד: התוחלת של התפלגות משקל הדגים בכנרת היא 1,000 גרם.
- אומרים: סטיית התקן של D50 היא 5 גרם. במקום: סטיית התקן של התפלגות המשקל הממוצע של קבוצות בנות 50 דגים, היא 5 גרם. כפי שאתם רואים: גם פשוט וגם יותר קצר. אנו בהמשך נשתמש בשני המונחים (משתנה מקרי והתפלגות) לסירוגין. ההחלטה באיזה מהם לבחור בכל עת, מושפעת בעיקר משיקולים של פישוט וחידוד ההסבר. יהיו גם מקומות שנעדיף להשתמש, בו זמנית, בשניהם.
הקשר בין משתנים מאותה משפחה
הסטטיסטיקאים מצאו שקיימים קשרים הדוקים בין משתנים מאותה משפחה. הקשר החשוב ביותר הוא בין משתנה הבסיס (למשל )D1, לבין משתנה מורכב שהוא ממוצע של משתנה הבסיס (למשל D25, או D100 או.)D625 למשתנה מקרי זה, נקרא לשם הקיצור משתנה הממוצע. נמצאו שני קשרים: ( 1) התוחלת של משתנה הממוצע שווה לתוחלת של משתנה הבסיס עצמו: E D25 = E D1 E D100 = E D1 E D625 = E D1 ( 2) ס"ת של משתנה הממוצע שווה לס"ת של משתנה הבסיס חלקי שורש גודל הקבוצה שממנה חושב הממוצע: σD
σD25 = 1
σD σD100 = 1 σD
- X משתנה הבסיס 625 -גודל הקבוצה לחישוב הממוצע n
- X n משתנה הממוצע שחושב מקבוצה בגודל n
- σ X סטיית תקן של משתנה הבסיס
- σ X סטיית תקן של משתנה הממוצע σXn =X ובשפת הסימולים: n n לדוגמא, אם סטיית התקן של D1 היא 50 גרם, אזי: סטיית התקן של D25 היאσ D25 = 50 = 50 = 10: = σ D 100 50 סטיית התקן של D100 היא= 5: σ D 625 = 50 = וסטיית התקן של D625 היא= 2: תרשים 1.1 ממחיש כיצד עליה בגודל הקבוצה שממנה מחושב הממוצע גורם לקיטון בסטיית התקן (כיווץ ההתפלגות). תרשים 1.1 = σD625 ( D625 מדגם בין 625 דגים) 2 = σD100 ( D100 מדגם בין 100 דגים) 5 = σ D1 (דגים בודדים) 50 D1 E