דוגמאות

משתנה 1:   משקל דגי הכנרת

האוכלוסיה – כל הדגים בכנרת
הפרמטר – משקל (המשקל של כל דג)
הסימול ` D_1`   

 

משתנה 2:   המשקל הממוצע של דג בקבוצות בנות 25 דגים

האוכלוסיה – כל הקבוצות בנות 25 דגים
הפרמטר – משקל ממוצע (המשקל הממוצע של דג בודד בקבוצה של 25 דגים)
הסימול ` D_25`  

 

משתנה 3:   המשקל הממוצע של דג בקבוצות בנות 100 דגים בכנרת.

אוכלוסיה – כל הקבוצות בנות 100 דגים
הפרמטר – משקל משקל (המשקל הממוצע של דג בודד בקבוצה של 100 דגים)
הסימול –  `D_100`   

 

משתנה 4:   המשקל הממוצע של דג בקבוצות בנות 625 דגים בכנרת

אוכלוסיה – כל הקבוצות בנות 625 דגים
הפרמטר –  משקל ממוצע (המשקל הממוצע של דג בודד בקבוצה של 625 דגים)
הסימול  `D_625`

הערה:
לצורך האחידות בשם הפרמטר בכל המשתנים המקריים לעיל, אפשר גם לומר ש-`D_1` הוא המשקל הממוצע של קבוצות בנות 1 דגים. וכך המשקל הממוצע הופך להיות פרמטר משותף למשתנים 1-4.

 

משתנה בסיס ומשתנה מורכב

משתנה בסיס – המשתנה המקרי `D_1`  נקרא משתנה הבסיס. כל ערך שלו נובע ממשקלו של דג בודד. דג בודד הוא היחידה הבסיסית מאוכלוסיית דגי הכנרת.
האוכלוסייה של משתנה הבסיס מכונה: אוכלוסיית הבסיס או: האוכלוסייה הבסיסית.
משתנה מורכב – כל שאר המשתנים המקריים (`D_25` , `D_100` , `D_625` ) מכונים משתנים מורכבים, מהסיבה הפשוטה שהערך שלהם מחושב ע”י יותר מיחידה אחת מאוכלוסיית הבסיס:
  • הערך של המשתנה המקרי `D_25`  מחושב באמצעות 25 ערכים שונים של `D_1` .
  • הערך של המשתנה המקרי `D_100`  מחושב באמצעות 100 ערכים שונים של `D_1` .
  • הערך של המשתנה המקרי `D_625`  מחושב באמצעות 625 ערכים שונים של` D_1` .

 

משתנים מקריים מאותה משפחה

למשתנים מקריים המבוססים על אותה אוכלוסייה ואותו פרמטר נקרא בהמשך גם משתנים מאותה משפחה.
המשתנים המקריים  `D_1` ,`D_25`  ,`D_100`  ו- `D_625`  הם מאותה משפחה.
בחרנו לסמל את המשתנים באופן זה מפני שכאשר האוכלוסייה מתייחסת לדגים, סביר לבחור באות `D ` (הצליל הראשון במילה “דג”). המספר הקטן המופיע מימין לאות `D` , יוצר את ההבדל בין המשתנים השונים:
  • משתנה הבסיס המכיל דג אחד מסומל `D_1` .
  • המשתנה המורכב המכיל 25 דגים מסומל `D_25` .
  • המשתנה המורכב המכיל 100 דגים מסומל `D_100` .
  • המשתנה המורכב המכיל 625 דגים מסומל `D_625` .

כאשר אנו משרטטים התפלגות כלשהי שם המשתנה או הסימול שלו יוצגו לצד או מתחת לציר ה- x.

 

סימול תוחלת וסטיית תקן של משתנה מקרי

לכל משתנה מקרי יש התפלגות, ולכל התפלגות יש תוחלת וסטיית תקן (או בקיצור: ס”ת). בספר “סטטיסטיקה למתחילים” הסברנו את משמעות המושגים ואת הדרך לחישובם. נעסוק בכך גם בהמשך ספר זה.
הסימול של התוחלת יעשה באמצעות האות `E` כאשר לימינה יופיע שם המשתנה המקרי שאליו היא מתייחסת.
הסימול של התוחלת יעשה באמצעות האות `Sigma`  (האות היוונית “סיגמא”) כאשר לימינה יופיע שם המשתנה המקרי שאליו היא מתייחסת.

לדוגמא, בטבלה שלהלן מופיעים הסימולים של התוחלות ושל סטיות התקן של התפלגויות המשתנים המקריים שבהם עסקנו בפרק זה.

המשתנה המקרי

D1

D25

D100

D625

סימול התוחלת

`E_(D_1`

`E_(D_25`

`E_(D_100`

`E_(D_625`

סימול סטיית התקן (ס”ת)

`Sigma_(D_1`

`Sigma_(D_25`

`Sigma_(D_100`

`Sigma_(D_625`

 

שימוש במונח משתנה מקרי כתחליף לשימוש במילה התפלגות

למעשה, כל התפלגות היא תוצר של משתנה מקרי כלשהו.
לצורך הפשטות, הסטטיסטיקאים משתמשים במקרים רבים במונח משתנה מקרי (או בסימול שלו) במקום להשתמש במונח התפלגות.
דוגמאות שכיחות:
  1. אומרים: התוחלת של (המשתנה המקרי-לא מבטאים) `1_D`  היא 1,000 גרם. במקום להגיד: התוחלת של התפלגות משקל הדגים בכנרת היא 1,000 גרם.
  2. אומרים: סטיית התקן של` D_50` היא 5 גרם. במקום: סטיית התקן של התפלגות המשקל הממוצע של קבוצות בנות 50 דגים, היא 5 גרם.
כפי שאתם רואים: גם פשוט וגם יותר קצר.
אנו בהמשך נשתמש בשני המונחים (משתנה מקרי והתפלגות) לסירוגין. ההחלטה באיזה מהם לבחור בכל עת, מושפעת בעיקר משיקולים של פישוט וחידוד ההסבר.
יהיו גם מקומות שנעדיף להשתמש, בו זמנית, בשניהם.

 

הקשר בין משתנים מאותה משפחה

הסטטיסטיקאים מצאו שקיימים קשרים הדוקים בין משתנים מאותה משפחה.

הקשר החשוב ביותר הוא בין משתנה הבסיס (למשל, `D_1` ) לבין משתנה מורכב שהוא ממוצע של משתנה הבסיס (למשל, `D_25`  או `D_100`  או `D_625` ). למשתנה מקרי זה, נקרא לשם הקיצור משתנה הממוצע.

נמצאו שני קשרים:

(1) התוחלת של משתנה הממוצע שווה לתוחלת של משתנה הבסיס עצמו:

`E_(D_25)=E_(D_1)`

`E_(D_100)=E_(D_1)`

`E_(D_625)=E_(D_1)`

(2) ס”ת של משתנה הממוצע שווה לס”ת של משתנה הבסיס חלקי שורש גודל הקבוצה שממנה חושב הממוצע:

`Sigma_(D_25=(Sigma_(D_1))/sqrt(25)`

`Sigma_(D_100=(Sigma_(D_1))/sqrt(100)`

`Sigma_(D_625)=(Sigma_(D_1))/sqrt(625)`

ובשפת הסימולים:  `Sigma_(barx_n)=(Sigma_(x))/sqrt(n)`

מקרא
`X` – משתנה הבסיס
`n`   – גודל הקבוצה לחישוב הממוצע
`barx_n`  – משתנה הממוצע שחושב מקבוצה בגודל
`Sigma_x`  – סטיית תקן של משתנה הבסיס
`Sigma_(x_n` –  סטיית תקן של משתנה הממוצע

                  

 לדוגמא, אם סטיית התקן של `D_1`  היא 50 גרם, אזי:

סטיית התקן של  `D_25`  היא: `Sigma_(D_25)=50/(sqrt(25))=50/5=10`

סטיית התקן של `D_100`  היא: `Sigma_(D_100)=50/(sqrt(100))=50/10=5`  

וסטיית התקן של `D_625`  היא: `Sigma_(D_625)=50/(sqrt(625))=50/25=2`

 

תרשים 1.1 ממחיש כיצד עליה בגודל הקבוצה שממנה מחושב הממוצע גורם לקיטון בסטיית התקן (כיווץ ההתפלגות).

תרשים 1.1