היסטגרמה

היסטגרמה

התייחסות לגילם של העובדים

גם הערכים שמקבל משתנה הגיל הם ערכים מספריים. אבל בכל זאת יש הבדל בין משתנה מספר הילדים לבין משתנה הגיל. במשתנה מספר הילדים, בין הערך הנמוך ביותר שהוא 0 לבין הערך הגבוה ביותר שהוא 4, יכולים להתקבל רק ערכים מסויימים, במקרה הזה, מספרים שלמים בלבד: 1, 2, 3, וזאת כיוון שאין אפשרות למצב של  2.78 ילדים, למשל. במשתנה הגיל, לעומת זאת, בין הערך הנמוך ביותר שהוא 20, לבין הערך הגבוה ביותר שהוא 60, יכולים להתקבל כל הערכים: אפשר להיות בגיל 33.25, או בגיל 45.5, ואפילו בגיל 27.357. לכן משתנה הגיל יקרא משתנה רציף. משתנה מספר הילדים יקרא משתנה בדיד.

מכיוון שבמשתנה רציף כמות הערכים האפשריים היא אינסופית לא נוכל ליצור טבלת שכיחויות שתכיל את כולם. לפיכך נאגד את הערכים למחלקות: את כל העובדים שבשנות העשרים לחייהם נאגד במחלקה 20-30, את אלה שבשנות השלושים לחייהם במחלקה 30-40, וכך הלאה. במקרה שלנו המחלקות הן בעצם קבוצות גיל.

המחלקה תופיע בטור הראשון של טבלת השכיחויות, ובטור השני תופיע השכיחות, כלומר מספר העובדים הנמצאים בכל מחלקת גיל. בטור השלישי נוסיף את השכיחות היחסית.

להלן טבלת השכיחויות המייצגת את התפלגות משתנה הגיל:

1

2

3

המחלקה
(הגיל)

השכיחות

השכיחות היחסית
(מעוגל)

20-30

5

17%

30-40

8

27%

40-50

10

33%

50-60

7

23%

סה"כ

30

100%

 

ההצגה הויזואלית של התפלגות של משתנה רציף תעשה באמצעות היסטוגרמה.

מהי היסטוגרמה?

היסטוגרמה היא גרף של עמודות צמודות זו לזו. לכל מחלקה יש עמודה משלה. יש עמודה לקבוצת הגיל 20-30, עמודה נפרדת לקבוצת הגיל 30-40, וכך הלאה. לכל עמודה יש גובה ויש רוחב.

כיצד נקבע רוחב העמודה?

הרוחב של העמודה הינו רוחב המחלקה, כלומר גודל הטווח של המחלקה. במקרה שלנו, הרוחב של כל מחלקה הוא 10, כיוון שהטווח של כל מחלקה הוא 10 שנים.

בין 20 ל-30 יש 10 שנים. בין 30 ל-40 יש 10 שנים, וכו'.

כיצד נקבע גובה העמודה?

כאן נצטרך לעשות חישוב קצר. מכיוון שלעמודה יש גם רוחב וגם גובה הרי שיש לה גם שטח, שהוא המכפלה של הגובה והרוחב. הסטטיסטיקאים החליטו שהשטח של העמודה יהיה השכיחות היחסית של קבוצת הגיל שאותה היא מייצגת. למשל עבור המחלקה 20-30, רוחב העמודה יהיה 10, ושטח העמודה יהיה 17. כעת נוכל לחשב את גובה העמודה: `(1.7=17/10)` .
גובה העמודה מכונה צפיפות.

לפני ציור ההיסטוגרמה נוסיף לטבלה עוד שני טורים: רוחב המחלקה (שהוא רוחב העמודה), וצפיפות (שהיא גובה העמודה).

ההיסטוגרמה תראה כך:

1

2

3

4

5

המחלקה
(הגיל)

השכיחות

השכיחות היחסית
(שטח העמודה)

רוחב המחלקה
(רוחב העמודה)

צפיפות
(גובה העמודה)
(טור 3 חלקי טור 4)

20-30

5

17%

10

`1.7 =17/10`

30-40

8

27%

10

`2.7=27/10`

40-50

10

33%

10

`3.3=33/10`

50-60

7

23%

10

`2.3=23/10`

סה"כ

30

100%

 

 

השטח הכולל של העמודות מסתכם ל – 100%.
עובדה זו חשובה, ונשתמש בה בהמשך כאשר נלמד על העקום הנורמלי.

סטטיסטיקה למתחילים

תוכן עניינים

נושאים נוספים

Loading data ...
Coin Compare
View chart compare
View table compare
שינוי גודל פונט
ניגודיות