글 개요
이번 포스팅은 히스토그램을 알아보겠습니다.
글 본문
히스토그램(Histogram)
히스토그램은 수치자료 특히 연속자료의 분포형태를 표시할 때 사용합니다.
계급의 상대도수를 사각형의 면적으로 표시합니다.
- 전체 면적 = 1
높이 = 상대도수/계급구간길이 = 밀도(density)
도수 = 범주가 가지고 있는 관측치의 개수
상대 도수 도수에 대한 각 변량의 비 특정 도수의 개수/총 도수
히스토그램의 y축은 밀도입니다.
취업율를 가지고 히스토그램을 그래보겠습니다.
10% ~ 40% -> 0.071
40% ~ 50% -> 0.143
80% ~ 100% -> 0.095
위 수치를 가지고 높이=밀도를 구해봅시다.
첫 번째 부터 구간은 30이고 상대도수는 0.071입니다. 그래서 0.071/30 = 0.0024
두 번째 구간은 10이며, 상대도수는 0.143입니다. 그래서 0.143/10 = 0.0143
세 번째 구간은 20입니다 상대도수는 0.095 그래서 0.095/20 = 0.0047
구해진 값들을 가지고 히스토그램을 그려보면
그래프를 해석해보자면 50% ~ 60%인 곳에 밀도가 가장 높습니다.
히스토그램은 구간을 어떻게 설정 하느냐에 따라 모양이 달라집니다.
'mathematics' 카테고리의 다른 글
Statistics - 막대그래프(Bar Chart) (0) | 2021.10.23 |
---|---|
Statistics - 자료의분류와 특성(범주형 자료 및 수치형 자료) (0) | 2021.10.23 |
Statistics - 표본추출 (0) | 2021.10.19 |
Statistics- 모집단(Population) 과 표본(Sample) (0) | 2021.10.19 |
기초수학 - 순열과 조합 및 확률 (0) | 2021.09.27 |
댓글