본문 바로가기
mathematics

Statistics - 히스토그램(Histogram)

by 앵남(Andy) 2021. 10. 23.

글 개요

이번 포스팅은 히스토그램을 알아보겠습니다. 

 

글 본문

히스토그램(Histogram)

히스토그램은 수치자료 특히 연속자료의 분포형태를 표시할 때 사용합니다. 

계급의 상대도수를 사각형의 면적으로 표시합니다. 

  - 전체 면적 = 1 

높이 = 상대도수/계급구간길이 = 밀도(density)

도수 = 범주가 가지고 있는 관측치의 개수 

상대 도수 도수에 대한 각 변량의 비 특정 도수의 개수/총 도수

히스토그램의 y축은 밀도입니다. 

취업율를 가지고 히스토그램을 그래보겠습니다.

10% ~ 40% -> 0.071 

40% ~ 50% -> 0.143

80% ~ 100% -> 0.095 

위 수치를 가지고 높이=밀도를 구해봅시다. 

첫 번째 부터 구간은 30이고 상대도수는 0.071입니다.  그래서 0.071/30 = 0.0024

두 번째 구간은 10이며, 상대도수는 0.143입니다. 그래서 0.143/10 = 0.0143

세 번째 구간은 20입니다 상대도수는 0.095 그래서 0.095/20 = 0.0047 

구해진 값들을 가지고 히스토그램을 그려보면

히스토그램

그래프를 해석해보자면 50% ~ 60%인 곳에 밀도가 가장 높습니다. 

히스토그램은 구간을 어떻게 설정 하느냐에 따라 모양이 달라집니다. 

댓글