대학교 개발 커리/확률 및 통계학

확률및 통계학] 범주형 자료의 요약

UniCoti(유니코티) 2026. 3. 11.

1. 도수 분포표 (frequency table)

: 범주형 자료에서 범주와 그 범주에 대응하는 도수를 나열한 도표

 

도수 : 범주에 속하는 관측값의 개수

상대 도수 : 해당 범주의 도수 / 전체 자료의 수

 

도수 분포표

도수 분포표는 필연적으로 위 2개를 포함해야 함.

상대도수분포표 혹은 누적도수분포표에 대해서도 범주와 도수 2개 열이 있어야함.

1-1. 상대 도수 분포표 (relative frequency table)

상대도수 분포표

옆에다가 상대도수 열을 하나 추가하면 된다.

상대도수 계산식을 바탕으로 계산하고, 총합은 1.

1-2. 누적 도수 분포표 (cumulative frequency table)

누적 도수 분포

누적 도수 열에서는 기존 도수를 더해가면서 층층이 쌓아간다.

계급에 따라 상위(하위) n%인지 판단하는데 이점이 있다.

1-3. 누적 상대 도수 분포표 (cumulative relative frequency table)

 

누적상대도수

누적 상대 도수는 상대도수를 누적도수처럼 층층이 더해주면 된다.

2. 원형 그래프 (Pie Chart)

1. 원을 먼저 그리고

2. 상대도수에 따른 중심각을 계산한다 (상대도수 x 360)

Pie Chart

상대 도수가 전체에 따른 범주의 비율이기 때문에, 원의 중심각 360를 전체에 곱하면

중심각을 쉽게 찾을 수 있다. 상대도수 분포표에 열을 하나 추가해서 중심각을 찾는 방법도 있다.

3. 막대 그래프 (Bar Chart)

: 각 범주에서 도수 (혹은 상대도수)를 같은 폭의 막대형태로 나타냄.

Bar Chart

한 축 : 도수 (혹은 상대도수)

다른 축 : 범주

 

같은 폭인 이유는 이후 통계학 과정 중 면적 계산으로 인과관계를 찾는 부분이 있기 때문이다.

댓글