대학교 개발 커리/확률 및 통계학

확률 및 통계학] 분산된 정도에 대한 여러 척도

UniCoti(유니코티) 2026. 3. 25.

1. 분산과 표준편차

분산과 표준편차는 사실상 같은 지표라고 봐도 무방합니다.

분산에 제곱근을 취한 것이 표준편차인데, 이들은 모두 데이터들이 얼마나 퍼져있는지를 나타냅니다.

 

모분산

분산은 보통 이렇게 구합니다.

 

데이터마다의 편차를 제곱해서 더하고, 자료의 수로 나눠준 값이죠.

편차를 제곱하는 이유는 부호를 없애기 위함이며, 제곱으로 인해 값이 증폭되기에

모분산에 제곱근을 씌워 표준편차라는 원래 데이터에 조금 더 적합한 값으로 만들어줍니다.

표본분산

특정 표본에 대해서 분산을 구하고 싶을때는 표본 분산 식을 활용합니다.

이를 전개해서 다른 식으로 바꿀 수 있으며 전개식은 위와 같습니다.

2. 범위(Range)

가장 간단한 지표입니다. 최대값에서 최소값을 빼서 값의 전체적인 분포가

어느정도 범위 내에 있는지를 확인할 수 있습니다.

3. 사분위수범위(Interquartile Range : IQR)

사실 꼭 사분위수 범위를 사용해야하는 것은 아닙니다.

N 분위수 범위라는 개념이 있는데 그 중 N에 4를 대입한 주제입니다.

구하는 법

보통 이렇게 Q_n이라는 기호로 n분위수를 구하고

최대에서 최소를 빼는 방향으로 구합니다.

 

n x p를 이용해서 한 칸의 범위를 알 수 있습니다.

소수면 그 사이에 오는 것을, 정수면 +1 한값을 사용합니다.

댓글