Python Statistics 모듈
statistics 모듈은 평균, 중앙값, 기타 기술 통계를 계산하는 간단한 도구를 제공합니다.
이 모듈은 Python 3.4에서 추가되었습니다.
import statistics
숫자 몇 개에 대해 흔한 계산이 필요할 때 statistics를 사용합니다. 고급 데이터 분석에는 NumPy나 pandas가 더 강력하지만, 표준 라이브러리는 아닙니다.
mean()
import statistics
scores = [80, 90, 95, 100]
print(statistics.mean(scores))
91.25
fmean은 부동소수점 평균을 반환하며, 숫자 데이터에서는 더 빠른 경우가 많습니다.
import statistics
print(statistics.fmean([1, 2, 3]))
2.0
median()
import statistics
values = [1, 3, 5, 100]
print(statistics.median(values))
4.0
mode()
mode는 가장 자주 나온 값을 반환합니다.
import statistics
print(statistics.mode(['python', 'python', 'rust']))
python
가장 자주 나온 값이 여러 개면 multimode가 모두 반환합니다.
import statistics
print(statistics.multimode(['red', 'blue', 'red', 'blue']))
['red', 'blue']
stdev()
stdev는 표본 표준편차를 계산합니다.
import statistics
print(round(statistics.stdev([2, 4, 4, 4, 5, 5, 7, 9]), 2))
2.14
빈 데이터 처리하기
대부분의 함수는 빈 입력에 대해 StatisticsError를 발생시킵니다.
import statistics
try:
statistics.mean([])
except statistics.StatisticsError as error:
print(type(error).__name__)
StatisticsError