728x90
Chi-squared test / 카이제곱 검정
목표 : Chi-squared test란 무엇인가 ?
Chi-squared test :
교차 분석 (카이제곱) 가설 검정 - 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검정
독립변수, 종속변수 둘 다 범주형
sum((Xsq$observed - Xsq$expected)^2 / Xsq$expected)
절차
가설 설정 ≫ 유의수준 결정(기본은95%) ≫ 검정통계량 계산
≫ 귀무가설 채택여부 판단 ( p값 > 0.05 : 귀무가설 채택 ) ≫ 검정결과 진술
1) 일원 카이제곱
(변인 단수) - 적합성(선호도) - 교차분할표 X
- 관찰도수가 기대도수와 일치하는지 검정하는 방법
- 종류: 적합도/선호도 검정
- 범주형 변수가 한가지 자료임.
import pandas as pd
import scipy.stats as stats
stats.chisqure(관찰빈도sample, 기대빈도sample)
2) 이원 카이제곱
(변인 복수) - 독립성(동질성) - 교차분할표 O
두 집단 이상에서 각 범주(집단) 간의 분포/비율이 서로 동일한가 검정하는 방법
예시)
귀무가설 : 교육방법에 따른 교육생들의 만족도에 차이가 없다 (동질이다)
대립가설 : 교육방법에 따른 교육생들의 만족도에 차이가 있다
import pandas as pd
import scipy.stats as stats
ctab = pd.crosstab(index=data['sample1'],columns=data['sample2'])
print(ctab)
chi, p, df, ex = stats.chi2_contingency(ctab)
msg = "chi2 : {}, p-value : {}, df : {}".format(chi,p,df)
print(msg)
728x90
'Programming > Python' 카테고리의 다른 글
통계 / Python / T- test / T검정 개념 (0) | 2021.03.13 |
---|
댓글