최근 수정 시각 : 2022-05-08 22:34:34

F-분포

F 확률 분포에서 넘어옴
통계학
Statistics
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#4d4d4d><colcolor=#fff> 수리​통계학 기반 실해석학( 측도론) · 선형대수학 · 이산수학
확률론 사건 · 가능성 · 확률변수 · 확률분포( 표본분포 · 정규분포 · 이항분포 · 푸아송 분포 · 카이제곱분포 · t-분포 · z-분포 · F-분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙( 무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙
통계량 평균( 산술평균 · 기하평균 · 조화평균 · 멱평균 · 대수평균) · 기댓값 · 편차( 절대편차 · 표준편차) · 분산( 공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도
추론​통계학 가설 · 변인 · 추정량 · 점추정 · 신뢰구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도
통계적 방법 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석( 요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습( 군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타분석 · 모델링( 구조방정식)
기술​통계학 · 자료 시각화 도표( 그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 }}}}}}}}}

1. 개요2. 정의3. 분산비검정4. 성질5. 그래프6. 관련 문서

수식없이 설명하는 F분포

1. 개요

f분포(F-distribution 또는 Snedecor's F-distribution 또는 Fisher–Snedecor distribution)는 통계학에서 사용하는 연속 확률 분포(continuous probability distribution)로 분산 분석에 많이 사용한다.

독립적인 두 카이제곱분포에 관한 비로써 정의된다. 자유도는 분자에 해당하는 카이제곱분포의 자유도와 분모에 해당하는 카이제곱분포의 자유도에 의해 결정된다. 분산 비 검정, 분산 분석, 회귀 분석 등에 사용한다.

F-분포로 하는 검정(test)을 F-검정(F-test)이라고 한다.

2. 정의

[math(U_1\sim\chi^2_{\nu_1},\,U_2\sim\chi^2_{\nu_2})]이고 [math(U_1)]과 [math(U_2)]가 독립일 때 f분포를 다음과 같이 정의한다.

[math(F=\dfrac{U_1/\nu_1}{U_2/\nu_2}\sim F_{\nu_1,\,\nu_2})]

[math(\nu_1)]은 [math(U_1)](분자)의 자유도이고, [math(\nu_2)]는 [math(U_2)](분모)의 자유도이다.

한편, [math(\Large{F_{\nu_1,\;\nu_2,\;\alpha}})]는 [math(\Large X\sim{F_{\nu_1,\;\nu_2}})]에 대하여 [math(P[X\geq a]=\alpha)]가 되도록 하는 [math(a)]의 값을 일컫는다.

3. 분산비검정

분산비검정(variance ratio test)이란 다음과 같이 두 분산을 비교할 때 사용하는 방법이다.

카이제곱분포 [math(U_1=\dfrac{(n_1-1){s_1}^2}{{\sigma_1}^2}\sim\large{\chi^2_{n_1-1}})]과 [math(U_2=\dfrac{(n_2-1){s_2}^2}{{\sigma_2}^2}\sim\large{\chi^2_{n_2-1}})]에 대하여

[math(\begin{aligned}F&=\dfrac{U_1/\nu_1}{U_2/\nu_2}=\dfrac{\cfrac{\cancel{(n_1-1)}{s_1}^2}{{\sigma_1}^2\cdot\cancel{{\nu_1}} }}{\dfrac{\cancel{(n_2-1)}{s_2}^2}{{\sigma_2}^2\cdot\cancel{{\nu_2}} }}\\ \\&=\dfrac{{s_1}^2/{\sigma_1}^2}{{s_2}^2/{\sigma_2}^2}=\dfrac{{s_1}^2/{s_2}^2}{{\sigma_1}^2/{\sigma_2}^2}\sim \large{F_{n_1-1,\;n_2-1}}\end{aligned})]

[math((\because \nu_1=n_1-1,\;\nu_2=n_2-1))]

4. 성질

분모와 분자의 자유도가 서로 바뀌어 있는 두 [math(F)]분포에 대하여 다음과 같은 중요한 성질이 성립한다.

[math(\Large{F_{\nu_1,\;\nu_2,\;\alpha}}=\dfrac1{\Large{F_{\nu_2,\;\nu_1,\;1-\alpha} }})]

[증명]
두 [math(F)]분포 [math(X\sim\Large{F_{\nu_1,\;\nu_2}})]이고 [math(Y=\dfrac1X\sim\Large{F_{\nu_2,\;\nu_1}})]이 있을 때

[math(\begin{aligned}{\color{red}\Large P\left[X\geq{F_{\nu_1,\;\nu_2,\;\alpha}}\right]}&=\alpha\\\Large P\left[Y\geq{F_{\nu_2,\;\nu_1,\;1-\alpha}}\right]&=1-\alpha\end{aligned})]

두 번째 식을 변형하면

[math(\begin{aligned}{\Large P\left[\dfrac1Y\leq\dfrac1{{F_{\nu_2,\;\nu_1,\;1-\alpha} }}\right]}&=1-\alpha\\\rightarrow{\color{red}{\Large P\left[\dfrac1Y\geq\dfrac1{{F_{\nu_2,\;\nu_1,\;1-\alpha} }}\right]}}&=\alpha\end{aligned})]

빨간색 식끼리는 값이 [math(\alpha)]로 같으면서, [math(Y=\dfrac1X)]이므로 결국 다음 양변이 같을 수밖에 없다.

[math(\Large{F_{\nu_1,\;\nu_2,\;\alpha}}=\dfrac1{\Large{F_{\nu_2,\;\nu_1,\;1-\alpha} }})]


또한, [math(boldsymbol t)]분포를 제곱하면 분자와 분모의 자유도가 각각 1, [math(\boldsymbol \nu)]인 [math(\boldsymbol F)]분포가 된다.

[math(\begin{aligned}t&=\dfrac{Z}{\sqrt{U/\nu}}\sim t_\nu\\\rightarrow t^2&=\dfrac{Z^2/1}{U/\nu}\sim F_{1,\;\nu}\end{aligned})]

5. 그래프

파일:800px-F-distribution_pdf.svg.png 파일:800px-F_distributionCDF.png
확률 밀도 함수 누적 분포 함수

매개변수: 자유도 d1 > 0, d2 > 0

6. 관련 문서


분류