최근 수정 시각 : 2022-08-08 22:14:45

몬티 홀 문제


파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
스타크래프트 맵에 대한 내용은 몬티홀(스타크래프트) 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
통계학
Statistics
{{{#!wiki style="word-break: keep-all; margin:0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
{{{#!wiki style="letter-spacing: -1px"
<colbgcolor=#efefef> 자료 시각화 도표( 그림그래프 · 막대그래프 · 선 그래프 · 원그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점
수리통계학 확률론 사건 · 가능성 · 확률변수 · 확률분포( 표본분포 · 정규분포 · 이항분포 · 푸아송 분포 · 카이제곱분포 · [math(t)]분포 · [math(z)]분포 · [math(F)]분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙( 무한 원숭이 정리 · 던파확률의 법칙) · 중심극한정리
통계량 평균 · 기댓값 · 편차( 절대편차 · 표준편차) · 분산( 공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도
통계적방법 추론 가설 · 변인 · 추정량 · 점추정 · 신뢰구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계
방법론 회귀 분석 · OLS · 분산분석 · 주성분 분석( 요인 분석) · 시계열분석 · 패널분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습( 군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 }}}}}}}}}}}}
영화 《21》에서 다룬 몬티 홀 문제

1. 개요2. 바꾸는 쪽이 더 높은 이유3. 추가 설명
3.1. 경우의 수3.2. 확률론에 따른 설명3.3. 레슬링 선수로 비유해보기3.4. 선택지를 늘려보기3.5. 꽝을 찾는 식으로 생각해보기3.6. 프로그램에 의한 증명3.7. 몬티 홀의 입장에서 생각해보기3.8. 기타 다른 설명3.9. 그럼에도 헷갈린다면
4. 사람들의 오해
4.1. 룰에 대한 오해4.2. 경우의 수와 확률4.3. 사회자가 문 너머를 인지 못한 채 연다면?
5. 편견 있는 몬티6. 비슷한 문제들
6.1. 야바위 문제6.2. 아들 딸 문제6.3. 카드 뽑기 문제
7. 여담8. 대중 매체에서의 등장9. 관련 문서

[clearfix]

1. 개요

Suppose you’re on a game show, and you’re given the choice of three doors. Behind one door is a car, behind the others, goats. You pick a door, say #1, and the host, who knows what’s behind the doors, opens another door, say #3, which has a goat. He says to you, "Do you want to pick door #2?" Is it to your advantage to switch your choice of doors?

당신이 한 게임 쇼에 참여하여 세 문 가운데 하나를 고를 기회가 주어졌다고 생각해봐라. 한 문 뒤에는 자동차가 있으며, 다른 두 문 뒤에는 염소가 있다. 당신은 1번 문을 고르고, 문 뒤에 무엇이 있는지 아는 사회자는 염소가 있는 3번 문을 연다. 그는 당신에게 "2번 문을 고르고 싶습니까?"라고 묻는다. 당신의 선택을 바꾸는 것은 이득이 되는가?
Monty Hall problem

'몬티 홀'이라는 미국/캐나다 TV 프로그램 사회자가 진행하던 미국 오락 프로그램 《Let's Make a Deal》에서 유래한 확률 문제.

조건부 확률을 다루는 문제 중에서 가장 유명해서 구글에 몬티 홀이라고 검색해도 사람 대신 문제가 먼저 나올 정도이다. 최초로 수학 문제로서 제시된 것은 1975년이고, 메릴린 보스 사반트[1]가 1990년에 《퍼레이드》라는 잡지의 독자의 질문을 해결해주는 칼럼 '사반트에게 물어보세요'에서 이 문제를 다루면서 유명해졌다. 위의 원문은 해당 칼럼에 실린 문제를 그대로 가져온 것이며, 상품의 종류 등의 디테일은 문제에 따라 조금씩 바뀐다.

질문은 간단하나 결과는 직관을 전면 부정해버리고, 그것이 심지어 사실이라는 것, 결과에 대한 증명을 좀처럼 쉽게 이해하기 힘들다는 점 때문에 수많은 사람들에게 충격을 주었다. 수학 좀 한다는 학자들도 반론을 내밀었을 정도.

몬티 홀 문제는 일반적으로 다음의 룰을 통해 진행된다.
  • 문 3개가 있다. 한 문 뒤에는 자동차가 있고 나머지 두 문 뒤에는 염소가 있다. 참가자는 이 상황에서 문을 하나 선택하여 그 뒤에 있는 상품을 얻는다.
  • 참가자가 어떤 문을 선택하면 사회자는 나머지 두 문 중에 염소가 있는 문 한 개를 열어 참가자에게 그 문에 염소가 있다고 확인시켜준다.
  • 그 후 사회자는 참가자에게 선택한 문을 닫혀있는 다른 문으로 선택을 바꿀 기회를 준다.

고전적인 몬티홀 문제는 이 게임을 수학적으로 풀기 위해 다음과 같은 전제를 사용한다.[2]
  • 사회자는 자동차가 어느 문 뒤에 있는지 알고 있다.[3]
  • 사회자는 염소가 들어 있는 문을 임의로 선택한다.[4]

간혹 이 문제를 '바꾸면 1/2이고, 안 바꾸면 1/3이다.'라는 식으로 잘못 전해듣고 그럼 나머지 1/6은 어디갔냐고 하는 사람들이 있는데, 원문은 2/3와 1/3이다.
대부분 사람들의 직관적인 생각에서는 선택을 바꾸든 바꾸지 않든 확률은 똑같이 1/2일 것이다. 당신이 최초에 한 선택 뒤에 염소가 있든 승용차가 있든, 염소가 있는 문은 한 개 또는 두 개가 남아있을 것이다. 사회자는 그걸 열면 그만이고, 남은 문은 무조건 염소 아니면 승용차일 테니 바꾸나 바꾸지 않으나 똑같을 것이다.

1/2이 아니라 2/3가 되는 이유에 대해서 직관적으로 이해가 되지 않는다고 좌절하지 말자. 이 문제가 대중적으로 가장 화제가 되었던 1990년도에 기네스 북에 높은 IQ로 등재된 사반트의 칼럼 '사반트에게 물어보세요'에서 사반트가 이 문제에 대한 정답(2/3)을 제시했을 때 약 만 통의 항의 편지를 받았고 그 중 약 천 통은 수학이나 공학에서 박사학위를 가진 사람들이 보낸 것이었다. #

사실 해답을 보기 전까진 대부분의 사람들은 직관적으로 선택을 유지하든 바꾸든 직관적으로 50%의 확률이라고 생각해버린다. 해답을 보고 '논리적으로' 이해는 했음에도 여전히 직관적으로는 왜 50%의 확률이 아닌지 쉽게 납득하지 못하는 경우도 많을 정도로 인간의 직감과 논리는 많이 동떨어져 있다는 걸 보여주는 예시이기도 하다.

이처럼 몬티홀 문제는 답이 1/2이냐 2/3이냐에 대한 논쟁으로 대중들에게 많이 알려졌다. 답이 2/3인 것으로 판명이 난 이후에도 악마 몬티(Monty from Hell), 천사 몬티(Angelic Monty), 편견 있는 몬티[5]와 같이 사회자의 마음가짐에 조건을 추가하거나 몬티 홀 문제를 게임 이론과 접목시켜 새로운 형태로 만들어내는 등 기존 문제에 대해 다양한 파생 문제들이 만들어지기도 했다. 이에 대해 본 문서에서는 기존의 "고전적인 몬티 홀 문제"를 중심으로 다루고 있다. 전문적인 문제의 정의와 풀이, 이를 이용한 변형 문제 등과 관련해서는 이 논문 혹은 영문 위키피디아를 참고바란다.

2. 바꾸는 쪽이 더 높은 이유

조건부 확률이 적용되기 때문이다. 즉, "사회자는 자동차와 염소가 어떤 문에 있는지 알고 있다"는 전제조건과, 이에 따라 "사회자가 자동차가 있는 문을 여는 일은 발생하지 않는다"는 종속조건이 실제 확률에 영향을 미치기 때문이다.

이 문제에서 사회자가 염소 문을 하나 열었을 때 선택한 문을 바꾸는 행위는 염소 확률과 자동차 확률을 뒤바꾸게 된다. 사회자가 문을 열지 않은 처음 선택에서는 염소를 고를 확률이 더 높기 때문에, 몬티 홀 딜레마에서는 선택을 바꿔야 더 차를 얻을 확률이 높아진다. 만약 당신이 무조건 결정을 바꾼다고 결심을 하고 처음에 염소를 골랐는데 결심대로 결정을 바꾼다면 차를 얻지만, 당신이 처음에 차를 골랐는데 결정을 바꾼다면 당신은 염소를 얻는다. 처음에 염소를 고르고 바꾸면 차를 얻고 차를 고르고 바꾸면 염소를 얻는 것이다. 결정을 바꾼다는 전제하에 2/3 확률로 염소를 고르면 차를 얻으니까 처음 염소를 뽑을 확률이 높으니 무조건 바꿔야한다! 결정을 바꾸지 않는다면 당신은 맨 처음 차를 뽑았을 확률인 1/3을 그대로 들고 가는 것이기 때문에 더 손해를 보게 된다.

몬티 홀 딜레마에서 가장 중요하게 생각해야 하는 것은, 이때의 확률은 문을 바꿨을 경우 vs 문을 안 바꿨을 경우이다. 애초에 처음부터 하나의 문이 열려 있고, 나머지 두 문 중 하나를 선택해야 하는 것이라면 확률은 50%가 맞다(열린 문은 선택지에서 배제되므로, 사실상 두 문 중에 하나를 고르는 것이기 때문). 즉, 양자택일의 행위가 아닌, 문을 바꾸는 행위(정확히는 내가 하나의 문을 선택하고 있음으로써 사회자가 꽝 문을 열 때 내가 선택했던 문을 열지 못함으로써 변동하는 확률)에서 파생되는 확률이 66.6%이므로 둘은 엄연히 다르다. 이 미묘한 차이를 직관적으로 이해하기가 힘들기 때문에 착오가 벌어지는 것이라고 이해해야 한다. 즉, 확률의 조건이 되는 사건 두 개(첫번째 선택과 두 번째 선택)가 얽히느냐, 얽히지 않느냐에 따라 확률이 변동한다.

직관적으로 이해하기에 양자택일과 문을 바꾸는 행위간의 확률에 차이가 있다는 것이 이해가 쉽지 않다. 다른 것은 놔두고 문을 선택한다는 '사실'만 두고 보면 두 행위는 같은 것이기 때문이다. 때문에 확률도 동일하다고 착각하기가 쉽다.

정리하면 다음과 같다.

1. 나는 문을 무조건 바꾼다
  1. 처음에 염소가 있는 문을 선택할 확률 = 2/3

    1. - 사회자는 무조건 염소가 있는 문을 선택해서 열 수 밖에 없다 = 1/1
      - 문을 바꿨을 경우 자동차가 있을 확률 = 1/1
      - 2/3 * 1/1 * 1/1 = 2/3

    ii. 처음에 자동차가 있는 문을 선택할 확률 = 1/3

      a) 사회자가 염소가 있는 문 중 첫번째 것을 선택할 확률 = 1/2

        - 문을 바꿨을 경우 자동차가 있을 확률 = 0/1
        - 1/3 * 1/2 * 0/1 = 0/6

      b) 사회자가 염소가 있는 문 중 두번째 것을 선택할 확률 = 1/2

        - 문을 바꿨을 경우 자동차가 있을 확률 = 0/1
        - 1/3 * 1/2 * 0/1 = 0/6

      - 0/6 + 0/6 = 0/6
- 2/3 + 0/6 = 2/3
하여, 내가 문을 무조건 바꿀 때 자동차를 선택할 확률은 2/3이 된다.

2. 나는 문을 무조건 바꾸지 않는다.
  1. 처음에 염소가 있는 문을 선택할 확률 = 2/3

    1. - 사회자는 무조건 염소가 있는 문을 선택해서 열 수 밖에 없다 = 1/1
      - 문을 바꾸지 않았을 경우 자동차가 있을 확률 = 0/1
      - 2/3 * 1/1 * 0/1 = 0/3

    ii. 처음에 자동차가 있는 문을 선택할 확률 = 1/3

      a) 사회자가 염소가 있는 문 중 첫번째 것을 선택할 확률 = 1/2

        - 문을 바꾸지 않았을 경우 자동차가 있을 확률 = 1/1
        - 1/3 * 1/2 * 1/1 = 1/6

      b) 사회자가 염소가 있는 문 중 두번째 것을 선택할 확률 = 1/2

        - 문을 바꾸지 않았을 경우 자동차가 있을 확률 = 1/1
        - 1/3 * 1/2 * 1/1 = 1/6

    - 1/6 + 1/6 = 2/6 = 1/3
- 0/3 + 1/3 = 1/3
하여, 내가 문을 무조건 바꾸지 않을 때 자동차를 선택할 확률은 1/3이 된다.

3. 추가 설명

직관에 따르면 이렇게 전개된다.
  • 맨 처음 자신이 선택한 문이 정답일 확률: 맨 처음 자신이 고른 것은 뭐가 정답이고 뭐가 꽝인지 모르는 문 3개 중에서 1개를 선택했기 때문에, 그것이 정답일 확률은 1/3이다.
  • 사회자가 정답이 아닌 문을 공개한 후, 자신이 선택하지 않은 남은 문이 정답일 확률: 하지만 사회자가 정답이 아닌 문 즉 꽝인 문을 1개 공개해버리면, 남은 문은 2개가 된다. 따라서 자신이 선택하지 않은 남은 문은 정답일 확률이 1/2이다.

고로 맨 처음 자신이 선택한 문이 정답일 확률은 1/3이지만, 사회자가 정답이 아닌 문을 공개한 후 자신이 선택하지 않은 남은 문이 정답일 확률은 1/2이다. 여기서 문제가 발생한다. 확률의 총합은 1이 되어야 하는데, 직관대로 흘러가면 총합이 5/6밖에 안된다.

여기서 사람들이 헷갈려 하는 것이, '사회자가 정답이 아닌 문을 공개한 순간'부터 맨 처음 자신이 선택한 문이 정답일 확률도 똑같이 2분의 1이 된 것이 아니냐고 생각한다. 사람들이 이러한 논리적인 오류를 범하는 이유는 자신이 맨 처음 어떤 문을 선택했느냐에 따라 사회자가 공개하는 문이 달라진다는 것을 간과하기 때문이다. 정확히는 바꾼 문이 정답일 확률이 아니라 내가 처음에 고른 문이 오답일 확률이라고 말하는 게 더 직관적이다.

만약 내가 선택을 한 뒤 사회자가 정답이 아닌 문을 공개하는게 아니라, 맨 처음부터 정답이 아닌 문을 공개하고 문 2개 중 하나를 선택한다면 확률은 완벽하게 1/2이다. 하지만 중요한 점은 내가 맨 처음에 골랐을 때 확률이 1/3이었다는 것이다. 그럼 내가 고르지 않은 나머지 두 문에 차가 있을 확률은 2/3이다. 그중 하나의 문을 열어도 그 두 문 중에 차가 있을 확률은 여전히 2/3이다.

3.1. 경우의 수

파일:Monty_Hall_a.gif
위 사진은 '정답이 아닌 것이 공개된 후 반드시 선택을 바꾼다'는 전제하에 가능한 경우의 수들이다.

그 결과를 보면 알겠지만, '맨 처음 정답을 선택했을 시'(선택1)에는 최종적으로는 꽝을 선택하게 된다. 하지만 '맨 처음 꽝을 선택했을 시'(선택2, 3)에는 최종적으로는 정답을 선택하게 된다. 즉 아이러니하게도 반드시 선택을 바꾼다는 전제하에는, 처음에 꽝을 골라야만 최종적으로 정답을 선택하게 된다. 그리고 이 때 처음에 꽝을 고를 확률은 2/3다.

반대로 선택을 바꾸지 않는 경우엔, 처음부터 정답을 골라야 한다는 걸 알 수 있다. 이 경우의 확률은 계산할 것도 없이 1/3.

결론은 '선택을 무조건 바꾸기로 했을 때는 처음에 꽝을 골라야 하며, 선택을 무조건 바꾸지 않기로 했을 때는 처음에 정답을 골라야 한다. 전자의 확률은 2/3, 후자의 확률은 1/3이니 선택을 무조건 바꾸는 쪽이 더 유리하다.'

3.2. 확률론에 따른 설명

이를 확률론적으로 설명하는 방법으로는 베이즈 정리를 이용하는 방법이 있다.

참가자가 고른 문을 A, 나머지 두 문을 B와 C라고 하고, "사회자가 A 문 제외의 문을 열어주고 염소가 있음을 보여주는 사건"을 D라고 하자.
우리가 구하고자하는 것은 사건 D가 일어난 상태에서 A 문에 자동차가 있는 사건(이하 사건 A)의 조건부 확률, 즉 P(AD)\displaystyle P(A|D)이다. 이제 베이즈 정리에 따라 해당 사건의 역사건, 즉 어떤 문 X 안에 자동차가 있을 때 사회자가 C 문을 여는 사건(D|X)을 생각해보자.

사회자는 A 문을 열 수 없고 B, C 중 하나만을 고를 수 있으며, 염소가 있는 문을 열어줘야 한다는 목적이 있는 상태이므로 각각의 확률은 이하와 같다.
  • 만약 자동차가 A에 있다면 사회자는 B와 C문 중 하나를 골라 열어줄 것이다. 2가지 선택지 중 하나를 무작위로 고르는 확률이므로 P(DA)=12\displaystyle P(D|A) = {1 \over 2}.
  • 만약 자동차가 B에 있다면 사회자는 A, B문을 열 수 없으므로 C문을 열 수밖에 없다. 즉 P(DB)=1\displaystyle P(D|B) = 1.
  • 만약 자동차가 C에 있다면 사회자가 C문을 여는 일은 일어날 수 없다. 즉 P(DC)=0\displaystyle P(D|C) = 0.

베이즈 정리에 의해 어떤 조건부 사건이 일어날 확률은 모든 역사건의 가짓수 중 해당 사건의 역사건이 일어날 확률과 같다. 따라서

P(AD)=P(DA)P(DA)+P(DB)+P(DC)=0.50.5+1+0=13\displaystyle P(A|D) = {P(D|A) \over P(D|A) + P(D|B) + P(D|C)} = {0.5 \over 0.5 + 1 + 0} = {1 \over 3}
P(BD)=P(DB)P(DA)+P(DB)+P(DC)=10.5+1+0=23\displaystyle P(B|D) = {P(D|B) \over P(D|A) + P(D|B) + P(D|C)} = {1 \over 0.5 + 1 + 0} = {2 \over 3}

가 되어 B에 차가 있을 확률이 2배 더 높다.

베이즈 정리와는 엄밀하게 말해서 다르지만, 베이즈 정리로부터 출발하는 베이즈 통계학(Bayesian statistics)의 관점에서 이를 직관적으로 표현할 수도 있다. 즉, 세 개의 문 뒤에 있는 것이 자동차인지 염소인지 전혀 모르는 상황보다는, 적어도 특정한 한 개의 문 뒤에 있는 것이 염소임을 확실히 알게 된 상황이 보다 많은 사후적 정보를 얻은 경우이므로, 자신의 선택 또한 업데이트해야 한다는 논리이다.

3.3. 레슬링 선수로 비유해보기

소설 < 비데리 논 에쎄: 무한대로의 모험>에 나온 비유로, 당신은 3명의 레슬링 선수 중 한 명을 무작위로 선택하여 시합에 내보낸다. 사회자는 당신이 선택하지 않은 2명의 선수에게 실력 검증을 실시하여 시합 능력이 더 뛰어난 선수를 남기고 다른 선수를 탈락시킨다. 그런 다음 당신에게 선택을 바꿀 기회를 준다. 당신은 당신이 무작위로 선택한 선수를 신용할 것인가? 사회자가 엄선한 선수로 선택을 바꿀 것인가? 당연히 선택을 바꾸는 게 유리하다.

여기서 키워드는 "엄선"이란 표현에 있다. 엄선했다는 것은 사회자가 무작위로 고르지 않았음을 의미한다. 레슬링 선수는 문, 실력 검증으로 한 선수를 탈락시키는 것은 염소가 든 문을 열어 보이는 행위에 대한 비유이며, 사회자가 열지 않은 문은 무작위로 남겨진 것이 아니라 엄선된 문인 것이다. 바로 이 점이 당신이 고른 문과 사회자가 고른 문(사회자가 열지 않은 문) 사이의 확률이 달라지는 원인이다. 왜 무작위가 아니라 "엄선된 문"이라고 하냐면, 당신이 처음 고른 문에 자동차가 없을 경우 사회자는 남은 2개의 문 중에서 자동차가 있는 문을 피해서 문을 열어야 하기 때문이다. 따라서 무작위로 문을 고르는 것이 아니며, 사회자는 어떤 문을 열고 어떤 문을 남길지 아무렇게나 결정해서는 안 된다.[6]

물론 위 논리는 당신이 처음에 고른 문에 자동차가 있을 경우엔 완전히 무용지물이 된다. 그럴 경우 사회자는 염소가 있는 2개의 문 가운데서 아무거나 골라도 되기 때문이다. 그러나 이미 알다시피, 당신이 처음 고른 문에 자동차가 있을 확률은 3분의 1밖에 되지 않는다. 즉 위 논리가 살아남아 적용될 확률이 3분의 2이며, 그렇기 때문에 선택을 바꿨을 경우 그 문에 자동차가 있을 확률이 3분의 2인 것이다.

다시 레슬링 선수 비유로 돌아와서, 3명의 선수 중 가장 강한 한 선수가 있다고 할 때 그 선수가 당신이 처음 고른 선수일 확률은 3분의 1밖에 되지 않는다. 즉, 가장 강한 선수는 아마도 당신이 고르지 않은 두 선수 중 한 명일 텐데, 마침 사회자가 고맙게도 두 선수 중 더 강한 한 명을 남겨준 것이다. 그러니 당신은 그냥 땡큐를 외치며 선택을 바꾸면 된다.

3.4. 선택지를 늘려보기

파일:몬티홀 100 4.jpg
도박마 28권 303화 배틀쉽 편. 몬티 홀 문제를 비틀어 직감과 논리가 다른 경우를 설명하고 있다.
위의 설명을 이해한다 하더라도 왜 50:50이 되지 않는지 직관적으로는 와닿지 않을 것이다. 이럴 때는 문이 3개가 아니라 100개라고 생각하면 이해하기 편해진다.

문이 100개가 있으며 정답인 문은 1개 뿐이다. 자신이 맨 처음 100개 중 하나를 선택했을 때 그것이 정답일 확률은 당연히 1/100. 하지만 사회자가 자신이 선택하지 않은 99개의 문 중 98개의 문을 열어서 꽝임을 보여주고 1개의 문을 남겨두었다. 현재 닫혀있는 문은 총 2개로, 자신이 맨 처음 선택한 문과 사회자가 열지 않은 문 1개이다. 이때 문을 다시 선택한다면 그것이 정답일 확률은 1/2. 아직도 원래 문을 지키고 싶은가? 직관적으로 뭔가 상당히 무모해 보이지 않는가? 더욱 쉽게 말하자면 자신이 100개중 무작위로 고른 1개의 문, 사회자가 남겨놓은 다른 1개의 문. 둘중 어느 문이 정답일 가능성이 높겠는가?

문이 몇 개가 되든 몬티홀 문제의 핵심은 바로 단 2개의 문만을 마지막에 남겨둔다는 점이다. 문 100개 중 하나를 처음 선택했을 때 정답일 확률은 1/100이지만, 2개만 남겨진 상태에서 선택하면 확률은 1/2이 된다. . 따라서 마지막에 선택을 바꾸는 것은 '처음에 정답을 골랐다면 → 꽝'이고 '처음에 꽝을 골랐다면 → 정답'으로 정오답을 반전시키는 기능을 가진다. 여기가 바로 핵심이다. 즉, 마지막에 바꿨을 때 '정답'일 확률 = 맨 처음에 '꽝'을 고를 확률로 동일하게 만들어 주는 것이 바로 몬티 홀 문제의 정체다. 따라서 '선택을 바꿀 경우에' 정답일 확률이 99%가 된다. 여기서 사회자의 개입을 제외하고 두 개의 문 중 하나를 선택하라고 하는 것으로 사람들이 착각하기에 확률이 동일하다고 느끼는 것이고, 내지는 사회자가 다른 문들을 연 순간 자신의 첫 번째 선택이 정답일 확률이 바뀐다는 착각에 쉽게 빠진다. 처음 선택을 한 순간 정답일 확률은 1%, 오답일 확률은 99%로 고정되어 있다. 아무것도 하지 않는다면 그대로 1% 확률을 유지하는 꼴이 된다. 이 상태에서 사회자는 아주 친절하게 오답일 확률을 정답일 확률로 전환 시켜주는 것이다.

여기서 얻은 직감을 고스란히 문 3개짜리 문제로 가져오면 된다. 문이 3개인 몬티홀 문제 역시 맨 처음 꽝을 고를 확률이 2/3므로 마지막에 선택을 바꿨을 때 정답일 확률도 2/3다.

3.5. 꽝을 찾는 식으로 생각해보기

몬티 홀 문제를 정답인 문을 찾는 게임이 아니라, 꽝인 문을 찾는 게임이라고 이해해 보자. 게임 참가자가 꽝인 문을 찾는다면, 주최자인 몬티 홀은 게임의 규칙 상 당연하게 다른 꽝인 문을 보여줄 수밖에 없으며, 여기서 게임 참가자는 기계적으로 '바꾼다'를 선택하면 결과는 당첨일 수밖에 없다. 반면 처음에 정답인 문을 찾는다면, 당연히 남은 문들은 꽝인 문일 수밖에 없다.

즉 게임 자체를 '꽝인 문 찾기(+ 그리고 몬티 홀이 바꿀 기회를 줬을 때 무조건 '바꾸기'를 선택하기)'인 게임이라고 이해한다면, 정답이 아닌 문을 고를 확률은 3분의 2, 맞는 문을 찾을 확률은 3분의 1이 된다.

3.6. 프로그램에 의한 증명

컴퓨터를 이용해서 직접 증명도 가능하다.
[ 펼치기 · 접기 ]
#!syntax java
public class Monty Hall problem {
    public static void main(String[] args) {
        int normal_win_rate=0; // 바꾸지 않아서 이긴 횟수
        int normal_lose_rate=0; // 바꾸지 않아서 진 횟수
        int change_win_rate=0; // 바꿔서 이긴 횟수
        int change_lose_rate=0; // 바꿔서 진 횟수

        for(int i=0;i<100000;i++){ // 총 10만 번 반복한다.
            int reward = (int)(Math.random()*3+1); // 주최자는 1~3중 정답을 하나 숨김
            int answer = (int)(Math.random()*3+1); // 참가자는 1~3중 하나를 고름

            /*이때 주최자는 염소를 고른 뒤 참가자에게 바꿀지 말지 제안한다.*/
            
            //주최자는 참가자의 답과 보상이 아닌 것을 택함
            int val = (int)(Math.random()*3+1);
            while(reward == val || answer == val){
                val = (int)(Math.random()*3+1);
            }

            //바꾸지 않았을 시
            if(reward == answer) normal_win_rate++; //바꾸지 않아서 이겼을 경우 1승 추가
            else normal_lose_rate++; //바꾸지 않아서 졌을 경우 1패 추가

            //바꿨을 시
            int change = (int)(Math.random()*3+1);
            while(val == change || answer == change){ //이때 참가자는 바꾸기로 결정
                change = (int)(Math.random()*3+1);
            }
            if(reward == change) change_win_rate++; //바꿔서 이겼을 경우 1승 추가
            else change_lose_rate++; //바꿔서 졌을 경우 1패 추가
        }

        System.out.println("normal_win_rate : "+normal_win_rate); // 바꾸지 않아서 이긴 횟수 출력
        System.out.println("normal_lose_rate : "+normal_lose_rate); // 바꾸지 않아서 진 횟수 출력
        long normal_rate = (normal_win_rate*100)/(normal_win_rate+normal_lose_rate); //확률계산
        System.out.println("rate : "+normal_rate+"%"); //바꾸지 않아서 이길 확률
        System.out.println();

        System.out.println("change_win_rate : "+change_win_rate); // 바꿔서 이긴 횟수 출력
        System.out.println("change_lose_rate : "+change_lose_rate); // 바꿔서 진 횟수 출력
        long change_rate = (change_win_rate*100)/(change_win_rate+change_lose_rate); //확률계산
        System.out.println("rate : "+change_rate+"%"); //바꿔서 이길 확률
    }
}
출력 결과
normal_win_rate : 33540
normal_lose_rate : 66460
rate : 33%

change_win_rate : 66460
change_lose_rate : 33540
rate : 66%
[ 펼치기 · 접기 ]
#!syntax php
<?php

$normal_win_count = 0; // 바꾸지 않고 이긴 횟수
$normal_lose_count = 0; // 바꾸지 않고 진 횟수
$change_win_count = 0; // 바꿔서 이긴 횟수
$change_lose_count = 0; // 바꿔서 진 횟수

for ($i = 0; $i < 100000; $i++) { // 총 10만 번 반복한다.
    $reward = rand(1, 3); // 주최자는 1~3중 정답을 하나 숨김
    $answer = rand(1, 3); // 참가자는 1~3중 하나를 고름

    /*이때 주최자는 염소를 고른 뒤 참가자에게 바꿀지 말지 제안한다.*/

    //주최자는 참가자의 답과 보상이 아닌 것을 택함
    $val = rand(1, 3);
    while ($reward == $val || $answer == $val) {
        $val = rand(1, 3);
    }

    //바꾸지 않았을 때
    if ($reward == $answer) $normal_win_count++; //바꾸지 않고 이겼을 경우 1승 추가
    else $normal_lose_count++; //바꾸지 않고 졌을 경우 1패 추가

    //바꿨을 때
    $change = rand(1, 3);
    while ($val == $change || $answer == $change) { //이때 참가자는 바꾸기로 결정
        $change = rand(1, 3);
    }
    if ($reward == $change) $change_win_count++; //바꿔서 이겼을 경우 1승 추가
    else $change_lose_count++; //바꿔서 졌을 경우 1패 추가
}


echo "바꾸지 않고 이긴 횟수 : {$normal_win_count} \n";
echo "바꾸지 않고 진 횟수 : {$normal_lose_count} \n";
$normal_rate = ($normal_win_count * 100) / ($normal_win_count + $normal_lose_count); //확률계산
echo "확률 : {$normal_rate} % \n"; //바꾸지 않고 이길 확률

echo "바꿔서 이긴 횟수: {$change_win_count} \n";
echo "바꿔서 진 횟수 : {$change_lose_count} \n";
$change_rate = ($change_win_count * 100) / ($change_win_count + $change_lose_count); //확률계산
echo "확률 : {$change_rate} %"; //바꿔서 이길 확률

출력 결과
바꾸지 않고 이긴 횟수: 33540
바꾸지 않고 진 횟수: 66460
확률 : 33%

바꿔서 이긴 횟수 : 66460
바꿔서 진 횟수 : 33540
확률 : 66%

출력 결과에서 알 수 있듯이 바꿨을 때 승률이 33%p 증가하는 것을 알 수 있다.

3.7. 몬티 홀의 입장에서 생각해보기

몬티 홀(문을 여는 사람)의 입장에서 생각해 보면 좀 더 직관적으로 이해가 쉬울 수 있다.
당신은 몬티 홀(사회자)이고 오답과 정답인 문을 이미 다 알고 있다. 실제로 TV쇼에서는 사회자가 상품을 주지도, 그 비용을 부담하지도 않았겠지만 그래야 한다고 가정해보자. 참가자가 3개의 문 중에 하나를 선택했을 때 사회자(몬티 홀)인 당신은 반드시 남은 문 중에 오답인 문 하나를 공개해야 한다. 내 돈으로 상품을 지급해야하는 당신은 참가자가 결국 꽝인 문을 선택하길 바랄 것이다. 그렇다면 참가자의 첫 번째 선택 이후에 오답인 문을 열어주는 당신의 머릿속은 어떠할까. 당신이 참가자가 고르지 않은 문 중에 오답인 문 하나를 공개하고 나면 남는 문은 하나뿐이다.
  1. 만약 참가자가 처음 고른 문이 오답이었을 경우 당신은 정답인 문만을 남기고 다른 오답인 문 하나를 열면서
    제발 참가자가 문을 바꾸지 않기를 바라고 있을 것이다.
  2. 만약 참가자가 처음 고른 문이 정답이었을 경우 당신은 두가지 오답인 문 중에서 아무거나 열어 주면서
    제발 참가자가 문을 바꾸기를 바라고 있을 것을 것이다.

다시 처음 문을 고르는 상황으로 돌아가서 참가자가 오답을 고를 확률은 2/3, 정답을 고를 확률은 1/3이다.
즉, 1번의 경우가 발생할 확률은 2/3, 2번의 경우가 발생할 확률은 1/3이다.
다시말해, 몬티 홀이 참가자가 문을 바꾸지 않기를 바라고 있을 경우가 2/3, 그 반대가 1/3인 것이다.
사회자에게 불리한 경우가 반대로 참가자에게는 유리하다. 참가자는 문을 바꾸어서 사회자인 몬티 홀에게서 상품을 뜯어 내야 하는 것이다.

그래도 쉽게 공감이 되지 않는다면 위에서처럼 문의 갯수를 늘려보자.
백개의 문이 있고 사회자인 당신은 참가자가 선택을 한 이후에 오답인 문을 98개 열어서 공개해 주어야 한다. 벌써부터 당신에게 엄청나게 불리하다는게 느껴지지 않는가? 참가자는 처음 선택을 할 때 1/100의 확률로 선택을 했을 것이고 대부분의 경우에 오답을 선택했을 것이다. 그런데도 당신은 남은 99개의 문 중에서 정답 하나만을 남기고 다른 문을 모두 열어 주어야만 한다. 오답인 문을 하나하나 열어가는 당신의 기분을 상상해보라. 참가자 입장에서는 혜자도 이런 혜자인 프로그램이 없다. 문을 바꾸지 않는 것이 유리한 경우는 참가자가 첫 번째 선택에서 1퍼센트의 확률로 정답을 골랐을 때뿐이다. 당연히 참가자는 문을 바꾸고 99퍼센트의 확률로 상품을 획득하는 것이 현명할 것이다.

3.8. 기타 다른 설명

또 다른 설명으로는 '문을 바꾸지 않으면 당신은 1/3 확률의 선택을 한 것이고, 문을 바꾸는 순간 당신은 두 번 선택을 한 것이므로[7] 2/3의 확률을 가지게 된다'는 것도 있다.

확률 계산을 해보자. 만약 오답을 공개하는 행위 없이 2번의 선택을 거친다면 정답을 고를 확률은 어떻게 될까?
  • 2번째 선택 때 바꾸지 않을 경우: 문 3개 중에서 하나를 고르는 것이니 확률은 1/3이 된다.
  • 2번째 선택 때 바꿀 경우: 첫번째 선택 때 오답을 고르고 두번째 선택에서 남은 두개의 문 중에서 정답을 골라야 된다. 따라서 식으로 표현하면 2/3×1/2=1/3
사회자가 중간에 선택지 하나를 지울 때도 마찬가지다.
  • 2번째 선택을 하지 않을 경우: 1/3
  • 첫번째에서 오답을 고르고 재선택에서 다른 문으로 바꿀 경우 : 2/3×1/1=2/3.
선택을 바꿀 경우 위와 똑같은 방법으로 식을 만든다면 2번째 선택 때, 자신이 맨 처음에 고른 문은 제외해야 하기 때문에 자연스럽게 고를 수 있는 문이 하나밖에 없다는 사실을 알 수 있다.

쉽게 말하면 처음에 오답을 고를 경우 바꾸면 무조건 정답이다. 처음에 오답을 고를 확률이 2/3이므로 2/3이 맞다.
똑같은 말을 기대값이라는 용어로 설명 할 수도 있다. 당첨이 1, 꽝이 0 인 상황에서 선택을 바꿨을 때 정답일 확률은 당신이 방금 오답을 골랐을 확률이다. 이 경우 계산할 것도 없이 선택을 바꿀 경우의 기대값은 2/3가 된다.

처음부터 문을 두 개 선택하고, 그 중 꽝인 문을 열게 하는 방법도 있다.
2개의 문을 선택하면 당첨될 확률은 2/3이다. 그 중 꽝인 문은 반드시 1개 이상 있다.
당신이 당첨인 2/3의 경우 꽝인 문을 연다고 해서 당첨이 취소되지 않는다.
당신이 당첨이 아닌 1/3인 경우 꽝인 문을 연다고 해서 당첨이 되지 않는다.
당신이 선택한 문 중 당첨이 아닌 문을 열었을 때 당신이 당첨될 확률은 얼마인가?

처음에 고른 문이 당첨일 확률은 1/3이다. 처음에 내가 고르지 않은 문 중 적어도 하나는 꽝일 것이라는 사실은 자명하다. 사회자가 그 중 하나의 문을 연다 해도 위 사실은 적용된다. 결국 자명한 사실을 재확인한 것 뿐이므로 처음에 고른 문이 당첨일 확률은 똑같이 1/3이다.

선택을 "묶음"으로 생각할 수도 있다. 예를 들어 일반적인 몬티 홀 문제처럼 3개의 문이 있다고 가정해보자. 본인이 정답일 가능성이 3분의 1 확률인 하나의 문을 고르고 난 다음 진행되는, 진행자가 염소가 있는 문을 열어 주는 행위내가 선택을 바꾸는 행위를 하나의 행위로 보면, 본인은 선택을 바꿈으로써 2개의 문을 동시에 여는 행위가 되니 정답일 확률이 3분의 2로 증가하게 되는 것이다. 이를 4번 설명과 비슷한 방법으로 다시 설명하자면, 100개의 문이 닫혀 있을 때 내 선택이 정답일 확률은 100분의 1이지만 진행자가 남은 99개 중 98개의 꽝인 문을 열어주는 행위와 동시에 나의 선택을 바꾸면 나는 99개의 문을 동시에 여는 것이 된다. 그러므로 정답일 확률이 1%에서 99%로 증가하게 된다.

3개 중 하나를 고르고 그것을 A그룹, 나머지 2개를 한 그룹으로 묶어서 2/3의 정답확률인 B그룹을 만들자. 그런데 사회자가 고맙게도 B그룹에서 꽝 1개를 공개해주었다. B그룹은 여전히 2/3확률이고 내가 고른 것은 여전히 1/3확률 뿐이다. 그러면 당연히 B그룹으로 이동(꽝으로 공개되지 않은 나머지 1개로 이동)하는게 유리하다.

만약 10개의 주머니가 있고 보석은 1개에만 들어있다. 첫번째 주머니를 A라 부르고, 나머지 2~10번째 주머니를 묶어서 B라고 하자. 사회자가 자신도 어디 있는지 모른다고 하더니 2개중 한 그룹을 고르라고 한다면 당연히 9개의 주머니 그룹을 고를것이다. 왜냐면 그 그룹은 9/10확률로 보석이 있고 A그룹은 주머니가 1개 뿐이라 1/10밖에 안된다. 그런데 사회자가 와서 정답표를 지금 보고 왔다면서 B그룹의 9개 주머니중 8개를 개봉하고 그것들이 전부 꽝임을 알려주었다. 그러면 B그룹중 개봉안한 주머니로 9/10 확률이 몰려있다고 생각하고 아무도 A그룹(1개의 주머니)으로 이동하지 않을것이다. B그룹에 있는 미개봉 주머니는 게임 시작 직전에 생각하던 1/10의 주머니가 아니다. 이미 8개의 꽝주머니가 희생(?)한 상황이라 혼자서 90% 확률을 가지고 있다는 뜻이다.

문의 개수를 더 늘려보자. 가령 9999조개의 문이 있다고 가정하자. 그렇다면 문제를 푸는 사람이 처음 선택한 문이 꽝일 확률은 약 99.9999999999999999%가 된다. 이 상황에서 어느 문이 당첨인 것인지 알고있는 사회자가 당첨을 제외한 나머지 모든 문을 열었다고 가정해보면 이해가 쉬울 것이다. 문제를 푸는사람이 우연히 9999조개의 문중에 선택한 하나의 문이 당첨일 확률과 정답을 이미 알고있는 사회자가 내가 기존에 선택한 한 개의 문을 제외한 다른 꽝인 모든 문을 개방한 뒤에 남은 나머지 하나의 문이 당첨일 확률 중 무엇이 더 높은 확률을 가질지는 쉽게 이해할 수 있을 것이다.

그 외에도 매우 많은 종류의 증명이 존재한다. 베이즈 정리를 써서 증명할 수 있다. 중심극한정리가 잘 적용되는 사례이기 때문에 수렴 속도도 빠르며, control variate 같은 기법을 사용하면 더더욱 빠르게 답을 구해볼 수 있다.

3.9. 그럼에도 헷갈린다면

확률 계산보다도 사람들이 가장 많이 헷갈려 하는 것 중 하나가 왜 이러한 차이가 생겼느냐이다. 이 차이를 명시적으로 설명하자면(본 예시는 문 3개를 기준으로 함):
  • 사회자가 문 1개를 열어 남은 문 중 1개를 고를 때: 이 경우에는 2개의 문 중 1개를 고르면 된다. 따라서 이견의 여지가 없이 50%이다.
  • 문 1개를 고른 뒤 사회자가 1개를 열어 변경이 가능할 때: 이 때는 사회자가 참가자가 선택한 문자동차가 있는 문을 열 수 없다. 참가자가 선택한 문이 자동차가 있는 문이라면 사화자는 전자의 상황처럼 2개 중 아무거나 고르면 되지만 만약 참가자가 자동차가 없는 문을 고르는 경우 선택지는 1개로 줄어든다.
예를 들면, 전자의 경우 사회자는 언제나 2개의 문 중 하나를 고를 수 있다. A, B, C 가 있고 C가 정답인 문이라면 언제든지 A 혹은 B 중에서 하나를 고를 수 있다.
하지만 후자의 경우 C 가 정답인 상황에서 참가자가 C를 고른다면 역시 A 혹은 B 중에서 하나를 골라야하지만 만약 참가자가 A 혹은 B를 골라버리면 사회자는 그 참가자의 선택에 따라 본인의 선택에 제약을 받게 된다. 참가자가 A를 고르면 본인은 B, 참가자가 B를 고른다면 본인은 A, 이런 식으로 말이다.
굳이 수학적으로 계산하지 않아도 된다. 전자의 상황의 경우 사회자의 선택에 어무런 제약이 없지만 후자의 상황의 경우 참가자의 선택에 따라 사회자의 선택에 제약이 생기는데, 이러한 변수가 반영돼 66.66666...% 라는 결과로 이어진 것이다.

4. 사람들의 오해

4.1. 룰에 대한 오해

몬티 홀 문제의 룰을 오해하는 경우도 있다. 몬티 홀 문제는 다음의 과정을 거치는데:
  1. 참가자가 어떤 문을 선택한다.
    2. 사회자는 나머지 두 문 중에 염소가 있는 문 한 개를 열어 참가자에게 그 문에 염소가 있다고 확인시켜준다.
    3. 그 후 사회자는 참가자에게 선택한 문을 닫혀있는 다른 문으로 선택을 바꿀 기회를 준다.

이때 설명을 잘못해서 2번 스텝이 사회자의 선택에 의한 것이라고, 즉 이번에는 염소가 있는 문을 보여줬지만, 안 보여주는 선택지도 있었다고 오해하는 것이다. 몬티 홀 문제에 대해 전혀 모르는 사람에게 가상으로 몬티 홀 게임을 해 보는 방식으로 설명을 하다 보면 발생할 수 있다.

만일 사회자가 꽝인 선택지를 보여줄지 안 보여줄지 선택할 수 있다면, 이 문제는 더 이상 확률의 문제가 아니라 순전히 사회자와 참가자의 눈치싸움이 된다.

4.2. 경우의 수와 확률

3번에 자동차가 있다고 하면,
  • 1번을 골랐을 경우에는 자동차가 없다. 그러므로 사회자가 염소가 있는 문을 연다면 2번 문을 열 것이다. 남은 문이 3번이므로 바꾸면 유리하다.
  • 2번을 골랐을 때도 자동차가 없다. 그러므로 사회자가 염소가 있는 문을 연다면 1번 문을 열 것이다. 남은 문이 3번이므로 바꾸면 유리하다.
여기까지는 아무 문제가 없어 보인다. 그런데...
  • 3번 문을 골랐을 때는 사회자가 두 가지 선택을 할 수 있다.
    1. 1번 문을 열었을 때 남은 문이 2번이므로 바꾸면 불리하다.
    2. 2번 문을 열었을 때 남은 문이 1번이므로 바꾸면 불리하다.
그러니까 요지는 뭐냐 하면, 경우의 수는 4인데 유리한 경우는 2가지이므로 확률은 2/4=1/2다!

이 증명이 틀린 이유는, 애초에 경우의 수는 1번 문을 고르느냐, 2번 문을 고르느냐, 3번 문을 고르느냐 세 가지밖에 없기 때문이다. 자동차가 든 문을 골랐을 때 사회자가 어떤 문을 선택하느냐는 사실 고려 대상이 아니다.

이는 확률로 계산해보면 더욱 명확해진다. 위와 같은 경우, 즉 3번 문에 자동차가 들어 있는 상황이라고 할 때,
  • 1번 문을 고를 확률이 1/3.
  • 2번 문을 고를 확률이 1/3.
  • 3번 문을 고를 확률이 1/3인데,
    • 사회자가 1번 문을 열어 줄 확률은 3번 문을 고를 확률 × 1번 문을 열어줄 확률(1/3 × 1/2) = 1/6
    • 사회자가 2번 문을 열어 줄 확률은 3번 문을 고를 확률 × 2번 문을 열어줄 확률(1/3 × 1/2) = 1/6
이해가 가시는가? 만약 위의 증명이 맞다고 하면 참가자는 뭐에 홀린 듯이, 염소가 있는 문을 선택할 확률과 자동차를 선택할 확률이 같아야 한다. 즉, 염소가 있는 문을 고를 확률 1/4(× 2), 자동차가 있는 문을 고를 확률 1/2가 되어야 위의 증명이 성립한다고 할 수 있다.

요약하자면 사람들이 흔하게 하는 오류는 이런 것이다.
1번 선택 → 하나의 문이 열림 → 그 상태에서 가능한 경우의 수는 1번 선택 문에 정답이 있거나 오답이 있거나. → 2가지 경우의 수. → 확률의 수학적정의 해당경우/전체경우 → 0.5

대부분의 사람들이 생각한 0.5가 오류인 이유는 고등학교 교과과정에서 정의된 확률의 정의의 가정에 있다. 해당경우/전체경우를 확률로 정의할 때 분명히 앞에 "같은 확률로 일어나는 사건에 대해서"라는 가정이 있었다. 즉 2가지 경우 기존 선택이 옳은 경우와 바꾼 선택이 옳은 경우는 동등한 정도로 일어나지 않기 때문에 1/2로 계산하면 당연히 틀린다. 답부터 말하자면 두 경우가 1:2의 가중치를 가진다. 즉 바꾼 선택이 옳은 경우가 기존 선택이 옳은 경우에 비해 2배 더 잘 일어나고 그래서 3의 가중치 중 2의 가중치를 가진 바꾼 선택이 2/3 확률로 유리하게 된다.

왜 이렇게 되는지 살펴보자. 주어진 상황은 오로지 내가 뭔가를 선택했고 남은 두 문 중에 오답 하나가 열렸다는 것이다. 이 상황에서 생각할 수 있는 모든 경우의 수를 생각해보자. 편의상 3번에 정답이 있는 경우에 대해 생각해보면, 지금 일어난 상황은 (내가 선택한 문, 몬티 홀이 열어준 문)의 순서쌍으로 도식화할 수 있다. 즉, (1, 2) (2, 1) (3, 1) (3, 2) 이 4개 중에 하나가 일어났음이 틀림이 없다. 여기서 각 순서쌍의 확률은
(1, 2): 1/3×1
(2, 1): 1/3×1
(3, 1): 1/3×1/2
(3, 2): 1/3×1/2
보이는가? (1, 2)가 일어날 정도와 (3, 1)이 일어날 정도는 같지 않다. 여기서 수많은 사람들이 낚이고 제대로 설명 못한다. 가중치로 설명하자면, (1, 2)와 (2, 1)은 2 정도로 일어나고 (3, 1) (3, 2)는 1 정도로 일어난다. 이 상태에서 (1, 2) (2, 1) 즉 4의 비중에선 바꾸는 것이 정답으로 이어지고 (3, 1)(3, 2) 2의 비중에서는 고수하는 것이 정답으로 이어진다. 그렇기 때문에 바꾸는 것이 4/6의 정답률을 가져다주므로 유리하다.

4.3. 사회자가 문 너머를 인지 못한 채 연다면?

위의 확률론에 따른 설명 문단에서 정의한 대로, 문 A,B,C 중 참가자가 A를 고른 상태고 D는 사회자가 C를 여는 사건이라 설정한다. 그러나 사회자는 앞서 다르게 문 너머가 무엇인지 인지 못한다. 그럼에도 어느 문이 당첨이든 간에 A를 제외한 두 가지 문 중의 하나는 반드시 열어야 하니, 조건부 확률은 모두 동일하다.

P(DA)=P(DB)=P(DC)=12\displaystyle P(D|A) = P(D|B) = P(D|C) = {1 \over 2}

그러므로 베이즈 정리에 따른 식의 결과들도 모두 동일한 확률로 부여 받는다.

P(AD)=P(BD)=P(CD)=13\displaystyle P(A|D) = P(B|D) = P(C|D) = {1 \over 3}

이러한 결과가 시사하는 바는, 우선 참가자가 사회자는 문 너머를 정확히 인지하며 문 연다는 사실을 반드시 인식해야 윗 문단의 내용들이 성립한다. 깊게 들어가자면, 사회자가 실수하지 않고 문 너머를 정확히 인지하며 문을 여는 동시에, 그러한 사실을 참가자가 인식한다는 조건까지 충족해야 2/3 확률이 성립한다. 반면 문 너머를 정확히 인지 못한 초짜 사회자가 실수로 당첨을 연다 하더라도, 참가자가 앞서 결정할 시 당첨될 확률은 고르게 1/3이다. 설령 운 좋게 꽝을 골랐더라도 참가자에게는 모든 경우의 수가 하나 줄어든 1/2이며, 여기서 초점은 초짜 사회자가 운 좋게 꽝을 골랐다는 사실을 인식하는 참가자다. 이러니 1/2이 나오는 확률은, 결국에 참가자가 사회자는 문 너머를 정확히 인지하며 문 연다는 사실을 인식하지 못한 채 당첨을 고를 확률과 동일하다.

그런데 만일, 사회자가 이제껏 잘 해오다가 어느 날 실수로 문 너머를 인지하지 못한 채 꽝을 열어버렸고, 그를 모르는 참가자가 사회자는 문 너머를 정확히 인지한다는 인식 하에 결정한 문이 당첨일 확률이 무엇이냐는 문제가 제기되면, 이러한 인식론적 차원의 문제는 잠자는 숲속의 미녀 문제로 넘어간다. 베이즈 정리에서 언급되는 인식론과 깊게 연관된다.

5. 편견 있는 몬티

The battle among wikipedia editors could be described as a battle between intuitionists versus formalists, or to use other words, between simplists versus conditionalists. The main question which is endlessly discussed is whether simple arguments for switching, which typically show that the unconditional probability that the switching gets the car is 2/3, may be considered rigorous and complete solutions of MHP. The opposing view is that vos Savant’s question is only properly answered by study of “the” conditional probability that the switching gets the car, given the initial choice of door by the player and door opened by the host. This more sophisticated approach requires making more assumptions, and that leads to the question whether those supplementary conditions are implicitly implied by vos Savant’s words.

영문 위키피디아[8] 편집자들[9] 간에 벌어진 분쟁은 직관론자들과 형식론자들, 달리 말하자면 심플리스트들과 조건론자들간의 다툼으로 묘사될 수 있다. 끊임없이 논의되었던 주제는 선택을 바꾸는데 있어서 무조건 바꾸는 것이 차를 2/3로 가질 수 있다고 말하는 것이 몬티 홀 문제에 대한 절대적인 답이 될 수 있는지의 여부이다. 반대측은 보스 사반트의 질문은 참여자가 문을 처음에 고르고 사회자가 문을 연 상황에서 선택을 바꿨을 때 차를 고르게 되는 조건부 확률에 대한 연구에 의해서만 답변되었다고 말한다. 이 더 정교해진 접근은 더 많은 가정을 만들 것을 요구했고, 이는 보충되는 조건들이 보스 사반트의 답변에서 파악될 수 있는지에 대한 의문으로 이끌었다.
GILL, Richard D. The Monty Hall problem is not a probability puzzle (It's a challenge in mathematical modelling) #
논문에서도 나오는 말이지만 사반트가 답변해야 했던 것은 어디까지나 선택을 유지하는 것보다 바꾸는 것이 좋은가이지 바꾸는 것에 대한 확률은 어떤가에 대한 것이 아니므로, 몬티 홀 문제를 확률을 구하는 문제가 아니라 단지 선택을 유지하는 것보다 바꾸는 것이 좋은가에 대한 문제로 보면 다음과 같이 '몬티의 편향 정도'라는 변수를 추가적으로 고려한 풀이를 쓸 수도 있다. 물론 이런 식으로 변수를 추가하는 것은 하나의 예시에 불과하며 이러한 풀이만이 정답이라고 할 수는 없다.

수식 빼고 설명하자면, 예컨대 2번과 3번 문이 모두 염소일 때는 몬티가 2번 문을 더 선호한다고 하자. 만약 1번 문에 자동차가 있어서 2번과 3번이 모두 염소라면 몬티는 2번 문을 더 높은 확률로 열게 될 것이다. 하지만 1번 문이 염소라면 2번과 3번 문 중 하나만 염소이므로 몬티에게는 선택의 여지가 없고, 이 경우 2번 문과 3번 문은 염소가 있을 확률이 같으므로 몬티는 2번과 3번을 같은 1/2의 확률로 열게 될 것이다. 즉 1번에 자동차가 있으면 2번 문을 더 많이 열고 1번에 염소가 있으면 2번과 3번을 같은 확률로 열 것이므로, 몬티가 2번을 여는 경우 1번에 자동차가 있을 확률이 그만큼 높아진다.

그리고 몬티가 2번과 3번 중에서 무조건 2번만을 선택하는 극단적인 경우, 몬티가 2번 문을 열었을 때 1번에 자동차가 있을 확률이 1/2이며 3번을 열었을 때의 확률은 0이다. 따라서 편견 있는 몬티의 경우 1번에 자동차가 있을 확률은 0~1/2이며 선택을 바꾸었을 때의 확률은 2/3가 아니라 1/2~1이다.

참여자가 1번 문을 선택하면 다음과 같은 상황들이 나오게 된다.
  • 자동차가 1번 문에 들어 있을 경우(1/3),
    • 사회자가 2번 문을 연다.{1/3 × (1-q)}
    • 사회자가 3번 문을 연다.(1/3 × q)
  • 자동차가 2번 문에 들어 있을 경우 사회자는 3번 문을 연다.(1/3)
  • 자동차가 3번 문에 들어 있을 경우 사회자는 2번 문을 연다.(1/3)
문제에서 사회자는 이미 3번 문을 열었으므로, 사회자가 2번 문을 여는 경우는 제외된다.

자동차가 1번 문에 들어 있을 경우에 대한 확률이 1/3×q, 그리고 자동차가 3번 문에 들어 있을 확률이 1/3이며, 이에 따라 사회자가 3번 문을 연 상황에서의 조건부 확률을 계산해보면, 전체 확률은 (1/3 + q/3), 여기서 선택을 바꾸면 1/3, 그리고 선택을 유지하면 q/3, 따라서 선택의 바꿀 경우의 확률은 상술한대로 1/31/3+q/3\frac{1/3}{1/3 + q/3}이며, 정리하면 11+q\frac{1}{1+q}이 된다. 11+q\frac{1}{1+q}은 q가 0q10\leq q \leq 1이므로 1211+q1\frac{1}{2} \leq \frac{1}{1+q} \leq 1다.

6. 비슷한 문제들

6.1. 야바위 문제

마틴 가드너가 쓴 이야기 파라독스에서는 몬티 홀 문제와 비슷한 다른 문제가 실려 있다.
3개의 컵을 엎어놓고 그중에 동전이 들어있는 컵을 찾는 야바위 놀이에서 행인이 '승률이 1/3밖에 안되니 돈을 걸지 않겠다'고 하니 야바위꾼이 플레이어가 컵을 하나 고르면 셋 중에 동전이 들어있지 않은 컵을 하나 열어 보여주겠다는 제안을 한다.
그러면 플레이어의 승률은 올라가는가?(물론 속임수는 없다고 가정)
얼핏 생각해보면 컵 하나를 제거한 순간 남은 컵은 둘 뿐이니 돈을 딸 확률이 1/2로 증가하는 게 아닌가 하는 생각이 들기도 한다. 그러나 이 경우에는 몬티홀 문제와는 달리 플레이어에게 선택할 컵을 바꿀 기회를 주지 않고 있다. 그러니 이 룰을 추가하든 하지 않든 플레이어의 승률은 1/3 그대로 고정되고 확률이 바뀔 리 없다. 이 야바위꾼 머리 좀 쓰네.

6.2. 아들 딸 문제

1. 자식이 두 명이다. 한 명 이상은 딸이다. 둘 다 딸일 확률은?
2. 자식이 두 명이다. 첫째는 딸이다. 나머지가 딸일 확률은?
직관을 배신하고 이 두 문제의 답이 다르다는 문제. 문서 참고.

6.3. 카드 뽑기 문제

몬티 홀처럼 직관적으로 내린 결론이 실제 수학적 답과 다른 또다른 문제. 문제는 다음과 같다.[10]
조커를 뺀 52장의 트럼프 카드 뭉치에서 카드 한 장을 뽑아 확인하지 않고 바로 덮어두었다. 그리고 나머지 51장의 카드 중 무작위로 3장의 카드를 더 뽑았는데, 3장 모두 다이아였다.
이 때 처음 뽑은 카드가 다이아일 확률은?
일반적으로는 처음 카드를 뽑을 때를 기준으로 13/52=1/4이라고 생각하겠지만, 정답은 확인하지 않은 카드 중 다이아를 뽑을 확률과 같은 10/49이다.

후행사건의 결과에 의해서 선행사건의 확률이 바뀐다는 것이 일반적인 사고로는 납득되기 어려울 것이다. 이는 이후에 뽑은 3장의 다이아 카드가 무작위[11]로 뽑은 카드이기 때문으로, 정확한 확률 계산법은 다음과 같다.

(뽑은 총 4장의 카드가 모두 다이아일 확률)/(이후에 뽑은 3장이 모두 다이아일 확률)=14×(123)14×(123)+34×(133)=1049\displaystyle{ \frac{1}{4}\times\binom{12}{3} \over \frac{1}{4}\times\binom{12}{3} + \frac{3}{4}\times\binom{13}{3}}=\frac{10}{49}

문제를 더 간단하게 만들어보자. 원래 문제에서는 사후에 3장을 뽑은 것이 다이아였는데, 숫자를 바꿔서 만약 13장을 뽑았는데 13장 모두가 다이아였다고 해보자. 그럼 당연히 처음에 뽑은 카드가 다이아일리가 없지 않겠는가? (카드 더미엔 다이아가 13장 밖에 없다.) 후행사건의 결과에 의해서 선행사건의 확률이 바뀔 수 없다는 생각은 착각이라는 것을 쉽게 깨달을 수 있을 것이다.

이렇게 직관적인 결론과 수학적으로 풀이한 결론이 일치하지 않는 이유는 확률 문제는 정보가 주어지지 않은 사건들의 확률은 모두 독립적이고 동일하다고 '가정'을 하는데,[12] 살면서 이런 문제를 너무 많이 풀었기 때문이다. 이 가정이 정보가 주어지지 않은 사건들에게만 적용된다는 사실을 잊으면 추가적인 정보가 주어진 다음에도 계속 확률이 동일하다고 착각하는데, 여기서 모든 오류가 시작된다. 실제로는 한 사건과 관련이 있는 사건의 정보가 주어지면 해당 사건이 일어날 확률은 달라지게 된다. 다이아 카드 문제를 예시로 설명을 하자면, 원래 한 장을 뽑았을 때 다이아 카드를 뽑을 확률이 13/52인 이유는 "각각의 카드를 뽑을 확률은 모두 동일하다"라는 전제를 당연하게 가정하고 있기 때문이다. 그런데 뒤에 카드 3장을 뽑았는데 그 카드가 모두 다이아임으로 인해, "해당하는 3장의 다이아 카드를 뽑았을 확률은 0이다"라는 정보가 추가되어서 각각의 카드를 뽑을 확률이 더 이상 동일하지 않아졌다. 연관이 있는 후행 사건에 의해 선행 사건에 대한 정보가 추가로 주어졌기 때문에 선행 사건의 전제(=각각의 카드를 뽑을 확률은 모두 동일하다.)가 더 이상 맞지 않게 변했다.

7. 여담

이렇게 수학자들을 보기좋게 엿먹인 사반트였지만 이후 그녀가 발간한 '이 세상에서 제일 유명한 수학 문제'(1993)에서 앤드루 와일스가 증명한 페르마의 마지막 정리의 증명에 의문을 제기하거나[13], 상대성 이론을 까댔기 때문에 유사과학으로 대중을 호도한다는 오해를 살 만 했다. 특히나 FLT에 대해서는 와일스의 첫 증명에서 오류를 발견한 것이 아니라, 수학적 귀납법, 귀류법, 허수에 대해서 제대로 이해하지 못했으며, 수알못적인 모습을 보였기에 더 많이 까였다.

전설적인 수학자 폴 에르되시도 선택을 바꾸든 아니든 확률은 같다고 생각했고, 컴퓨터로 실험해본 뒤에야 바꾸는 것이 유리한 선택임을 인정했다고 한다. 참고로 폴 에르되시는 20세기 최고의 수학자 중 하나로 여겨지는 인물이다. 밤에 이불 좀 차셨겠다.

'왜 월요일은 빨리 돌아오는 걸까'라는 책에 의하면, 정작 이 문제의 어원이 된 오락 프로그램인 몬티 홀에서는 당첨을 선택할 때 사회자가 꽝이 있는 문을 열어서 보여주거나 한 적이 없다고 한다.

비둘기한테도 몬티홀 문제를 풀게 한 사례도 있다. 인간과는 달리 비둘기는 빈 먹이통을 보면 처음 선택한 먹이통에서 선택을 변경하는 것으로 밝혀졌다. 출처 논문 제목: 새들이 수학자보다 머리가 좋은가?

실제 확률과는 별도로 현실에서 비슷한 일이 생기는 경우 대부분의 사람들은 그냥 원래 선택을 유지하는 경우가 많다. 심리학적으로 사람은 이득보다 손해에 민감하게 반응하므로 괜히 바꿨다가 원래 선택한 문에 승용차가 있었으면 정말 억울하기 때문이다. 답안지 고쳐서 맞을 때가 더 많았어도 고쳐서 틀리면 더 기억에 잘 남는 것과 같은 원리이다.

8. 대중 매체에서의 등장

  • 정글고등학교 명왕성 사다리타기를 하다가 위의 이론대로 선택을 바꾸다가 매점에 가서 음료수를 사야 했다. 여기서 이 문서에 대해 잘 모르는 사람들은 명왕성이 불사조의 어설픈 심리전에 낚였다고 생각하기 쉽지만 선택을 바꾸는게 확률이 높아진다는 계산 자체는 맞았다. 단지 이 사다리타기에서는 당첨이 음료수를 사줘야 했을 뿐. 애초에 누가 음료수 사는지 정하려고 사다리타는 거잖아. 지식은 불사조에 버금가면서 상식적인 방향으로 머리가 안돌아가는 명왕성의 특성이 돋보이는 에피소드다.
  • 괭이갈매기 울 적에 Ep8에서 조지 제시카가 낸 퀴즈로 등장. "새로 알게된 사실에 따라 가지고 있는 진실이 변한다."는 말을 하려고 꺼낸 듯. 수학적으로 말하자면 주어진 정보가 달라질 때 어떤 사건이 일어날 확률은 달라질 수 있다는 것에 가깝다.
  • 이야기 시리즈 끝 이야기 상권에서 5년 전 오이쿠라 소다치 아라라기 코요미에게 이 문제를 본딴 쪽지를 보냈다. 따지고 보면 아라라기가 수학에 관심을 가지게 된 계기가 된 문제.
  • 정재승의 과학 콘서트 책에서도 이를 언급했다.
  • 도전 골든벨 수학 골든벨 특집 33번 문제에서 출제되었다.
  • 도박마 배틀십 편에서 오후나 가쿠히토가 선택한 행위를 설명하는 데 본 문제가 인용되었다. 위의 문 100개짜리 만화가 해당 장면으로, 그만큼 오후나가 직감을 믿었다고 강조한 것.정작 오후나는 직후 마음을 바꿨다는 게 함정
  • 드림 인베이더 둘째 날 문제에서 출제되었다.
  • D.P. 4화의 제목이자 중심 소재로 쓰였다.
  • 문제적 남자 34회에서 장진이 뽑은 미디어 속 뇌풀기 문제로 출제되었다.
  • 웹툰 셜록: 여왕폐하의 탐정 53화에서 셜록 홈즈의 덫으로 쓰였다. 그런데 이 작품에서는 몬티홀 문제를 잘못 다루고 있다. 작중에서 셜록 홈즈가 문 하나를 열어보이고 "앗, 여기는 꽝이군요." 라고 말했는데, 이미 꽝이라고 알고 있는 문을 하나 열어보인다는 조건이 아니고 하나를 열어봐서 꽝임을 발견한 경우라면 확률은 1/2이 된다. 단, 55화에서 밝혀진 바로는 염소 카드가 나올 수밖에 없는 속임수였고,꽝인 문을 열어보일 생각이면서 연기를 했다. 그 결과 문제의 수학적인 의의가 퇴색되고 사기극이 되었다.
  • 교학사와 미래앤 <확률과 통계> 교과서에 나와 있다.
  • 유키 히로시의 수학 교양소설 ' 수학 걸 4권 - 확률적 알고리즘(Randomized Algorithms)'의 주제가 바로 이 몬티 홀 문제와 NP-완전 문제다.
  • 넘버스 제1기 13화에서 주인공인 찰스 앱스 교수가 이에 대해 강의하는 모습이 잠깐 나온다.
  • 1990년대에 방영한 MBC 칭찬합시다의 한 코너에서 이 방식을 차용한 적이 있었다.
  • 악의 교전의 5권에서도 등장했다.
  • 게임 방송 유튜버 우왁굳이 생방송 중 이 문제에 대해 3시간 가량 토론하고 유튜브에도 업로드했다.[14] 영상 ???: 처음 고른 문이 염소면 뭐하러 바꿀 기회를 주겠냐 또한 VR챗으로 실제 실험을 하기도 했다.
  • 마인크래프트 유튜버 마인애플이 명령어로 몬티 홀 실험을 해 확률 증명을 하는 컨텐츠를 진행했다. 실험 10000번을 진행했는데 6633번(66.33%)의 성공 결과가 나왔다고 한다. 영상 이론상 성공 확률인 2/3에 매우 근사한 값이다.
  • 유튜버 Logical 로지컬도 마인크래프트 레드스톤 회로를 만들어 몬티홀 실험을 해서 확률 증명을 했다. 실험 결과 성공 216개 대 실패 93개로 약 2/3의 성공 확률이 나왔다고 한다.[15] 영상

9. 관련 문서



[1] 1986년~1989년판 기네스북에서 세계에서 가장 지능지수가 높았던 사람으로 기록된 여성이다. [2] 이 전제가 달라지면 문제의 정답이 전혀 달라지게 된다. 일례로 사회자가 자동차가 어디에 있는지 모르고서 문을 열었는데 염소가 나왔다면, 참가자가 선택을 바꿨을 경우의 확률이 1/2가 된다. [3] 실제 게임 룰에서 자연스레 추론되기도 하지만 사회자가 실수로 자동차가 있는 문을 여는 것이 TV로 송출되면 무슨 일이 벌어질까, 이 문제의 답이 2/3임을 끌어내는데 중요한 역할을 한다. [4] 사회자가 편견을 가지지 않음을 뜻한다. [5] 고전적인 전제와 달리 몬티 홀 문제에서 사회자가 염소가 든 문을 고를 때 선택을 임의적으로 한다고 가정하지 않는 문제다. 자세한 내용은 후술. [6] 그랬다가 실수로 자동차가 든 문을 열어 보이기라도 한다면 쇼는 진행될 수 없다. [7] 이 경우 처음 내가 선택한 것은 의미가 없으니 버린다. 사회자가 대신 꽝을 선택해준 것이 첫 번째 고른 것이 되고 나머지 두 개 중에서 내가 하나를 고를 때 두 번째 선택이 성립한다. 그냥 사회자가 나에게 문을 한 번 열어보라 하고 그게 꽝이었을 때 나머지 두 개 중에서 한 번 더 선택할 기회를 주는 것과 똑같다. [8] 실제 토론 내용으로 보인다. [9] 논문에서는 Hogbin과 Nijdam이라고 밝혀놨다. [10] 과거 와세다대학의 입학시험에 나왔던 문제로 알려져 있다. [11] 만약 뽑은 사람이 자기가 뽑을 카드가 다이아일 것을 미리 알았다면, 애시당초 '다이아몬드' 세 장을 첫 장 뒤에 놓았다는 것이 전제가 되므로 선행사건과 후행사건에 대한 착각이 벌어지지 않는다. [12] 이를 소설 비데리 논 에쎄에서는 '동확률추정의 원칙'이라고 한다. [13] 이 당시는 아직 증명의 오류가 밝혀지지 않은 때였다. [14] 다만 몬티 홀 문제가 역설은 아님에도 제목에 '몬티홀의 역설'이라고 적었다. [15] 216/309는 정확히 69.9% 정도이다.