[@뉴스룸/허진석]불멸의 이론

  • 동아일보
  • 입력 2014년 7월 22일 03시 00분


코멘트
허진석 채널A 차장
허진석 채널A 차장
출장을 마치고 집에 돌아와 보니 안방에서 누군가 담배를 피운 흔적이 나왔다. ‘아내는 담배를 피우지 않는데…. 혹시, 바람을 피우는 건가?’

이런 상황을 직면했을 때 아내가 진짜로 바람을 피우고 있을 가능성은 얼마일까.

또 40대 여성이 X선 검사를 했더니 유방암 양성 판정이 나왔다. 이 경우 실제 유방암일 가능성은 얼마나 될까.

이런 경우 대부분 직감에만 의존하는데, 적절한 정보가 있다면 그 가능성을 확률로 표현하는 것이 가능하다.

고등학교와 대학 때 한 번쯤 들어본 적이 있는 ‘조건부 확률’에 그 답이 있다. ‘베이스 정리’로도 불리는 이것은 ‘어떤 사건의 사전확률을 알 때, 특정 원인에 의한 해당 사건의 사후확률을 알 수 있다’로 설명할 수 있다.

미국에서 40대 여성이 유방암에 걸릴 확률은 1.4%다. 이게 사전확률이다. 필요한 추가 정보는 유방암에 걸린 여성이 X선 검사에서 양성 판정을 받을 확률(75%)과 멀쩡한 여성이 양성 판정을 받을 확률(약 10%)이다. 이를 알면 양성 판정을 받았을 때 진짜 유방암일 확률은 ‘1.4%×75%÷(1.4%×75%+98.6%×10%)’로 9.6%라는 결과가 나온다.

40대 여성이 유방암에 걸렸을 때 양성 판정이 나올 확률이 75%나 되기 때문에 양성 판정을 받으면 겁을 먹기 쉽지만, 실제 암일 확률은 9.6%에 불과한 것이다. 직감과 실상의 차이가 크다.

베이스 정리의 진짜 미덕은 ‘사전에 알던 가능성에 새로운 정보를 넣어 그 가능성을 정량적으로 개선시킬 수 있다’는 점이다.

승률이 좋은 스포츠 도박사는 감독의 인터뷰에서 나오는 경기 운영 지침이나 선수의 심리상태를 수치화해 자신만의 모델을 만들고, 그걸로 엄청난 돈을 벌기도 한다.

미국의 예측 전문가 네이트 실버는 실제로 베이스 정리를 활용해 2008년 미국 대선에서 50개 주 중 49곳의 대선 결과를 정확히 예측했고, 총선에서도 상원 당선자 35명이 누구일지를 정확히 예측해 화제를 모았다.

베이스 정리는 최근에 나온 ‘신호와 소음’(네이트 실버·더퀘스트)과 작년에 나온 번역서 ‘불멸의 이론’(샤론 버치 맥그레인·휴먼사이언스)으로 다시 관심을 끌고 있다.

네이트 실버가 정치적 사건의 결과까지 정확히 예측할 수 있었던 것은 정치적 입장을 떠나 베이스 정리를 바탕으로 자신의 판단을 끊임없이 개선했기 때문이다. 선입견이나 편견을 버리고 새로 나타난 정보를 신중히 선택한 것도 주효했다.

데이터의 양이 폭발적으로 늘면서 ‘잡음’도 기하급수적으로 늘어나는 시대를 우리는 살고 있다. 큰 사건이 발생하면 근거가 부족한 ‘음모론’이 빠르게 확산되는 것을 보라. 자신에게 유리한 데이터만 선별해서 인지하려는 인간의 특성 때문에 정치적 당파성은 더 커지고 있다.

250여 년 전에 나온 베이스 정리는 말한다. 당신이 내린 판단은 새로운 사실이 등장하기 전까지만 유효하다. 새로운 정보를 신중히 선택해 다시 생각하라. 아주 겸손하고 공손하게.

허진석 채널A 차장 jameshuh@donga.com
#정보#확률#베이스 정리#네이트 실버
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스