[전문가의 세계 - 이종필의 과학자의 발상법](10)범죄 현장 DNA와 당신의 것이 일치하는데 범인이 아닐 수도 있을까

전문가의 세계 - 이종필의 과학자의 발상법 구독

(10)범죄 현장 DNA와 당신의 것이 일치하는데 범인이 아닐 수도 있을까

2020.11.27 06:00

이종필 교수

숫자로 유무죄 가릴 수 있나

[전문가의 세계 - 이종필의 과학자의 발상법](10)범죄 현장 DNA와 당신의 것이 일치하는데 범인이 아닐 수도 있을까

무죄라는 가정하에 증거물의 DNA와 일치하는 사건의 확률을 p라 하자
p값이 아주 작다면 이는 극히 드문 일이 일어난 경우이므로 무죄라는 것을 받아들이기 힘들다
그러나 p값이 작으면 드문 사건이 발생한 것이고, 크다면 흔한 일이 일어난 것일 뿐…
결과 인정은 ‘사람의 몫’이다

친자 확인이나 범죄 수사에 적극 활용되고 있는 DNA 분석 기법의 정확도를 보통 99.999%로 소개하는 경우가 많다. 일상의 용어로 보통 사람들이 이 숫자를 받아들이는 방식은 이렇다. “만약 DNA 검사가 일치하는 것으로 나오면 두 사람이 일치할 확률이 99.999%이다.” 엄밀하게 말하면 이는 정확한 해석이 아니다.

99.999%라는 숫자는 질병 진단에서의 특이도에 해당하는 값으로, DNA 검사에서 해당 유전자가 없을 때 일치하지 않는다고 판정할 확률이다. 예를 들어, 범죄 현장에서 수집한 증거물에서 채취한 DNA가 실제로는 무죄인 홍길동의 DNA와 일치하지 않는다고 옳게 판정할 확률이다. 이것의 여사건(餘事件·어떤 특정 사건이 발생하지 않을 사건)으로 설명하자면, 해당 유전자가 없음에도 DNA가 일치한다고 잘못 판정할 오류판정률이 0.001%라는 뜻이다. 알리바이가 확인된 홍길동의 DNA와 일치할 확률이 이만큼 작다. 편의상 우연히 다른 사람과 유전자가 일치할 가능성은 없다고 가정하자.

용의자가 범인일 때 DNA가 일치할 확률과 DNA가 일치할 때 용의자가 범인일 확률은 엄연히 다르다. 전자는 100%의 확률이다. 왜냐하면 지금 기술 수준에서 범인의 DNA를 범인의 것이 아니라고 판정할 확률은 0이기 때문이다. 그러나 현실에서 범죄를 수사할 때에는 누가 범인인지 알 수가 없다. 따라서 후자의 확률이 중요하다.

후자의 확률, 즉 DNA 검사가 일치 판정을 내렸을 때 실제로 용의자가 범인일 확률은 질병 진단에서 양성예측도에 해당하는 값이다. 만약 놀부의 DNA가 증거물의 DNA와 일치한다는 판정이 나왔을 때 놀부가 범인일 확률은 얼마일까의 문제이다. ‘DNA 일치’라는 사건에는 ‘범인의 DNA를 옳게 판정’한 경우와 ‘결백한 자의 DNA를 잘못 판정’한 경우가 함께 포함돼 있다. 알리바이가 확인된 홍길동도 재수가 없으면 낮은 확률이지만 DNA 일치 판정을 받을 수 있다.

여기서 오류판정률이 10만분의 1로 작다 하더라도 검사 대상이 100만명이면 10명은 무죄임에도 증거물과 DNA가 일치한다고 잘못 판정될 수 있다. 그 결과 양성예측도는 내려간다. 다행히 요즘 DNA 검사의 오류판정률은 극히 낮아서 ‘이춘재 사건’에서는 이 값이 10의 23제곱분의 1까지 이른다. 오류판정률이 100억분의 1 이하로 떨어지면 현재 지구상 인구 중에서 DNA가 일치한다고 잘못 판정받을 사람은 1명 미만이다.

이처럼 오류판정률이 극도로 낮다면 무죄임에도 DNA가 일치할 확률이 극도로 낮아지고, 따라서 양성예측도, 즉 DNA가 일치할 때 범인일 확률은 대단히 높아진다. 물론 양성예측도가 몇 %까지 올라가야 놀부가 범인이라고 확신할 수 있을지는 사회적인 합의나 판사의 판단에 달려 있는 문제일 것이다. 어쨌든 어떤 기준을 넘어섰을 때 놀부가 범인이라고 지목하는 것은, 놀부가 무죄라 가정했을 때 무죄임에도 DNA가 일치할 확률이 너무나 낮으니까(예컨대 100억분의 1), 즉 무죄라고 하기에는 너무나 희박한 사건이 일어난 셈이니까, 그 정도로 희박한 확률의 사건이 일어났으면 그냥 범인이라고 보자는 뜻이다.

양성예측도 말고 판사가 참고할 수 있는 한 가지 지표가 있다. 가능도비율(likelihood ratio)이라 부르는 양이다. 가능도비율이란 한마디로 놀부가 범인이 아닐 때 증거가 나올 확률(분모) 대비 놀부가 범인일 때 증거가 나올 확률(분자)의 비율이다. 가능도비율의 분모에 들어가는 확률은 다름 아닌 오류판정률이다. 분자에 들어가는 확률은 용의자가 범인일 때 DNA가 일치할 확률이므로 이는 100%이다. 따라서 이 경우 가능도비율은 오류판정률의 역수와 같다. 만약 오류판정률이 10만분의 1이면 가능도비율은 10만이다. 물론 이 값을 어떻게 받아들일 것인가는 재판부 몫이다.

어떤 판사가 DNA 검사의 오류판정률이 100만분의 1 이하인 경우 범인으로 특정하겠다는 기준을 세웠다고 하자. 법정에서 검사는 아마도 공신력 있는 DNA 검사 결과를 제출하며 그 검사의 오류판정률이 판사의 기준을 만족함을 주장할 것이다. 예컨대, 검찰이 확보한 DNA 검사 결과의 오류판정률이 1000만분의 1로 판사의 기준보다 더 희박한 확률이므로 놀부가 범인이 틀림없다고 주장할 것이다. 이때 검찰이 유죄를 확신하려면 자신이 제시한 오류판정률이 판사의 기준보다 더 작아야 한다. 즉 판사가 제시한 기준보다 더 희박한 사건이 일어났음을 보여줘야 한다.

이에 맞서 변호사는 정확히 검사와 반대 방향으로 가려 할 것이다. 검사가 제시한 DNA 검사 방식에 문제를 제기하거나(O J 심슨의 변호사들이 그랬던 것처럼) 또는 다른 검사 결과를 제시하며 자신의 의뢰인에 대한 검사의 오류판정률이 판사가 제시한 기준보다 더 크다고 강조할 것이다.

위에서 소개한 논의를 보면서 아마도 학창 시절 수학시간에 배웠을 귀류법을 떠올리는 사람이 많을 것이다. 귀류법이란 어떤 명제를 증명할 때 일단 그 명제를 부정한 뒤 모순을 이끌어내 원래 명제가 옳음을 증명하는 방식이다.

대표적으로 √2가 무리수임을 증명할 때 이 방법을 쓴다. 먼저 √2가 무리수가 아닌 유리수라 가정하고 그로부터 모순을 이끌어낸다. 이로부터 모순의 원인이 되는 첫 가정, 즉 √2가 유리수라는 가정이 틀렸음을 보이는 것이다. 그 옛날 헬레니즘 시대 에우클레이데스가 ‘유클리드 기하학’을 집대성한 <스토이케이아>에서 소개한 증명법이다.

DNA 검사 결과를 해석하는 검찰의 논리를 살펴보자. 일단 용의자 놀부가 무죄라 가정한다. 이는 놀부를 유죄로 기소한 검찰의 결론을 뒤집는 가정이다. 그랬을 때 DNA가 일치할 확률이 너무 낮으니까, 매우 그럴듯하지 않은 상황이 발생했으므로 원래 가정을 기각한다는 논리다.

이 과정을 일반화해 보자. 내가 증명하고 싶은 어떤 명제가 있다. 먼저 이 명제와 결부된 영가설(null hypothesis, 또는 귀무가설)을 만든다. 영가설이란 한마디로 “아무런 특별한 일도 일어나지 않았다”는 가정이다. 즉 영가설은 원래 명제의 효과를 무위로 설정하는 가정이다. 다음으로, 영가설이 옳다는 가정 아래 내가 관측한 사건 또는 그보다 더 극한 (또는 더 드문) 사건이 일어날 확률을 구한다. 이 값을 p값이라 한다. 만약 p값이 미리 정해둔 어떤 기준보다 작으면 영가설을 받아들이지 않는다. 이 기준을 유의수준(significance level)이라 한다. 보통 0.05나 0.01의 값을 이용한다. 이와 같은 검정의 과정을 유의성 검정이라 한다. 현대적인 통계학의 기초를 세운 로널드 피셔가 제시한 방법이다. 피셔의 유의성 검정은 p값을 통해 영가설이 얼마나 믿을 만한가를 판단하는 기제이다.

놀부의 재판 과정을 예로 들면, 놀부를 기소한 검찰 입장에서 검찰의 영가설은 “놀부가 무죄이다”가 된다. 이 가정 아래 DNA 검사로 얻을 수 있는 결과는 증거물의 DNA와 놀부의 DNA가 일치하는 사건과 일치하지 않는 사건 둘뿐이다. 이때 DNA가 일치하는 사건이 벌어졌고, 그보다 더 드문 사건은 더 이상 없으므로 간단히 이때의 확률을 p라 할 수 있다. 이 값이 판사가 제시한 기준보다 낮으면 놀부가 무죄라는 영가설을 받아들이지 않는다.

피셔의 유의성 검정에서 중요한 개념이 p값이다. p값은 지금도 학술 연구에서 통계적인 검정을 할 때 늘 등장한다. p값은 영가설이 옳다고 가정했을 때, 특정한 사건 하나가 일어날 확률이 아니라 그 사건 이상으로 더 드문 사건들이 일어날 확률이다.

영가설이 옳다는 가정하에 얻은 p값이 아주 작다면 이는 극히 드문 일이 일어난 경우이므로 영가설을 받아들이지 않겠다는 것이 피셔의 논지다. 보통 p값이 유의 수준보다 작으면 통계적으로 유의하다는 결론을 내린다. 여기서 주의할 점은 p값에 과도한 의미를 부여하거나 잘못된 해석을 하면 안 된다는 점이다. 우선 p값은 영가설이 옳다는 조건하에서의 조건부확률이다. 따라서 p값 자체가 영가설이 옳을 확률을 말하지 않는다. p값은 이미 영가설이 옳다는 전제를 깔고 있으므로, p값이 크거나 작다는 사실이 영가설이 옳거나 틀릴 확률을 말하지 않는다. p값이 작으면 영가설이 옳다는 전제하에 그만큼 드문 사건이 발생한 것이고, p값이 크다면 영가설이 옳다는 전제하에 그만큼 흔한 일이 일어났음을 뜻할 뿐이다. 그 결과를 어떻게 받아들일 것인가는 사람의 몫이다.

만약 유의 수준보다 높은 p값을 얻었다면 어떻게 될까? 영가설이 옳다는 가정하에 비교적 흔한 일이 일어났으므로 영가설은 기각되지 않는다. 그러나 기각되지 않았다고 해서 영가설이 ‘증명’된 것은 아니다. 그 사건이 영가설과 양립가능하다는 사실을 말할 뿐이다.

전문가의 세계 - 이종필의 과학자의 발상법 구독

무엇보다, p값은 영가설의 검증에만 관여하는 숫자이다. 원래의 명제가 얼마나 믿을 만한가와는 직접적인 관련이 없다. 영가설이 옳다는 가정과 관측 데이터가 얼마나 모순적인가, 또는 얼마나 양립가능한가를 따질 뿐이다.

p값을 둘러싼 논란과 오용이 얼마나 심했던지 2016년 미국 통계학회에서는 p값의 해석과 이용에 관한 여섯 가지 원칙을 제시했다. 첫째, p값은 특정 통계모형과 데이터가 얼마나 양립불가능한지를 나타낼 수 있다. 둘째, p값은 검토 중인 가설이 참일 확률, 또는 데이터가 무작위적인 우연에 의해서만 만들어졌을 확률을 측정하지 않는다. 셋째, 오직 p값이 특정한 문턱값을 넘었는지 여부에만 기초해서 과학적 결론과 사업 또는 정책적 결정을 내려서는 안 된다. 넷째, 적절한 추론을 하려면 완전한 보고와 투명성이 필요하다. 다섯째, p값 또는 통계적 유의성은 어떤 효과의 크기나 결과의 중요성을 측정하지 않는다. 여섯째, p값 자체는 모형이나 가설과 관련된 증거를 제대로 측정하지 못한다. 요컨대, p값을 너무 믿지 말고 과도한 의미 부여를 하지 말라는 뜻이다.

▶이종필 교수

1971년 부산에서 태어났다. 1990년 서울대학교 물리학과에 입학했으며 2001년 입자물리학으로 박사학위를 받았다. 이후 연세대, 고등과학원 등에서 연구원으로, 고려대에서 연구교수로 재직했다. 2016년부터 건국대 상허교양대학에서 조교수로 재직 중이다. 저서로 <신의 입자를 찾아서> <대통령을 위한 과학 에세이> <물리학 클래식> <이종필 교수의 인터스텔라> <빛의 속도로 이해하는 상대성이론> 등이 있고, <최종이론의 꿈> <블랙홀 전쟁> <물리의 정석> <스티븐 호킹의 블랙홀> 등을 우리글로 옮겼다.

연재 레터 구독은
로그인 후 이용 가능합니다.

로그인

경향신문 홈으로 이동 아직 회원이 아니신가요?