20%의 의미
페이지 정보
본문
https://damoang.net/free/858025
자유게시판에 이미 한번 적어봤습니다만, 생각보다 취지를 오해하시는 분이 많아서, 다시 한번 적어보고 싶어졌습니다.
https://n.news.naver.com/article/001/0014725962?sid=101
여러 신문에서 이번에 정부 발표를 소개하면서 탐사 시추 성공 가능성이 20%라는 분석의 의미를,
'5차례 탐사 시추공을 꽂으면 석유를 한 번 발견할 수 있다'
로 해석했습니다. 근데, 각종 커뮤니티에서 여기에 대한 반응을 보면,
'동전을 던져도 앞면이 나올 확률이 50%라고 하지만 두 번 던지든 백 번 던지든 앞면이 반드시 나오는 것은 아니다. 20% 확률이라고 다섯 번 뚫으면 한 번 나온다니, 누굴 바보로 아느냐.'
정도로 요약할 수 있는 반응이 많습니다.
제가 하고 싶었던 이야기는, 정부나 언론도 잘못되었지만, 또한 위의 반응도 여러가지 면에서 문제가 있다는 것이었습니다. 정부나 언론의 발표는 매우 잘못되었고, 국민을 오도하는 면이 상당히 있습니다. 그런데, 그게 잘못된 진짜 이유는, 위의 '동전을 두 번 던져도 한번도 안 나올 수 있다'라는 반응과는 상당히 다릅니다.
일단, 계속 이야기하기 전에, 아래의 이야기는 20%라는 분석 자체에 대해 뭐라고 하는 것은 아닙니다. 사실, 20% 확률로 석유가 있을 것이라는 이 분석 자체의 타당성이나 방법론에 대해서도 당연히 면밀한 검토가 있어야 하고, 또한 그 분석을 진행한 아브레오 박사와 액트지오 회사 등에 대해서도 확인이 당연히 필요합니다. 하지만, 일단 그 문제를 차치하고라도, 20% 확률을 그대로 받아들였을 때도, 1) 이를 해석하는 정부와 언론의 방식에 상당한 문제가 있었고, 2) 그 잘못된 해석을 비판하는 사람들의 방식 또한 오해가 있었습니다.
일단, 두 번째 이야기를 먼저 해보겠습니다. 즉, 정부와 언론의 해석을 우선 받아들이고, 이에 대한 가능한 반응을 보도록 하죠.
동전을 두 번 던져도 한번도 안 나올 수 있지 않느냐,에 대해
보통 우리가 확률이 p인 사건이 있을 때 이를 1/p번 정도 되풀이하다보면 한 번 정도는 일어난다고 말할 때, 이는 사실 '기대값'을 말하는 것입니다. 실제로는 한번도 안 일어날 수도 있고, 한번이 아니라 매번 일어날 수도 있지요. 하지만, 그 횟수의 기대값은 정확히 1이 됩니다. 한번 정도 일어나는 것을 기대할 수 있다는 말입니다. 그 기대가 꼭 현실화된다는 법은 없습니다. 기대값은 확률론에서 엄밀하게 정의되어 있는 용어입니다.
기대값이 아니라 확률로 따지면, 당연히 확률이 1이 될 수는 없습니다. 한 번 시도할 때에 그 사건이 일어나지 않을 확률은 1-p이고, 1/p번 (독립적으로) 시도해도 그 사건이 한번도 일어나지 않을 확률은 (1-p)^(1/p)입니다. 따라서, 1/p번 독립적으로 시도할 때에 최소한 사건이 한 번은 일어날 확률은 1-(1-p)^(1/p)입니다. p가 0으로 수렴하면, 이 값은 1-1/e로 수렴합니다. 여기서 e는 자연로그의 밑이고, 1-1/e는 대략 0.63 정도입니다. 즉, 매우 작은 확률 p로 일어나는 사건이라도 이를 1/p번 반복하면, 100%까지는 당연히 아니겠지만 63% 정도로는 그 사건이 일어납니다.
p가 작지 않으면 어떻게 될까요? p가 크면, 반복을 안 하더라도 일단 사건이 일어날 확률이 클 테니, 반복을 하면 더 커질 것을 예측할 수 있습니다. 실제로 그렇습니다. 1-(1-p)^(1/p)의 그래프를 그려보면 다음과 같습니다. p=0.2의 경우, 63%보다 좀 더 올라가 있죠. 67% 정도 됩니다.
67%라면 상당히 높은 값입니다만, 그럼에도 불구하고 이것도 마음에 안 든다? 그러면 간단합니다. 1/p번이 아니라 좀 더 해보면 됩니다. 예를 들어 그 두 배 정도를, 그러니까 2/p 정도를 해본다면? 그 경우, p가 0에 가까우면 한 번 이상 사건이 일어날 확률은 1-1/e^2, 대략 86.5% 정도가 됩니다. 세 배 정도 해보면? 확률은 1-1/e^3, 대략 95%가 됩니다. 확률이 20%라면 0보다는 꽤 큰 확률이기 때문에, 위의 극한값의 경우보다 실제로 확률이 더 나옵니다. 20%의 확률로 일어나는 사건을 15번 반복할 때 그 사건이 최소 한 번 일어날 확률은, 계산해보면 96.5% 정도가 나옵니다.
96.5% 정도면 그리 나쁘지 않게 느껴지지 않나요? 15번 정도면, 물론 적은 횟수는 아닙니다만, 그 사건이 실제로 일어났을 때에 얻게되는 수익이 매우 크다면, 해볼 만한 정도 아닌가요?
예를 들어, 가상의 로또를 하나 생각해 봅시다. 이 로또는 단순하게 당첨 혹은 꽝만 있습니다. 당첨 확률은 20%입니다. 로또 한 장의 가격은 100만원입니다. 당첨 상금은 1억원입니다. 매주 추첨합니다.
자, 사시겠습니까?
답을 말씀드리자면, 이 비현실적인 로또는 반드시 사야 합니다. 한 장에 무려 백만원이나 하기 때문에, 여러 장 구입하면 비용이 많이 들기는 합니다. 하지만, 당첨 상금이 비용을 상회하고도 남습니다. 위의 분석을 따라라기 위해, 매 주 한 장씩만 구입한다고 합시다. 그리고 15주 동안 꾸준히 매 주 한 장씩 구입한다고 하죠. (여러장 구입하면 아마도 더 좋겠습니다만, 귀찮으니까 그냥 매 주 한 장씩 구입한다고 합시다.) 그러면, 기본적으로 총 구입 비용은 1500만원입니다. 적지 않은 돈입니다. 하지만, 위의 분석에 따르면, 96.5%의 확률로 당신은 최소 1억원을 받게 됩니다. 이 정도면 무슨 수를 써서라도 돈 빌려서 종잣돈 마련해서 해야 하는 게임입니다. 매우 낮은 리스크와 매우 높은 수익이 보장되어 있는 게임이죠.
위의 분석은 '독립시행'이 전제되어 있습니다. 즉, 각각의 시추공을 뚫는 행위를 할 때에 석유가 발견된다는 사건이 각각의 시추공마다 서로 독립이라는 이야기입니다. 이를 비판해볼 수도 있습니다. 석유 시추에 대해 아는 것이 하나도 없기 때문에, 이게 독립 시행인지에 대해 확신하기는 어렵습니다. 아마도 아닐 것 같기는 합니다. 시추공을 하나 파고, 그 과정에서 그 주변 환경에 대해 좀 더 잘 알게 되고, 그 결과로 다음 시추공을 팔 때의 석유 발견 확률은 그냥 첫번째 시추공에서의 발견 확률과 다를 수도 있고 상관관계가 있을 수도 있지 않을까 싶습니다. 그런데, 아마도 그렇다고 해도 석유 발견 확률은 뚫을 수록 오히려 더 많이 올라갈 겁니다. 그리고, 제 짐작에는 이 부분은 독립 시행으로 근사하더라도 그다지 대단히 잘못된 결과가 도출되지는 않을 거라고 생각합니다.
결국, 여기서 문제는 독립시행은 아닙니다. 또한, 독립시행이라고 계속한다고 반드시 일어나지 않는다는 것도 대단한 문제는 아닙니다: 반드시 일어나지 않는 것은 물론 사실이지만, 또한 충분한 횟수를 반복하면 제어 가능한 확률로 일어남을 보장할 수 있는 것도 사실이거든요. 위의 로또의 예를 봐도, 정말로 정말로 위험을 극도로 회피하는 사람이라면 이런 조건에서도 안 산다고 할 수 있겠지만, 만일 어떤 회사에게 이러한 기회가 주어졌는데 이 기회를 걷어차는 결정을 누군가 한다면, 그 사람은 배임죄로 처벌되어야 한다고 봅니다.
요약하자면, 20%는 그리 나쁜 확률이 아닙니다. 해 볼 만한 거에요. 특히, 사건이 일어났을 때 얻게 되는 이익이 극도로 큰 사건이라고 하면, 위험을 감수하고라도 충분히 여러번 반복해서 해 볼 여지가 있습니다.
그럼 대체 여기서 문제는 뭘까요? 여기서 문제는 바로, 시추공을 한 번 뚫을 때에 석유가 나올 확률이 20%가 아닐 가능성이 매우 크다는 것입니다.
잠깐, 아까 20%라는 분석을 잠정적으로 받아들이고 하는 이야기라면서요? 근데 지금은 20%가 아니라고요?
네, 석유가 나올 확률은 20%일 수 있지만, 시추공을 동해의 그 광구에 한 번 뚫을 때에 석유가 나올 확률이 20%는 아닐 수 있습니다.
20%라는 확률의 의미
일단, 액트지오에서 20%라는 자신들의 분석을 해석하는 입장은, 정부나 언론이 말하는, '5번 파면 한번 나온다'와는 상당한 거리가 있습니다. 액트지오사의 자격이나 20%라는 분석의 타당성을 차치하더라도, 최소한 20%라는 수치가 무엇을 의미하는지에 대해서는 매우 분명하고 구체적으로 설명을 했습니다. 방한한 아브리오 박사는 다음과 같이 말했습니다.
The answer is …, don't get me wrong, it's still risky, rignt? which is twenty percent, meaning there is eighty percent chance that would not work.
What that means, what twenty percent chance means, is that if I have five that look like that one, I will find oil in one of them.
즉, 이번에 분석한 곳과 거의 유사한 환경이 다섯 군데가 있다고 하면, 그 중 한 군데 정도에서는 석유가 있을 거라는 이야기입니다. 날씨와 비슷합니다. 비올 확률이 20%라는 것에 대한 대체적인 표준적인 의미는, 기상 상황이 지금 이 상황과 거의 동일한 날을 100일 골라본다면, 그 날들 중 20일 정도는 비가 올 거라는 정도라고 알고 있습니다.
물론, 실제 석유라는 것은 0과 1처럼, 없거나 아니면 있거나 둘 중 하나로 나누어서 생각할 일은 아니기는 할 겁니다. 있다면 얼마만큼 있는가, 또한 경제성이 어떻게 되는가 등 세부적으로는 더 복잡한 고려가 필요하겠죠. 하지만, 이야기를 단순화하기 위해, 그냥 있다 없다로만 생각해 봅시다. 아브리오 박사도 결과적으로 그렇게 단순화해서 이야기한 셈이기도 하고요.
그렇다면, 80%의 확률로 그 동해 광구에는 석유가 없을 겁니다. 만일 동해 광구가 80%에 속하는 경우라고 하면, 이때 시추공을 하나 뚫을 때에 석유가 발견될 확률이 얼마나 될까요? 있다/없다로 단순화했기 때문에, 이때는 정말 없는 거고, 그래서 시추공을 하나 뚫을 때에 석유가 발견될 확률은 0입니다. 그렇다면, 이 경우에 해당된다고 하면, 시추공을 다섯 번을 뚫던, 5만번을 뚫던, 석유는 발견되지 않습니다.
만일 동해 광구가 그 20%에 속한다고 합시다. 그래서, 석유가 있어요. 이때 시추공을 하나 뚫는다고 하면 석유가 발견될 확률은 얼마나 될까요? 우리가 있는 경우를 전제했기 때문에, 이는 조건부 확률이 됩니다. 당연히 20%가 아닙니다. 아마도, 석유 시추에 대해 무지하기 때문에 뭐라고 제대로 말씀드리기는 어렵습니다만, 아마도 20%보다 더 높을 겁니다. 왜냐하면, 여기서부터는 그냥 전문성의 영역이기 때문입니다. 석유가 있다고 하더라도, 매장되어 있는 깊이가 있을 수 있고, 정확히 어디에 있는지를 알지 못하기 때문에, 잘 뚫어야 이를 찾을 수 있을 겁니다. 하지만, 석유가 묻혀있는 것이 확실하고, 탐사팀이 전문성을 갖추고 있다고 하면, 꽤 잘 뚫을 수 있겠지요. 100%까지는 당연히 아니겠지만, 예를 들어 50% 정도는 되지 않을까요? 그렇다면, 이 경우에는 불과 몇 번 뚫어보기만 하면 석유가 매우 높은 확률로 나올 겁니다.
이 상황에 대한 상당히 적절한 비유를 다음과 같이 해볼 수 있습니다. 동전던지기를 합니다. 앞면이 나올 확률은 1/2입니다. 이제 동전을 두 번 독립적으로 던집니다. 이때 앞면이 최소 한 번 나올 확률은 어떻게 될까요? 답은, 3/4, 즉 75%입니다. 두 번 다 뒷면이 나올 확률이 25%이기 때문에, 100%에서 빼면 답을 얻을 수 있지요.
하지만, 게임을 다음과 같이 바꿔봅시다. 제가 동전을 아주 많이 만듭니다. 다만, 저는 이상한 동전을 만들 거에요. 어떤 동전은, 양쪽이 다 앞면입니다. 다른 동전은, 양쪽이 다 뒷면입니다. 그렇게 앞면만 있는 동전과 뒷면만 있는 동전을 반반씩 만든 다음에, 수많은 사람들에게 무작위로 나눠줄 겁니다. 그리고, 이제 동전을 던져보게 할 겁니다.
여전히, 동전을 던져서 앞면이 나올 확률은 1/2입니다. 그래서, 동전을 두 번 던지면 최소 한 번은 앞면이 나올 확률은 3/4, 75%가 됩니다. 그런데, 조건이 있죠. 이 경우에, 동전을 받은 두 사람을 무작위로 골라서, 그 두 사람이 던지게 해야 합니다. 그러면 최소 한번은 앞면이 나올 확률은 여전히 75%가 됩니다.
하지만, 이건 내가 내가 받은 동전을 두 번 독립적으로 던질 때 앞면이 나올 확률이 어떻게 되는가와는 완전히 다른 이야기입니다. 내가 받은 동전은 앞면만 있거나 뒷면만 있거나 둘 중 하나입니다. 내가 받은 동전이 앞면만 있다고 하면, 두 번이 아니라 한 번만 던져도 앞면이 틀림없이 나올 겁니다. 그에 비해, 내가 받은 동전이 뒷면만 있다고 하면, 두 번이 아니라 천 번을 던져도 앞면이 나올 일은 없습니다.
이 동전의 비유가, 아브레오 박사가 이야기한 20%의 의미와 정확히 부합합니다. 동해에 석유가 있는가는, 결국 있거나 없거나 둘 중 하나입니다. 있거나 없거나 둘 중 하나인데 있을 확률이 20%라는 것이 대체 무슨 뜻인가? 어느날 비가 오든가 비가 오지 않든가 둘 중 하나이지만, 기상청은 비가 올 확률을 추산합니다. 그 확률의 의미는, 비슷한 조건의 날들이 여럿 있다고 하면, 그 중 20% 정도의 날에 비가 올 것이라는 의미입니다. 그럼에도 불구하고, 오늘은 비가 오거나 오지 않거나 합니다. 강수확률 20%가, 비가 하루 중에 20%의 시간 동안 온다는 뜻은 아닙니다.
여전히 독립 시행으로 20%라는 것은 매력적인 수치입니다. 동해 광구와 비슷한 조건의 지형이 지구에 여러 곳에 분포되어 있다고 하면, 그리고 그 지형들 중에 석유가 있는 곳이 20% 정도 된다고 하면, 그러면 그중 15군데 정도를 파 보면, 96.5%의 확률로 석유를 발견할 수 있습니다. 그러니까 국제적인 석유 탐사 기업들이 밥을 먹고 살 수 있습니다. 20%는 나쁘지 않아요. 전 세계를 돌아다니면서 20% 짜리 지형을 여러번 파 볼 수 있다면, 그래서 석유가 나올 때에 제대로 커미션을 챙길 수 있다면, 그렇게만 된다고 하면 이건 해볼 만한 일입니다.
하지만, 우리나라는 국제 석유 탐사 기업이 아니고, 동해 광구와 동일한 조건의 다른 여러 곳들 중에 20% 정도의 장소에 석유가 있다는 것 자체는 어떤 의미에서 그리 중요하지 않습니다. 우리에게 중요한 것은, 우리 바다에 석유가 있느냐의 문제이지요. 우리가 파볼 수 있는 곳도, 전 세계를 독립시행으로 파볼 수 있는 것이 아니라, 동해 광구를 파볼 수 있는 거니까요. 결국은 우리 바다에 있는 그 장소가 20%에 속하는지 80%에 속하는지의 문제입니다. 이를 알기 위해서는, 전 세계의 일반적인 지형이 아니라, 바로 우리 바다의 그 장소에 대한 정보를 더 알아야 합니다.
그리고, 그 장소에 대한 정보를 더 아는 한 가지 방법은, 물론, 파 보는 거겠죠. 20%에 속한다면 파 보면 곧 석유가 나올 테고, 80%에 속한다면 아무리 파도 안 나올 테니까. 그런데, 이미 우드사이드 사가 열심히 파 보지 않았나요? 실제로 파 보았다는 것은, 그냥 지형의 특성에 대한 일반적인 분석으로 20%를 추산하는 것과는 완전히 다른 이야기입니다. 전 세계에 대한 일반론이 아니라, 바로 우리 바다에 있는 그 광구가 20%에 들어가는지, 아니면 80%에 들어가는지를 알아본 셈이 됩니다.
이런 회사가 철수했다는 것은, 아마도 20%가 아니라 80%에 속한다는 것에 대한 설득력 있는 방증이 된다고 볼 수 있을 겁니다.
결국, 20%라는 분석을 믿는다 하더라도, 그 분석으로부터 '다섯 번 파면 한 번은 나온다'라는 결론을 끌어낼 수 있는 것은 아닙니다. 그리고, '다섯 번 파면 한 번은 나온다'라고 누가 말했다 하더라도, 그에 대한 반박이 '그래도 안 나올 수도 있잖아 바보야'는 아닙니다. 그냥 '확률이 20%니까 다섯 번 파면 한 번은 나온다'라는 이야기 자체가 잘못된 겁니다. 아브레오 박사조차 그렇게 말하지는 않았습니다. 정부와 언론이 지어낸 이야기에 불과합니다.
kissing님의 댓글
보라돌이님의 댓글
20%의 의미는 산유국이 아닌 곳에서 시추확률을 이야기하면 통상 20%라는 의미로 표현한다고...
매장량은 경제성이 나오기 전까지 언급하지 않는다....
국가 시스템이 무너지고 조선 멸망직전 민비가 있던 시기가 떠오르며 가슴이 먹먹하네요
일리맛있어님의 댓글
각 석유시스템 인자별 파라메터의 곱으로 정해지는 숫자인데,
시추 여러 번 한다고 각 파라메터의 점수가 올라가진 않죠. 시추를 통해 숫자가 업데이트 될 수는 있어도 성공 확률이 올라가지는 않을 겁니다.
시추 결과에 따라 오히려 더 내려갈 수도 있죠.
20%니까 다섯번 시도하면 성공? 이건 접근 자체가 틀린거죠.
아니, 애초에 반복시행을 논하는거 자체가 이 숫자에 대한 이해가 없기 때문이라 봅니다.