2016년 12월 11일 일요일

중국산 '근거중심의학'의 문제점

제목 : 중국산 '근거중심의학'의 문제점

부제목 : 방법론적 결함이 큰 임상연구들을 끌어모아 하는 메타분석의 한계



과학중심의학(Science-Based Medicine)의 최전선 기지인 사이언스베이스드메디슨 블로그.
▲ 과학중심의학(Science-Based Medicine)의 최전선 기지인 사이언스베이스드메디슨 블로그.


 본 콘텐츠는 '과학중심의학연구원(http://www.i-sbm.org)'이 제공하는 공익콘텐츠입니다. 이번 글은 미국의 수의사이며 근거중심수의학회 회장인 브레넨 맥켄지(Brennen McKenzie)의 글 'Chinese Systematic Reviews of Acupuncture'를 번역한 것입니다. 과학중심의학연구원의 김주년 특보와 황의원 원장이 같이 번역했으며, 독자들의 이해를 돕기 위해 의역을 많이 취했습니다.


과학중심의학에 불편감을 느끼는 근거중심의학의 지지자들에게는 다소 충격적일 수도 있는 입장을 밝히면서 이 글을 시작하겠다.

나는 근거중심의학(Evidence-Based Medicine, EBM)의 강력한 지지자이며, 현재 근거중심수의학협회(Evidence-Based Veterinary Medicine Association, http://www.ebvma.org)의 회장이기도 하다.

그러나, 나는 한편으로는 과학중심의학(Science-Based Medcine, SBM)의 주창자 중 한 사람인 킴볼 앳우드(Kimball Atwood)의 “사전 개연성(prior probability), 물리학 법칙(laws of physics), 또는 잘 확립된 기초과학적인 상식(plain common sense)에 대한 고려가 없는 근거중심의학이란 불완전하다”라는 명제에도 전적으로 동의한다.

(편집자 註 : 과학중심의학은 근거중심의학과 개념적으로 차이가 있다. 다음 링크의 글을 참조. 왜 “근거”중심의학이 아니라 “과학”중심의학인가? )

나는 과학중심의학과 근거중심의학이 상호보완적일 뿐 아니라 궁극적으로 두 단어가 동의어가 되어야 한다는 입장이다. 그래서 나는 과학중심의학과 근거중심의학의 차이를 설명하고, 특히 근거중심의학이 갖고 있는 한계들을 강조함으로써, 궁극적으로는 두 의학을 구분할 필요성이 느껴지지 않도록 하는 혁신이 의학계에서 이루어지리라 희망한다. 이런 혁신이 이뤄지기 위한 실천적인 방안 중 하나는, 근거중심의학이 종종 보완대체의학(Complementary & Alternative Medicine)에 의해 오용되고 악용당하고 있는 사례를 끄집어내는 것이다.

근거중심의학의 '근거 계층도(hierarchy of evidence)'에서 가장 높은 레벨의 근거이자 연구기법은 바로 '체계적 문헌고찰(systematic review)'이다. 여기서 체계적 문헌고찰과 비교되는 것은 '서술적 문헌고찰(narrative review)'이다. 서술적 문헌고찰은 저자가 연구주제와 관련이 있다고 고려하는 연구문헌들을 손수 선택하고 그 연구문헌들의 의미가 무엇인지를 주관적으로 정리하는 것이다. 이러한 서술적 문헌고찰은 '편향(bias)'의 위험이 높다.

서술적 문헌고찰과는 달리 체계적 문헌고찰은 이미 수립된 객관적이고 명쾌한 기준에 따라 진행된 '무작위 대조군 임상시험(Randomized Controlled Trial: RCT)'으로 수행된 연구문헌들을 종합해서 검토하는 연구기법이다. 체계적 문헌고찰은 이처럼 미리 결정된 기준을 사용해서 각 임상시험들의 신뢰등급을 매긴다. 이를 통해 연구주제와 관련된 임상시험들이 얼마나 잘 진행됐는지와 그 연구 결과들 사이의 관계를 규명할 수 있다. 제대로 시행됐을 경우에 체계적 문헌고찰은 특정한 의학적 의문에 대하여, 균형 감각있는 매우 훌륭한 답변을 제공한다.

하지만, 불행하게도 엉터리로 시행된 체계적 문헌고찰은, 사실은 어떤 가설을 뒷받침하는 근거가 전혀 없음에도 불구하고, 마치 그 가설을 지지하는 높은 '계급'과 '질적 수준'을 지닌 근거가 있는 듯한, 강렬하면서도 부정확한 인상을 남길 수 있다. 이런 신기루는 침술와 관련된 일부 체계적 문헌고찰 연구들이 잘 보여주고 있다.
 

근거중심의학의 근거 레벨 피라미드. 체계적 문헌고찰은 근거중심의학의 최상위 연구방법론이다.
▲ 근거중심의학의 근거 레벨 피라미드. 체계적 문헌고찰은 근거중심의학의 최상위 연구방법론이다.


침술은 보완대체의학 분야에서 가장 많이 연구된 치료법 중 하나다. 이 말은 고찰할 임상시험 연구논문들의 분량이 그만큼 많다는 것을 의미한다. 관계된 연구논문이 많다는 것은 침술이 특정한 질환에 효과적인지를 검증하는 데 있어서 좋은 일이라고 볼 수도 있겠다.

그러나 실상은 이와 다르다. 엄청난 연구논문들의 분량으로 인해, 외려 침술의 임상적 효과에 대한 진실을 가늠하기가 더 어려워진다. 많은 연구논문들이 쏟아질수록, 사실은 효과가 없는 치료법인 경우에도, 일부 효과가 있다는 오도된 연구논문들이 나올 가능성도 역시 높아지기 때문이다. 어떤 질적 수준이 의심스런 임상시험들이 있을 경우, 개별적인 임상시험 그 자체로는 결과를 신뢰하기가 어렵더라도, 이런 임상시험들을 종합했을 경우에는 실제와는 전혀 다르게 마치 긍정적 근거가 있는 듯한 결론을 도출하기도 역시 쉬워진다.

아닌게 아니라, 실제 그런 사례가 하나 있다. '대체-보완의료 저널(Journal of Alternative and Complementary Medicine)'이라는 학술지에 실린, 발작 이후의 통증 조절에 대한 침술 효과 '체계적 문헌고찰' 논문을 한번 살펴보자. 이 논문은 2012년도에 한국인 연구자들을 중심으로 발표된 것이다. ('Acupuncture for Shoulder Pain After Stroke: A Systematic Review ')

일단 해당 논문의 결론은 아주 긍정적인 것으로 보인다. “운동과 병행한 침술은 발작 이후의 어깨통증에 효과가 있다는 것이 본 체계적 문헌고찰의 결론이다.” 통상 체계적 문헌고찰에 의한 결론은 비교적 높은 레벨의 근거에 의한 것이라는 점을 감안하면, 침술이 어깨통증의 치료에 쓸모가 있다는 믿음이 생길 법도 하다.

하지만, 더 상세히 살펴보면 저 체계적 문헌고찰의 결론에 의문이 생긴다. 우선 453개의 임상시험 연구들이 체계적 문헌고찰로써 검증됐다지만, 400여개나 되는 임상시험 연구들 중에서 연구자들이 상정한 질적 기준에 부합한다고 평가된 임상시험 연구들은 고작 7개뿐이었다. (편집자 註 : 선정된 임상시험 연구에서 대조군 처리나 무작위 처리가 제대로 되지 않은 것들이 대부분이었다는 의미.)

이는 침술에 대해 호의를 갖고 연구하는 이들의 눈으로 보기에도 침술 관련 임상시험 연구들의 질적 수준이 대부분 형편없었다는 것을 의미한다. 나름의 기준을 통과한 7개의 임상시험 연구들조차 모두 중국에서 수행된 것이며, 중국의 학술지에서 발표됐고, 모두 다 침술이 효과가 있다는 내용의 긍정적인 결과였다. 임상시험의 조악한 수준과, 그 결과가 중국에서 발표됐다는 사실은 우리가 침술의 효과를 제대로 평가하는데 있어 장애요인이다.

중국에서도 훌륭한 과학적 연구들이 진행되고 있다는 사실에는 의문의 여지가 없다. 하지만 임상시험 시행이나 관련 연구 결과가 발표되는 것에 있어 중국에서는 어떤 시스템적인 문제가 있다는 근거가 있다. 무작위 처리가 됐다고 보고된 중국에서의 임상시험 연구들 상당수가 실제로는 무작위 처리가 되지 않았었다는 점이 확인됐던 바 있다. ( 'Randomized trials published in some Chinese journals: how many are randomized?' )
 

Trial라는 학술지에 실린 Randomized trials published in some Chinese journals: how many are randomized? 논문
▲ Trial라는 학술지에 실린 Randomized trials published in some Chinese journals: how many are randomized? 논문


1998년에 실시된 한 연구에 따르면 중국에서는 침술의 효과에 대한 그 어떤 부정적인 내용의 연구논문도 출판된 바가 없었다. ( 'Do certain countries produce only positive results? A systematic review of controlled trials' ) 이것은 중국에서 발표된 침술 관련 연구논문들이 연구기법상의 조악한 질적 수준은 물론, '출판편향(publication bias, 편집자 註 : 부정적인 결과의 연구내용은 발표하지 않고 긍정적인 결과의 연구내용만 발표하려는 연구자의 성향 때문에 발생할 수 있는 연구결과 왜곡)'의 높은 위험 때문에 신뢰할 수 없다는 사실을 드러내고 있다.

앞서 언급한 학술지인 '대체-보완의료 저널(Journal of Alternative and Complementary Medicine)'에 실린 중국산 체계적 문헌고찰 논문들에 대한 또다른 연구논문도 역시 어깨통증과 관련된 앞서 지적한 침술 관련 체계적 문헌고찰 연구논문에 대한 회의적 평가에 힘을 실어준다. ( 'Epidemiology, Quality, and Reporting Characteristics of Systematic Reviews of Acupuncture Interventions Published in Chinese Journals' ) .

본 논문의 저자들은 최근 중국에서 실시된 침술과 관계된 체계적 문헌고찰 연구논문들을을 검토하고 평가한 결과, 다음과 같은 사실들을 발견했다.
결과 : 총 88개의 체계적 문헌고찰 논문들을 살폈다; 이 논문들 중 단 한 개도 업데이트가 되지 않았다. 1/3 미만(27.3%)만이 임상의사(clinician)들에 의해 쓰여졌고, 1/3(35.2%)만이 전문학술지(specialty journals)에 실렸다. 이 논문들이 실린 학술지들 중에서 53.4%는 인용지수(impact factor)가 제로(0)였다. 해당 논문들의 절반 이상(59.1%)이 정보검색(Information retrieval)에 포함돼 있지도 않았다. 절반 미만(36.4%)은 출판편향(publication bias)이 보고됐다. 논문들 중 97.7%에서 “체계적 문헌고찰”(systematic review) 또는 “메타분석”(meta-analysis)이라는 단어가 제목에 사용됐음에도, 방법론적 프로토콜(protocol)조차 보고하지 않았으며 출판된 지 2년 이상이 지났음에도 단 한 개의 보고도 업데이트된 것이 없었다.

결론 : 침술에 대한 수많은 체계적 문헌고찰 연구논문들이 중국의 학술지들에서 출판되고 있지만, 그것들의 질적 수준은 문제가 아주 심각하다. 따라서 침술 관련 연구에 있어서 가장 시급한 일은 관련 체계적 문헌고찰 논문들을 계속 해서 무더기로 출판하는 게 아니라, 바로 체계적 문헌고찰의 질적 수준부터 높이는 데 진력하는 것이다. 중국에서 출판된 대부분의 침술 관련 체계적 문헌고찰 연구들이 선정된 임상시험들에 대해서 철저히 검토하지 않고 있으며 해당 연구들에 대하여 제대로된 평가를 하지 않고 있기 때문에, 이는 마땅히 이뤄져야 할 일이다. 해당 임상시험들 중 상당 부분이 의문시된다는 근거가 존재하는 상황에서는, 그것들을 기반으로 해서 진행된 체계적 문헌고찰의 결론도 충분히 의심할 여지가 있다.
침술의 효과를 긍정하는 이들은, 자신들의 연구결과가 근거중심의학의 원리를 따르는 체계적 문헌고찰에 의해 도출된 것이라서 믿을만하다고 주장하고 있다. 하지만 그들이 수행한 체계적 문헌고찰은 근거(임상시험 자료들) 수집에서부터 이미 균형감각을 상실했을 가능성이 높다. 

만약 해당 체계적 문헌고찰이 편향된 샘플들과 애초 신뢰성이 의심스러운 임상시험들을 포함시키는 등의 조악한 질적 수준으로 수행된 것이라면, 연구자에게 침술의 효과에 대해 부정확한 인상을 전할 수 밖에 없다.
 

통증 관련 저명한 학술지인 Pain에 실린 논문 Acupuncture: Does it alleviate pain and are there serious risks? A review of reviews
▲ 통증 관련 저명한 학술지인 Pain에 실린 논문 Acupuncture: Does it alleviate pain and are there serious risks? A review of reviews


‘침술 관련 체계적 문헌고찰’ 논문들을 모아서 또다시 체계적 문헌고찰을 시행해본 연구도 있다. ( 'Acupuncture: Does it alleviate pain and are there serious risks? A review of reviews' ) 이 연구를 통해 확인된 사실은 침술의 효과는 여전히 검증이 되지 않고 있다는 점이다. 수많은 침술 관련 체계적 문헌고찰 연구들은 침술이 통증 감소에 효과가 있다는 어떤 설득력 있는 근거를 거의 제시하지 못하고 있다.

사실 어떤 주제로 수많은 연구가 이뤄지면, 관련 가설을 입증하는 쪽이건 반증하는 쪽이건 높은 수준의 근거를 생성하는 것이 가능해진다. 이 경우에는 침술이 통증을 감소시킨다는 결론과 그렇지 않다는 결론이 동시에 나올 수도 있다. 헌데 이런 식의 상반되는 결론들은 해당 주제에 대한 이해를 더 어렵게 만들 뿐이다. 왜냐하면 연구자들은 흔히 침술에 대한 자신의 선입견적(a priori) 입장을 뒷받침하는 연구결과들만 인용해 정당화에 나설 수 밖에 없기 때문이다.

어떤 치료법을 뒷받침하는 근거의 질적 수준을 평가하는 또 한가지 방법은, 관련 연구들의 질적 수준을 긍정적 결과들의 '가능도'(可能度, likelihood, 편집자 주 : 우도(尤度)라고 번역되기도 하는 개념으로, 통계학에서 자료 검증에 사용되는 기법중 하나다.)와 비교하는 것이다. 바커 바우셀(R. Barker Bausell)은 자신의 책 ‘스네이크 오일 사이언스(Snake Oil Science)’ 에서 침술을 이런 방식으로 검토했다.

검토 결과, 지금껏 발표된, 침술과 관련 가장 높은 수준의 연구들은 침술이 플라시보(가짜) 침술에 비해 효과가 더 낫지 않다는 결론을 반복해서 보여주고 있다.(http://skeptvet.com/Blog/2010/08/another-acupuncture-study-shows-its-a-placebo">'Another Acupuncture Study Shows It’s a Placebo' ) 심지어 이쑤시개를 가지고 피부를 무작위로 찔러도 “실제” 침술과 같은 효과가 난다는 연구결과마저 나왔다. ( 'Another acupuncture study misinterpreted' )

질적 수준이 떨어지는 연구들일수록 침술의 효과에 대해 더 긍정적인 결과를 내는 경향이 있다. 이 또한 그간 침술에 대해 긍정적 결과를 낸 임상시험들의 신뢰성에 의심을 갖게 하는 일이다.

물론 침술 옹호론자들은 주저없이 지적할 것이다. 어쨌거나 일부 체계적 문헌고찰 연구를 통해 침술이 모호하나마 효과가 있다고 나온 상황이니만큼, 앞서 언급한 부정적 연구들로써 침술의 효과가 절대 없다는 확실한 입증이 되지는 못한다고 말이다.

그러나 지금까지의 침술 관련 연구들이 명백하게 입증해낸 사실도 하나 있다. 그것은 바로 침술의 효과가 완벽히 입증되거나, 깊은 신뢰를 보낼만한 어떤 일관된 근거가 제시되지 못한 채로 막대한 시간, 에너지 및 자금이 침술 연구에 소모됐다는 사실이다.
 


개연성(plausibility) 및 사전확률(prior probability)의 개념들은 과학중심의학(SBM)과 근거중심의학(EBM) 사이의 논쟁거리로서 종종 거론되고 있다. 확립된 과학적 지식과의 연계성을 중시하는 과학중심의학 지지자들과는 달리, 나는 근거중심의학 쪽의 입장에서 잘 확립된 이론적 기반이 없는 치료법들에 대해서도 임상시험은 일단 시도해볼 수 있다고 생각한다.

임상역학(clinical epidemiology)의 초기 선각자들 중 한명인 오스틴 브래포드 힐 경(Sir Austin Bradford Hill)은 다음과 같이 말한 바 있다. “생물학적 개연성은 그 시기의 생물학적 지식에 의해 좌우된다(What is biologically plausible depends upon the biological knowledge of the day)” 보완대체의학 옹호론자들이 기꺼이 얘기하듯이, 우리의 과학적 지식도 완전하지 않기에 가끔은 기존의 과학적 지식과 완전히 동떨어진 별난 생각들도 진실로 입증되곤 한다는 것은 진리이다. 별난 생각에 대해서도 일단 개방적 입장을 취해야할 것이다.

다만, 과학의 보수성과 한계를 지적하는 보완대체의학 옹호론자들도 놓치는 문제가 있다. 그것은 바로 엄밀한 실험에 의해서 입증됐을 경우엔 우리 과학계도 별난 생각들을 아주 잘 수용한다는 사실이다. 헬리코박터균(Helicobacter)이 십이지장궤양(duodenal ulcers)을 유발할 수 있다는 이론도, 처음 제시됐던 1982년에는 개연성이 없다고 평가됐었다. 하지만 2005년에는 이 헬리코박터 이론이 노벨상의 주인공이 됐다. 이것은 애초에는 논란이 있었던 아이디어가 보수적인 과학계에서도 매우 빠르게 인정을 받은 경우다. 만일 당신이 ‘주류 과학은 본디 독단적이며 폐쇄적’이라는 편견을 가지고 있었다면, 헬리코박터균의 사례가 아주 신선하게 느껴질 것이다.

단, 실제 현실에서는 대개의 별난 생각들은 헬리코박터 이론의 사례처럼 ‘혁명적’이라고 입증되기 보다는, 그냥 틀렸다고 반증이 되어버릴 가능성이 훨씬 높다는 점도 지적되어야 한다. 산덴(Sanden)의 '전기벨트 이론(편집자 註 :19세기 미국의 산덴 박사가 제시한 것으로 전기가 통하는 벨트를 차면 병을 고치고 건강을 증진시킨다는 이론)은 박테리아가 궤양을 유발시킨다는 이론만큼이나 괴상했는데, 역시나 전기벨트 이론은 노벨상 위원회로부터 아무 관심을 받지 못한 채 역사 속으로 사라졌다. 돈과 시간, 재능이 한정된 상황에서(사실 언제나 그렇다), 개연성이 낮은 아이디어에 이러한 자원들을 투자하는 일은 정당화되기 어렵다.

완벽하게 풍요로운 세상이 있다면, 그런 세상에서는 제안되는 모든 치료법들에 대해 상세하면서도 방법론적으로 적절한 실험들이 이뤄질 수도 있을 것이다. 하지만 현실세계에서 우리는 환자들에게 실제로 도움을 줄 가능성이 조금이라도 더 높은 아이디어들에 역량을 집중시켜야 한다. 우리는 이미 과학적으로 잘 확립된 지식들을 무시하거나 뒤집어버리기 보다는, 그 지식들에서 파생된, 보다 개연성있는 아이디어들에 희망을 걸어야한다.

마지막으로 덧붙이자면, 어떤 아이디어를 검증하는 데 있어서 시간과 자원을 합리적으로 한정짓는 일은 반드시 필요하다. 상당한 노력이 투입됐음에도 불구하고 강하고 일관된, 어떤 일련의 근거를 얻는 데 실패했다면 그만 다른 쪽으로 눈을 돌리는 것이 좋다.

침술의 경우, 그것이 효과가 있음을 설명하기 위해 제시되는 이론적 메커니즘(기, 혈, 경락 등)부터가 신비주의적 생기론(vitalistic)에 기반하고 있으며, 기존의 잘 확립된 과학적 지식과 일치하지 않는다. 물론 기존 과학적 지식을 벗어난, 어떤 대안적 메커니즘들을 찾으려는 시도들은 생리학(physiology) 및 통증 감각의 조정(mediation)에 대한 일부 흥미로운 지식을 쌓게 해주었다. 그러나 침술을 비롯한, 이른바 보완대체요법들은 정확한 근거를 지닌, 논리적으로 통일된 이론을 형성하지 못하고 있다. 지난 수십년간 수많은 임상시험들이 실시됐음에도 불구하고, 침술이 플라시보 이상의 효과를 낸다는 어떤 일관된 근거가 발견되지 않았다.

따라서 침술의 효과에 대한 진실을 규명하기 위해서는, 학술지에 발표된 침술 관련 체계적 문헌고찰 논문들을 단순히 살펴보는 것 이상의 작업이 요구된다. 적용된 체계적 문헌고찰 자체에 대해서는 물론이고, 선정되고 평가된 임상시험 연구들의 질적 수준에 대한 비판적 검토가 있어야 하고, 임상시험들만이 아니라 근거중심의학에서 규정하는 모든 레벨의 근거들에 대한 비판적 검토가 선행돼야 한다.

궁극적으로, 침술이 효과가 있을지에 대하여, 기나 경혈 운운하는 그 이론적 메커니즘에 대해서도 비판적 검토가 있어야 할 것이다. 그 이론적 메카니즘이 과연 정확한 근거에 의해 뒷받침되고 있는지, 기존에 잘 확립된 과학적 지식과 대립하지 않는지 여부를 살펴야 한다. 편향성의 위험이 높은, 질적수준이 떨어지는 임상시험들을 수집해서, 거기다가 또다시 질적수준이 떨어지는 체계적 문헌고찰을 수행한 후에 그 결론을 액면 그대로 받아들이자고 하는 것은 근거중심의학의 오용(misuse)일뿐이다. 모든 수준의 의문과 근거에 대하여 더 포괄적인 검토가 있어야 한다.

이것이 바로 과학중심의학(SBM)이며, 우리 근거중심의학(EBM)이 나아가야 할 방향이기도 하다.

댓글 없음:

댓글 쓰기