최적의 항암 약물 예측하는 오픈소스 머신러닝 소프트웨어

2019-01-14 13:26:37 허성환 기자
▲암 환자들이 사용할 수 있는 여러 가지 치료법이 있다(사진=ⓒ셔터스톡)

암에 걸리면 초기 치료 시 가장 중요한 요법으로 간주되는 1차 요법을 받게 된다. 1차 요법은 암 유형 및 진행 단계에 따라 의료 기관에서 허용하고 있는 치료법이다. 보통 악성 종양에 사용되는 항암화학요법 약물을 처음 사용하기도 한다.

사람마다 치료법은 다양하게 작용하므로 의사들은 암에 가장 적합한 치료 계획을 제안해 부작용을 최소화하려 한다. 그러나 가장 중요한 요법이 효과가 없거나 중증의 부작용을 낳는다면 어떤 일이 벌어질까? 의사들은 2차 요법을 제안할 수 있지만 어떻게 결정할 수 있을까? 조지아공과대학 연구팀은 이를 위해 새로 개발한 오픈소스 결정 지원 도구를 적용할 수 있다고 주장했다.

오픈소스 툴은 특정 약물에 대한 환자의 약물 반응 정보와 RNA 발현을 조사하기 위해 머신러닝을 사용한다. 이 방법으로 암 환자에게 맞는 최적의 항암화학약물을 선택할 수 있는 것이다.

이번 연구에서는 152명의 환자 기록에서 RNA를 조사했다. 그리고 이 툴을 사용해 최상의 결과를 도출한 항암화학요법 약물을 예측했다. 연구팀은 인구통계 및 가족력 같은 중요한 데이터와 함께 환자의 추가 기록을 포함해 시스템의 정확성을 개선할 가능성이 있다고 밝혔다.

이번 연구의 선임저자인 조지아공과대학의 존 맥도널드 교수는 “종양의 RNA 발현을 평가해 특정 약물에 대한 반응을 정확하게 예측할 수 있게 됐다”고 말했다. 따라서 “의사들은 최적의 항암화학요법에 대해 정확한 결정을 내릴 수 있게 됐다”고 덧붙였다.

▲조지아공과대학 연구진이 환자의 RNA를 사용해 새로운 오픈소스 머신러닝 툴을 개발했다(사진=ⓒ셔터스톡)

오픈소스 머신러닝 툴

연구팀은 데이터 세트 일부를 사용해 시스템을 훈련하기 시작했다. 그 후 남은 데이터로 운영 상황을 테스트했다.

시스템을 개발하기 위해 연구팀은 종양의 RNA 기록과 특정 약물을 사용한 치료법 결과를 수집했고 이용 가능한 152개 기록 중 114개 기록을 사용했다. 이후 남은 38개 기록으로 RNA 서열을 사용해 종양을 줄이기에 적합한 최상의 항암화학요법 약물을 예측하는 시스템을 테스트했다.

최초 분석은 난소암에 국한됐지만 이후 췌장암, 유방암, 폐암 및 간암 등을 포함해 여러 가지 유형의 암까지 확장시킬 수 있었다. 맥도널드 교수는 연구 모델의 주요 목표는 암 유형에 관계없이 약물을 토대로 모든 환자를 예측 및 평가하는 것이라고 밝혔다.

머신러닝 툴은 각각의 약물이 환자의 특정 암에 미치는 영향의 확률을 비교하는 차트를 생성하게 된다. 즉, 임상 환경에서 의사들은 치료 결정을 내리기 전에 다른 환자의 정보와 비교 하고 예측할 수 있게 된다는 의미다.

RNA 분석은 DNA 염기서열 분석에 비해 유리할 수 있다. 유전자 발현 수준을 측정할 수 있기 때문이다. 그러나 약물 요법을 선택할 때 두 가지 정보 유형 모두 중요할 수 있다. 게다가 RNA 비용은 상당히 저렴하며 곧 유방조영상 비용보다 저렴해질 수 있다.

연구진은 오픈소스 소프트웨어가 상용화되면 의사들이 항암 치료에 채택하게 될 것이라고 기대하고 있다. 알고리즘으로 많은 환자 데이터를 조사할 수 있기 때문에 정확성도 높아질 수 있다고 덧붙였다.

▲툴을 개발하기 위해 환자의 RNA 샘플과 치료 약물 데이터를 수집했다(사진=ⓒ셔터스톡)

맥도널드 교수는 이 시스템이 임상 환경에 적용되면, 다른 과학자들도 필요할 때마다 사용 및 수정할 수 있도록 개방할 것이라고 밝혔다. 그리고 “인터넷 기술에 적용된 오픈소스 전략 유형을 사용해 암 요법에 독자적인 패러다임을 개발하는 것이 목표”라고 덧붙였다.

여러 분야의 다수 전문가들이 오픈소스 코드를 사용해 소프트웨어를 평가하고 오류를 잡아내 개선점을 제안했다. 즉, 누구든 공개적으로 잠재적인 문제를 점검하고 시스템을 개선할 수 있다는 것이다.

이번 연구의 공동저자인 프레드릭 반버그 교수는 이 시스템을 사용해 환자의 상황에 맞는 최상의 결정을 내릴 수 있을 것이라고 밝혔다. 이 시스템은 오픈소스 깃허브에서 다운로드 받아 사용할 수 있다. 병원들도 이 시스템을 사용할 수 있으며 결과는 공유하지 않을 수 있다.

데이터 수와 데이터 다양성이 증가할수록 시스템의 정확성이 개선될 가능성이 높다. 그리고 DNA 데이터에 환자 병력 및 인구통계 정보가 포함되면 더욱 발전될 수 있을 것으로 보인다. 시스템에 포함되는 정보를 통해 특정한 항암 약물을 성공적으로 예측할 수 있기 때문이다.

[메디컬리포트=허성환 기자]

[메디컬리포트=허성환 기자]