(출처=셔터스톡)

미국 독립윤리위원회(Independent Ethics Committee)가 건강관리에 사용되는 빅데이터를 위한 새로운 규제 기준을 마련한다. 제약 회사, 제약 및 의학 관련 연구진, 기술 회사 연구진 및 기타 관계자들은 건강관리를 위한 빅데이터를 '휴대용, 웨어러블, 혹은 소화되는 디지털 기기로 수집 및 측정한 객관적이고 정량화 가능한 생리 및 행동 데이터'라고 정의한다. 이것은 건강 및 건강관리에 광범위한 영향을 미치는 데이터다.

건강관리와 빅데이터

이런 데이터는 디지털 바이오마커로 수집한 광범위한 데이터 세트를 포함한다. 디지털 건강 컨설팅 회사인 볼라헬스(Volar Health)의 창립자 카를로스 로다르트는 "디지털 장치로 수집한 객관적인 데이터는 전통적인 방식으로 얻은 정보로는 볼 수 없던 부분까지 알려준다. 그런데 문제는 여러 회사들이 수집하는 데이터가 표면적으로는 건강과 관련이 없을 가능성도 있다"고 말했다.

예를 들어 어떤 회사는 사용자가 스마트폰을 두드리거나 스와이프하는 방식에 따라 사용자의 기분을 판단한다. 어떤 회사는 사용자의 페이스북 이용에 따라 약물 치료 필요 여부를 판단한다. 즉 연구 목적이 아니라 일반적인 상관 관계를 위해 무작위하고 광범위하게 수집되는 데이터가 늘어나고 있는 것이다.

수많은 회사가 수집한 온갖 종류의 데이터는 그 데이터의 가치를 알아보는 집단이나 개인에게 판매된다. 예를 들어 얼마 전 논란이 된 캠브리지 애널리티카(Cambridge Analytica, CA)가 있다. 이 회사는 광범위한 개인의 정보를 사들여 브렉시트 투표 및 2016년 미국 대선에 개입했다는 의혹을 받고 있다.

CA의 내부고발자에 따르면 이 회사는 거의 모든 종류의 데이터를 사용했다. 이들이 사용한 알고리즘의 가장 중요한 데이터 소스는 소셜네트워크인 페이스북으로부터 수집한 약 5,000만 개의 개인 정보다. 그런데 영국이나 미국에서 의료 목적으로 개인의 건강 정보 및 기타 정보를 수집하는 것은 법적으로 아무런 문제가 없다. 유일한 차이는 데이터에 대한 민감도 수준이다. 미국 의료정보보호법(HIPAA) 규정 준수는 필수적이며 공정하다. 하지만 환자 및 소비자의 특정 정보를 다룰 때 규정이 미치지 못하는 부분이 있다.

기업들은 법률을 위반하지 않고 개인 건강정보에만 중점을 둔 뒤 정보를 수집할 수 있다. 이들은 개인 식별 정보, 타사 광고, 소셜미디어 활동 등을 측정한다. 자세히 생각해 보면 건강과 관계가 없는 데이터 조차 건강 데이터로 간주돼 수집되는 것이다. 개인의 소셜미디어 활동이나 친목 활동은 건강과 전혀 관련이 없다.

(출처=셔터스톡)

디지털 행동 의학과 빅데이터

지난 2013년 카밀 네베커 박사가 디지털 행동 의학을 연구 분석했다. 네베커는 정보에 입각한 동의, 웨어러블기기, 데이터 통제에 의존했다. 독립윤리위원회는 이것이 여전히 위험한 방법이라고 생각했다. 이들은 참가자의 프라이버시와 안전, 그리고 그보다도 참가자의 주변인들, 참가자가 상호 작용하는 사람들의 프라이버시와 안전을 우려했다. 참가자들이 정보 수집 목적으로 착용하는 웨어러블기기에는 카메라가 포함됐으며, 카메라에 찍히는 것을 원치 않는 사람도 의도치 않게 찍힐 수 있기 때문이다. 즉 수집되는 데이터가 많아질수록 아직 존재하지 않는 새로운 표준이 필요하다.

네베커는 "문제는 우리가 연구 도중 각 참가자로부터 얻은 3만 장의 이미지로 무엇을 해야하는가다. 그리고 참가자로부터 얻은 GPS 데이터로 무엇을 해야 하는가다. 데이터가 원래 목적대로 사용되고 난 후, 이 데이터는 어떻게 돼야 하는가?"고 말했다. 네베커는 이후 캘리포니아대 샌디에이고캠퍼스에서 커넥티드 앤 오픈 연구 윤리 이니셔티브(Connected and Open Research Ethics initiative)를 설립했다. 이것은 퍼베이시브 센싱, 모바일 이미징, 위치 추적, 소셜미디어 사용 등이 연구 목적으로 사용되는 것에 대한 표준을 제시하기 위한 단체다.

현 시점에서 데이터 수집은 중단될 수 없으며 중단돼서도 안 된다. 데이터 수집으로 수많은 중요한 문제를 해결할 수 있기 때문이다. 예를 들어 얼마 전 에볼라를 언급한 15만 개 트윗 내용을 자연언어처리로 분석해 건강 정보 결핍을 알아본 연구 결과가 발표되기도 했다. 이제 우리는 수집한 정보를 어떻게 하면 긍정적인 방향으로 사용할 수 있을지 고민해야 한다.

[메디컬리포트=이찬건 기자]

저작권자 © 메디컬리포트뉴스 무단전재 및 재배포 금지