오픈AI와 마이크로소프트(MS)가 최근 글로벌 인공지능(AI) 업계를 강타한 중국 AI스타트업 ‘딥시크’가 오픈AI의 데이터를 사용했는지 여부에 대해 조사에 착수했다.
 |
중국 인공지능 스타트업 딥시크의 서비스 화면. 연합뉴스 |
이 회사는 미국 AI 선두주자에 비해 95% 저렴한 557만 6000달러(약 80억원) 가량을 사용해 AI모델 ‘딥시크-V3′를 개발했다고 밝혀 IT업계를 발칵 뒤집어 놨다.
이 같은 저비용의 배경이 오픈AI가 대규모 투자금을 끌여들여 개발한 데이터를 도용했다는 주장이 나왔다.
29일 블룸버그에 따르면 MS와 오픈AI는 데이터 유출 여부에 대한 조사에 착수했다고 밝혔다.
MS의 보안 연구원들은 지난해 가을 오픈AI의 API(프로그래밍 인터페이스)에서 대량의 데이터를 빼내는 정황을 발견했고, 이 움직임이 딥시크와 관련이 있을수 있다고 판단했다.
오픈AI는 중국에 기반을 둔 기관들이 자사의 AI 도구에서 대량의 데이터를 빼내려고 하는 여러 시도를 목격했다며 이는 ‘증류’(distillation)라고 불리는 기술적 과정을 통해 자체 모델을 훈련하기 위한 것으로 보인다고 설명했다.
‘증류’는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용, 유사한 기능을 개발하는 것을 의미한다.
MS 보안 연구원들도 지난해 가을 딥시크와 관련 있을 것으로 보이는 사람들이 오픈AI 애플리케이션 프로그래밍 인터페이스(API)를 사용해 대량의 데이터를 빼돌리는 것을 관찰했다고 말했다.
API는 소프트웨어 개발자들이 AI 기능을 자신들의 프로그램이나 앱에 넣을 수 있게 해주는 도구로, 이를 사용하기 위해서는 허가를 받아야 한다.
오픈AI는 자사 시스템에서 생성된 데이터를 사용해 동일한 시장에서 경쟁하는 기술을 구축하는 것을 허용하지 않고 있다.
오픈AI는 자사의 모델을 증류하려 한다고 의심되는 계정을 금지했으며, MS와 협력해 이런 시도의 배후에 있는 주체를 파악했다고 설명했다.
그러면서 딥시크가 자사의 “데이터를 무단으로 수집했을 가능성”이 있으며, 서비스 약관을 위반했다는 증거를 검토하고 있다고 전했다.
오픈AI는 “적과 경쟁자가 가장 강력한 미국 기술을 탈취하려는 노력을 막기 위해 미국 정부와 긴밀히 협력하는 것이 매우 중요하다”며 “중국 기반 기업들이 주요 미국 AI 기업의 모델을 지속적으로 증류하려고 노력하고 있다”고 전했다.
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]