카테고리 없음

MS·오픈AI, 中 딥시크 오픈AI 데이터 도용여부 조사

상식살이 2025. 1. 30. 06:23
반응형

오픈AI와 마이크로소프트(MS)가 최근 글로벌 인공지능(AI) 업계를 강타한 중국 AI스타트업 ‘딥시크’가 오픈AI의 데이터를 도용(盜用)했는지 여부에 대해 조사를 시작하기로 했습니다.

딥시크는 미국 AI 기업에 비해 95% 저렴한 557만 6000달러 가량을 사용해 AI모델 ‘딥시크-V3′를 개발하였습니다. 이 같은 저비용의 배경이 오픈AI가 큰 돈을 들여 개발한 데이터를 도용했기에 가능했다는 주장이 나왔습니다.

MS와 오픈AI는 데이터 유출 여부에 대한 조사에 착수했습니다. MS의 보안 연구원들은 지난해 가을 오픈AI의 API(프로그래밍 인터페이스)에서 대량의 데이터를 빼내는 정황을 발견하고 이를 오픈AI에 통보했습니다, 이러한 활동은 API 이용 약관을 위반했을 수 있으며, 딥시크가 오픈AI의 지적 재산을 무단으로 사용했을 가능성을 시사합니다.

 

오픈AI는 AI서비스를 개발하는 소프트웨어 개발자들에 API를 판매하고 있는데, 일부 이용자가 제재를 우회하고 정상적으로 사용할 수 있는 데이터의 범위 이상을 빼냈다는 것입니다. 또한 오픈AI는 중국에서의 자사 API 사용을 금지하고 있습니다. 이 같은 의혹이 사실일 경우 중국 AI스타트업이 계획적으로 해외 사용자로 둔갑해 데이터 탈취를 시도했을 가능성이 제기된다고 합니다.

 

딥시크는 최근 미국 애플 앱스토어에서 오픈AI의 챗GPT를 제치고 1위를 차지한 무료 AI 어시스턴트 앱을 출시하여 주목받았습니다. 그러나 이러한 급성장에 대해 미국 당국은 지적 재산권 침해 가능성을 우려하고 있습니다. AI 전문가들은 딥시크의 모델이 오픈AI의 GPT-4를 활용하여 훈련되었을 수 있으며, 이는 오픈AI의 이용 약관을 위반하는 행위일 수 있다고 지적합니다.

 

이 같은 ‘데이터 도용’ 가능성은 도널드 트럼프 대통령의 ‘인공지능 차르’인 데이비드 삭스는 “딥시크가 오픈AI의 모델에서 지식을 추출했다는 상당한 증거가 있고, 오픈AI는 이에 기뻐하지 않을 것”이라며 “’증류(distillation)’라고 불리는 기술을 포함해 미국의 첨단 AI모델를 복제했다”고 주장했습니다.

딥시크는 모두에게 자료를 개방하는 메타의 라마 같은 오픈소스 시스템을 기반으로 자체 연구를 통해 모델을 제작했다고 했습니다.

 

딥시크가 엔비디아가 중국 수출을 위해 성능을 낮춘 제품 ‘H800′으로 AI를 개발했다는 점에 대해서도 의혹이 나오고 있습니다. 일론 머스크는 X에 딥시크가 엔비디아의 고성능 AI칩인 ‘H100′을 대량 보유하고 있을 것이라는 글을 올렸습니다.

 

 

 

 

출처: ChatGPT,조선일보,딥시크엑스

 

반응형