중국의 딥시크가 미국 AI를 사용하는 것을 차단하기 어려운 이유
- 증류는 OpenAI와 같은 미국 기술 기업의 서비스 약관을 위반합니다
- 오픈소스 모델과 탐지의 어려움으로 인해 증류 중단이 어려운 상황
- 러트닉 상무부 장관 후보자, 의회 청문회에서 딥시크를 비판하다
이번 주 백악관 고위 고문들은 중국의 딥시크((link))가 "증류"라는 미국 경쟁업체의 발전에 편승한 것으로 추정되는 방법을 통해 이익을 얻었을 수 있다고 우려를 표명했습니다
실리콘밸리의 경영진과 투자자 소식통에 따르면 한 AI 시스템이 다른 AI 시스템으로부터 학습하는 이 기술은 멈추기 어려울 수 있다고 합니다.
딥시크((link))는 이번 달에 오픈AI((link) )와 같은 미국 대기업의 역량에 필적하는 것으로 보이지만 훨씬 저렴한 비용으로 새로운 AI 모델로 기술 분야((link))를 뒤흔들었습니다. 그리고 중국에 본사를 둔 이 회사는 코드를 무료로 제공했습니다.
일부 기술자들은 딥시크의 모델((link))이 미국 모델에서 학습하여 일부 이득을 취했을 수 있다고 생각합니다. 증류 기법은 더 오래되고 더 강력하며 확립된 AI 모델이 최신 모델에서 나오는 답변의 품질을 평가하여 이전 모델의 학습을 효과적으로 이전하는 것을 포함합니다.
즉, 최신 모델은 초기 모델 구축에 투입된 막대한 시간과 컴퓨팅 성능의 이점을 관련 비용 없이도 누릴 수 있습니다.
이러한 형태의 증류는 대부분의 학계 연구자들이 이전에 이 단어를 사용하던 방식과는 다르지만, AI 분야에서 흔히 사용되는 기법입니다. 그러나 이는 OpenAI를 포함하여 최근 몇 년 동안 미국 기술 회사들이 내놓은 일부 유명 모델의 서비스 약관을 위반하는 것입니다.
챗GPT 제조업체는 중국에서 증류를 통해 미국 AI 모델을 복제하기 위해 적극적으로 노력하는 그룹을 알고 있으며 DeepSeek가 모델을 부적절하게 증류했는지 여부를 검토하고 있다고 대변인은 로이터에 말했습니다.
서비스 약관이 금지하는 경우 이 기술을 사용하지 않는 샌프란시스코에 본사를 둔 데이터브릭스의 AI 담당 부사장 나빈 라오는 경쟁사로부터 학습하는 것은 AI 업계에서 "당연한 일"이라고 말했습니다. 라오는 이를 자동차 제조업체들이 서로의 엔진을 구입한 다음 검토하는 방식에 비유했습니다 .
"완전히 공정하게 말하자면, 이런 일은 모든 시나리오에서 일어납니다. 경쟁은 현실이며, 추출 가능한 정보가 있으면 그것을 추출하여 이기기 위해 노력하게 됩니다."라고 라오는 말합니다. "우리 모두는 선량한 시민이 되려고 노력하지만, 동시에 경쟁하고 있습니다."
하워드 러트닉 (link), 향후 AI 기술에 대한 수출 통제를 감독할 도널드 트럼프 대통령의 상무부 장관 후보자는 수요일 미 상원에서 열린 인준 청문회에서 딥시크가 미국의 AI 기술을 도용한 것으로 보인다며 규제를 가하겠다고 말했습니다.
"저는 딥시크가 모든 것을 정직하게 처리했다고 생각하지 않습니다. 말도 안 되는 소리입니다."라고 러트닉은 말했습니다. "저는 우리가 선두를 유지하기 위해 엄격하게 제한을 추구하고 그러한 제한을 시행할 것입니다."
백악관의 AI 및 암호화폐 담당 국장인 데이비드 색스(David Sacks (link))도 화요일 폭스 뉴스 인터뷰에서 딥시크의 증류에 대한 우려를 제기했습니다.
딥시크는 이러한 의혹에 대한 논평 요청에 즉시 답변하지 않았습니다.
오픈AI는 미국 기술을 보호하기 위해 미국 정부와 협력할 것이라고 덧붙였지만 구체적인 방법은 밝히지 않았습니다.
이 회사는 성명에서 "AI의 선도적 인 빌더로서 우리는 출시 된 모델에 포함 할 프론티어 기능을 신중하게 처리하는 등 IP를 보호하기 위해 대응책에 참여하고 있습니다."라고 말했습니다.
중국이 기술 부문을 발전시키기 위해 미국 제품을 사용하는 것에 대한 워싱턴의 최근 우려는 반도체 산업에 대한 이전의 우려와 유사합니다 (link), 미국은 중국에 선적할 수 있는 칩과 제조 도구를 제한하고 특정 공개 기술에 대한 작업 제한을 검토하고 있습니다 (link).
건초 더미에서 바늘 찾기
기술자들은 증류 차단이 보기보다 어려울 수 있다고 말합니다.
딥시크의 혁신 중 하나는 상대적으로 적은 수의 데이터 샘플(100만 개 미만 )로 더 큰 성능의 모델에서 더 작은 모델의 성능을 크게 향상시킬 수 있다는 것을 보여준 것입니다.
챗GPT((link))와 같이 수억 명의 사용자를 보유한 인기 제품의 경우 이러한 소량의 트래픽은 감지하기 어려울 수 있으며, 메타 Platforms의 META 라마와 프랑스 스타트업 Mistral의 서비스 같은 일부 모델은 무료로 다운로드하여 사설 데이터 센터에서 사용할 수 있어 서비스 약관 위반을 발견하기 어려울 수 있습니다.
"미스트랄이나 라마와 같은 오픈 소스 모델이 있으면 모델 증류를 막는 것은 불가능합니다. 누구나 사용할 수 있습니다. 또한 고객을 통해 어디선가 OpenAI의 모델을 찾을 수 있습니다."라고 톰베스트 벤처스의 전무이사 우메시 파드발은 말합니다.
메타의 라마 모델에 대한 라이선스에 따라 이 모델을 증류에 사용하는 사람들은 이를 공개해야 한다고 메타 대변인은 로이터에 말했습니다.
딥시크는 이번 달에 출시한 모델의 일부 증류 버전에 라마를 사용했다고 공개했지만, 그 이전에 메타의 모델을 사용한 적이 있는지에 대해서는 언급하지 않았습니다. 메타 대변인은 딥시크가 서비스 약관을 위반했다고 생각하는지 여부에 대해서는 언급을 거부했습니다.
주요 AI 연구소의 사정에 정통한 한 소식통은 딥시크와 같은 회사가 미국 모델을 추출하는 것을 막을 수 있는 유일한 방법은 금융 회사가 거래 대상을 식별하는 방식과 유사한 엄격한 고객 파악 요건뿐이라고 말했습니다.
하지만 이 소식통은 이와 같은 방안은 아직 확정된 것이 없다고 말했습니다. 조 바이든 전 대통령 행정부는 이러한 요구 사항을 제시했지만 도널드 트럼프 대통령은 수용하지 않을 수 있습니다.
백악관은 논평 요청에 즉시 응답하지 않았습니다.
클라우드에서 AI 모델을 호스팅하는 AI 컴퓨팅 회사 인 Groq의 최고 경영자 인 Jonathan Ross는 중국 기업이 호스팅하는 AI 모델에 편승하는 것을 차단하기 위해 모든 중국 IP 주소가 클라우드에 액세스하지 못하도록 차단하는 조치를 취했습니다.
- "사람들이 이를 우회할 방법을 찾을 수 있기 때문에 그것만으로는 충분하지 않습니다."라고 Ross는 말합니다. "우리는 이를 방지할 수 있는 아이디어를 가지고 있으며, 이는 고양이와 쥐의 게임이 될 것입니다
- 해결책이 무엇인지 모르겠습니다. 누구든 아이디어를 생각해내면 알려주시면 실행에 옮기겠습니다."
-
등록일 08:20
-
등록일 08:20
-
등록일 07:58