알리바바, 딥시크-V3를 능가하는 AI 모델 출시
중국 기술 기업 알리바바 BABA는 수요일에 새로운 버전의 인공지능 모델인 Qwen 2.5((link))를 출시했는데, 이는 호평을 받았던 DeepSeek-V3를 능가한다고 주장했습니다.
대부분의 중국인이 가족과 함께 쉬는 음력 설날 첫날이라는 이례적인 시기에 Qwen 2.5-Max가 출시된 것은 지난 3주 동안 중국 AI 스타트업 딥시크((link))의 급격한 상승세가 해외 라이벌뿐 아니라 국내 경쟁사들에게도 얼마나 압박을 주고 있는지를 보여주는 대목입니다.
알리바바의 클라우드 사업부는 공식 WeChat 계정에 올린 발표에서 "Qwen 2.5-Max는 거의 전반적으로 GPT-4o, DeepSeek-V3, Llama-3.1-405B보다 성능이 뛰어나다"고 말하며 OpenAI와 Meta의 최첨단 오픈소스 AI 모델을 언급했습니다.
1월 10일 딥시크의 AI 비서인 딥시크-V3 모델과 1월 20일 R1 모델이 출시되면서 실리콘밸리에 충격을 주고 기술 주가가 급락했으며, 이 중국 스타트업의 개발 및 사용 비용이 저렴하다고 알려진 (link) 투자자들은 미국의 주요 AI 기업들의 막대한 지출 계획에 의문을 제기하고 있습니다.
그러나 딥시크의 성공으로 인해 국내 경쟁업체들도 자체 AI 모델을 업그레이드하기 위해 분주하게 움직이고 있습니다.
딥시크-R1이 출시된 지 이틀 후, 틱톡의 소유주인 바이트댄스는 자사의 주력 AI 모델인 (link) 의 업데이트를 발표했는데, 이 모델은 AI 모델이 복잡한 명령을 얼마나 잘 이해하고 반응하는지 측정하는 벤치마크 테스트인 AIME에서 마이크로소프트가 지원하는 OpenAI의 o1보다 뛰어난 성능을 보였다고 주장했습니다.
이는 여러 성능 벤치마크에서 자사의 R1 모델이 OpenAI의 o1에 필적한다는 DeepSeek의 주장을 뒷받침하는 결과입니다.
-
등록일 21:34
-
등록일 21:34
-
등록일 21:03
-
등록일 20:52