DeepSeek의 새로운 오픈소스 AI 추론 모델 R1은 엔비디아 주가의 급락을 초래했으며, 소비자용 애플리케이션이 앱스토어 상위권에 오르는 결과를 낳았습니다.
지난달 DeepSeek은 약 2,000개의 엔비디아 H800 GPU를 사용해 데이터 센터에서 약 두 달 동안 모델을 훈련했으며, 이에 약 550만 달러의 비용이 들었다고 밝혔습니다. 지난주 DeepSeek은 최신 모델의 성능이 세계에서 가장 앞선 추론 모델들과 동등한 수준임을 보여주는 논문을 발표했습니다. 이러한 모델들은 수십억 달러를 투자해 더 빠르고 비싼 엔비디아 AI 칩을 사용하는 데이터 센터에서 훈련되고 있습니다.
DeepSeek의 고성능이면서 비용이 낮은 모델에 대한 기술 산업 전반의 반응은 뜨겁습니다. 예를 들어, 전 인텔 CEO이자 현재 IPO를 준비 중인 스타트업 글루(Gloo)의 회장인 팻 겔싱어는 소셜 플랫폼 X에 “DeepSeek 팀에게 감사한다”라는 글을 기쁘게 올렸습니다. 겔싱어는 지난 4년 동안 인텔에서 엔비디아의 AI GPU 대안인 Gaudi 3 AI를 개발하며 경쟁에 나섰지만, 지난해 12월 인텔을 떠났습니다. 글루는 교회를 위한 메시징 및 참여 플랫폼입니다.
겔싱어는 DeepSeek이 기술 산업에 세 가지 중요한 교훈을 상기시켜야 한다고 말했습니다. 첫째, 낮은 비용은 더 넓은 보급으로 이어진다. 둘째, 제약 아래에서 창의성이 꽃핀다. 셋째, “오픈이 승리한다(Open Wins).” 그는 “DeepSeek은 점점 닫혀가는 AI 모델 개발 세계를 재정립하는 데 기여할 것”이라고 덧붙였습니다. OpenAI와 Anthropic은 모두 폐쇄형 소스입니다.
겔싱어는 TechCrunch와의 인터뷰에서 R1의 성능이 매우 인상적이라 글루는 OpenAI를 도입하거나 비용을 지불하지 않기로 결정했다고 밝혔습니다. 글루는 챗봇 및 기타 서비스를 제공하는 AI 서비스 Kallm을 개발 중입니다.
“우리 글루 엔지니어들은 오늘도 R1을 실행 중입니다.”라고 그는 말했습니다. “그들은 o1(OpenAI 모델)을 실행할 수도 있었지만, API를 통해서만 접근할 수 있습니다.”
대신, 글루는 2주 안에 “완전 오픈소스 기반의 자체 모델로 Kallm을 처음부터 재구축할 것”이라고 밝혔습니다. “매우 흥미로운 일입니다.”
그는 DeepSeek이 AI 비용을 획기적으로 낮춰, 단순히 AI가 모든 곳에 보급되는 것을 넘어 더 나은 AI가 모든 곳에 보급될 것이라고 확신했습니다. 그는 “내 Oura Ring에서 더 나은 AI를 원하고, 내 보청기에서 더 나은 AI를 원하며, 내 스마트폰에서 더 나은 AI를 원한다. 그리고 내 전기차의 음성 인식 같은 내장 기기에서도 더 나은 AI를 원한다”고 말했습니다.
겔싱어의 이러한 긍정적인 반응은 일부 부정적인 반응과는 대조적이었습니다. R1과 같은 고성능의 저비용 모델이 등장하자 AI 비용이 낮아지기보다는 점점 더 비싸지고 있다는 점에서 우려가 제기되었습니다.
일부는 DeepSeek이 훈련 비용을 과소 평가했거나, 미국의 AI 칩 수출 제한으로 인해 고급 칩 사용을 밝히지 못한 것일 수 있다고 주장했습니다. 또 다른 일부는 R1의 성능을 깎아내리며 다른 모델들이 더 나은 결과를 보여주는 부분을 지적했습니다. 일부는 OpenAI의 차기 모델인 o3가 R1을 크게 능가해 현 상태를 회복할 것이라고 믿고 있습니다.
겔싱어는 이러한 반응에 개의치 않으며, “대부분의 작업이 중국에서 이루어진 만큼 완전한 투명성은 없겠지만, 여전히 R1 훈련 비용은 o1보다 10~50배 저렴하다는 증거가 있다”고 말했습니다.
그는 DeepSeek이 하드웨어 성능과 컴퓨팅 자원을 늘리는 대신 엔지니어링 창의성으로 AI를 발전시킬 수 있음을 증명했다고 평가했습니다. “이는 정말 흥미로운 일입니다.”
중국 개발자와 관련된 프라이버시나 검열에 대한 우려에 대해서는 겔싱어는 비유적으로 고개를 저으며, “중국이 우리에게 개방형 생태계의 힘을 상기시키는 것이 서구 세계에 조금 부끄러운 일이 될 수 있다”고 말했습니다.