중국의 AI 기업들이 OpenAI와 다른 미국 기반 AI 기업들이 개발한 시스템들과 경쟁할 수 있는 AI 모델들을 계속해서 출시하고 있습니다.
이번 주에 알리바바와 텐센트의 지원을 받는 스타트업인 MiniMax는 약 8억 5천만 달러의 벤처 자금을 모금하고 25억 달러 이상의 가치를 지닌 기업으로, 세 가지 새로운 모델을 발표했습니다: MiniMax-Text-01, MiniMax-VL-01, T2A-01-HD. MiniMax-Text-01은 텍스트 전용 모델이고, MiniMax-VL-01은 이미지와 텍스트를 모두 이해할 수 있는 모델이며, T2A-01-HD는 음성을 생성하는 모델입니다.
MiniMax는 4560억 개의 파라미터를 가진 MiniMax-Text-01이 MMLU와 SimpleQA와 같은 벤치마크에서 구글의 최근 발표된 Gemini 2.0 Flash 모델보다 성능이 우수하다고 주장합니다. 이러한 벤치마크는 모델의 수학 문제와 사실 기반 질문을 해결하는 능력을 측정합니다. 파라미터는 모델의 문제 해결 능력에 대체로 해당하며, 파라미터가 많은 모델일수록 성능이 더 우수한 경향이 있습니다.
MiniMax-VL-01은 다중 모드 이해를 요구하는 평가에서 Anthropic의 Claude 3.5 Sonnet과 경쟁할 수 있다고 MiniMax는 주장합니다. 예를 들어, ChartQA와 같은 그래프와 다이어그램 관련 질문을 답하는 테스트에서 높은 성능을 보입니다(예: “이 그래프에서 주황색 선의 최고값은 얼마인가?”). 그러나 MiniMax-VL-01은 많은 테스트에서 Gemini 2.0 Flash에 비해 다소 밀리고, OpenAI의 GPT-4o와 InternVL2.5와 같은 개방형 모델에도 여러 번 뒤처집니다.
특히, MiniMax-Text-01은 매우 큰 컨텍스트 윈도우를 가지고 있습니다. 모델의 컨텍스트 또는 컨텍스트 윈도우는 모델이 출력을 생성하기 전에 고려하는 입력을 의미합니다. MiniMax-Text-01은 400만 개의 토큰을 다룰 수 있어 한 번에 약 300만 단어를 분석할 수 있습니다. 이는 “전쟁과 평화” 약 5권 분량에 해당합니다. 참고로, MiniMax-Text-01의 컨텍스트 윈도우는 GPT-4o와 Llama 3.1의 약 31배 크기입니다.
MiniMax가 이번 주에 발표한 마지막 모델인 T2A-01-HD는 음성을 생성하는 모델로, 발음, 톤, 템포 등을 조정할 수 있는 합성 음성을 17개 언어로 생성할 수 있으며, 10초의 오디오 녹음으로 특정 음성을 복제할 수 있습니다.
MiniMax는 T2A-01-HD의 성능을 다른 음성 생성 모델과 비교한 벤치마크 결과는 공개하지 않았지만, 기자의 귀에는 Meta와 PlayAI와 같은 스타트업의 오디오 모델들과 비슷한 수준으로 들렸습니다.
T2A-01-HD를 제외한 MiniMax의 새로운 모델들은 GitHub와 AI 개발 플랫폼인 Hugging Face에서 다운로드할 수 있습니다. 하지만 “오픈 소스”로 제공된다고 해도 모든 것이 완전히 열려 있는 것은 아닙니다. MiniMax-Text-01과 MiniMax-VL-01은 완전한 오픈 소스가 아니며, 개발자가 이를 재구성하려면 필요한 구성 요소(예: 훈련 데이터)가 공개되지 않았습니다. 또한, MiniMax는 제한적인 라이선스를 적용하여 경쟁 AI 모델을 개선하는 데 이 모델들을 사용할 수 없게 하고, 월 1억 명 이상의 활성 사용자가 있는 플랫폼은 MiniMax의 특수 라이선스를 요청해야 합니다.
MiniMax는 2021년에 중국의 최대 AI 기업 중 하나인 SenseTime의 전 직원들에 의해 설립되었습니다. 이 회사는 AI 기반 롤플레잉 플랫폼인 Talkie와 텍스트-비디오 모델 등을 개발하고 있습니다.
MiniMax의 일부 제품은 논란을 일으킨 바 있습니다. Talkie는 12월에 Apple App Store에서 “기술적인” 이유로 삭제되었으며, 이 앱에는 도널드 트럼프, 테일러 스위프트, 일론 머스크, 르브론 제임스와 같은 공공 인물들의 AI 아바타가 등장하는데, 이들은 앱에 등장하는 것에 동의하지 않은 것으로 보입니다.
또한, MiniMax의 비디오 생성 모델이 영국 방송사의 로고를 재현할 수 있다는 보도가 있었고, MiniMax가 iQiyi의 저작권이 있는 콘텐츠를 불법으로 학습시켰다는 이유로 iQiyi에 의해 소송을 당했다고 전해졌습니다.
MiniMax의 새로운 모델 발표는 바이든 행정부가 중국 기업들의 AI 기술에 대한 수출 규제를 강화할 계획을 발표한 직후에 이루어졌습니다.