중국 항저우의 6대 신생 테크 기업을 일컫는 '류샤오룽(六小龍·육소룡)' 중 한 곳인 미니맥스(MiniMax)가 가성비에 초점을 맞춘 새로운 추론 모델을 내놓았다.
28일 차이신 등 중국 매체에 따르면 미니맥스는 전날 전문가 혼합(MoE·Mixture of Experts) 구조를 기반으로 하는 초대형 추론 모델 'M2'를 공개했다.
전문가 혼합 구조는 하나의 거대한 '두뇌'가 모든 문제를 처리하는 일반적인 인공지능(AI) 모델과 달리, 여러 명의 '전문가 두뇌'를 만들어두고 입력된 과제의 성격에 따라 필요한 전문가만을 활성화하는 방식이다. 이는 성능은 높게 유지하면서도 속도와 비용을 절약할 수 있다는 장점이 있다.
또한 M2는 2300억개 매개변수를 탑재했다. 매개변수는 AI가 학습한 지식의 양을 나타내는 수치로 '두뇌' 속에 있는 데이터량을 뜻한다. 2300억개면 GPT-4와 클로드(Claude) 3 수준의 초대형 모델이다. 특히 M2는 하나의 과제를 수행할 때 약 100억개의 활성화 매개변수만을 선택적으로 작동해 연산 효율과 처리 속도를 동시에 높였다.
출력 속도는 초당 100토큰(token·1토큰=약 0.7단어)으로 대규모 언어모델(LLM) 가운데에서도 상위권 수준이며, 실시간 대화형 서비스나 멀티태스킹형 AI 에이전트 개발에 적합하다.
미니맥스는 M2가 추론 속도, 비용, 그리고 작업 성능 간의 균형을 맞추는 것을 목표로 했다면서 GPT-5보다는 조금 덜 똑똑하지만, 속도는 더 빠르고 가격은 훨씬 저렴한 '가성비 중심 모델'이라고 설명했다. 즉 실무에서 당장 활용하기 좋은 실무형 AI에 쪽에 초점을 맞춘 셈이다.
미니맥스에 따르면 M2의 가격은 클로드 4.5 소넷의 8% 수준에 불과하지만, 추론 속도는 약 두배다. 중국 국내 모델들과 비교해도 딥시크의 최신 AI 모델 V3.2-Exp와 바이두의 X1과 비슷한 수준으로 가격 경쟁력이 뛰어나다는 평가다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지



![[르포] 중력 6배에 짓눌려 기절 직전…전투기 조종사 비행환경 적응훈련(영상)](https://image.ajunews.com/content/image/2024/02/29/20240229181518601151_258_161.jpg)



