Tech Signal2026-06-04

MiniMax M3, GPT-5.5를 이기는 오픈웨이트 모델이 가격은 1/12

중국 AI 스타트업 MiniMax가 GPT-5.5를 SWE-bench Pro에서 앞서면서 가격은 12분의 1인 오픈웨이트 모델 M3를 공개했다. AI 비용 구조가 근본적으로 바뀌고 있다.

6월 1일, 중국 상하이의 AI 스타트업 MiniMax가 M3 모델을 공개했다. SWE-bench Pro에서 **59.0%**를 기록하며 OpenAI GPT-5.5(58.6%)를 제쳤고, 100만 토큰 컨텍스트 윈도우와 네이티브 멀티모달(이미지/영상 입력)을 하나의 모델에 담았다. 가격은 입력 $0.60/M 토큰, 출력 $2.40/M 토큰. GPT-5.5($5/$30) 대비 입력 12배, 출력 12.5배 저렴하다. 오픈웨이트로 공개 예정(출시 후 10일 내).

한 줄 정리

항목 MiniMax M3 GPT-5.5 Claude Opus 4.8 Gemini 3.1 Pro
SWE-bench Pro 59.0% 58.6% 69.2% 54.2%
입력 가격(/M) $0.60 $5.00 $5.00 -
출력 가격(/M) $2.40 $30.00 $25.00 -
컨텍스트 1M 1M 1M -
오픈웨이트 O X X X

런칭 할인 기간(7일)에는 $0.30/$1.20까지 내려간다. 월 기준으로 계산하면, 일반적인 코딩 에이전트 워크로드(일 150만 입력 + 40만 출력 토큰)에서 M3는 월 $27, Opus 4.8은 월 $375이다.

기술적 핵심: MiniMax Sparse Attention

M3의 성능-가격 비율을 가능하게 한 건 MSA(MiniMax Sparse Attention) 아키텍처다. 기존 어텐션 메커니즘 대비 100만 토큰 컨텍스트에서 디코딩 15.6배, 프리필 9.7배 빠르다.

DeepSeek의 Multi-head Latent Attention이 KV 캐시를 압축해서 속도를 올리는 방식이라면, MSA는 풀 프리시전을 유지하면서도 KV 블록을 정밀하게 파티셔닝한다. 정밀도 손실 없이 속도를 확보한 셈이다. 긴 코드베이스 분석이나 대량 문서 처리에서 품질 차이가 난다.

추가로 M3는 컴퓨터 사용(Computer Use) 기능을 탑재했다. 데스크톱 조작이 가능한 오픈웨이트 모델은 사실상 최초다.

중국 AI의 가격 파괴, 이번엔 다르다

올해 초 DeepSeek V4-Pro가 $0.435/$0.87이라는 파격적인 가격을 제시했을 때도 시장은 놀랐다. 하지만 M3가 의미 있는 건 프론티어급 성능과 저가격이 동시에 달성됐다는 점이다.

모델 입력(/M) 출력(/M) SWE-bench Pro
DeepSeek V4-Pro $0.435 $0.87 80.6% (Verified)
MiniMax M3 $0.60 $2.40 59.0% (Pro)
GPT-5.5 $5.00 $30.00 58.6% (Pro)
Claude Opus 4.8 $5.00 $25.00 69.2% (Pro)

DeepSeek이 더 저렴하고 Verified 벤치마크에서는 더 높은 점수를 보이지만, M3는 100만 토큰 네이티브 멀티모달과 컴퓨터 사용이라는 차별점이 있다. 중국 오픈소스 진영이 단순한 가격 경쟁을 넘어 기능 번들링으로 진화하고 있다는 신호다.

미국 빅테크 모델이 $5/M 이상의 프리미엄을 유지하는 동안, 중국발 오픈웨이트 모델들이 1달러 미만에서 비슷하거나 더 나은 성능을 제공하는 구조가 고착되고 있다. 이건 일시적 할인이 아니라 구조적 가격 재편이다.

소규모 비즈니스에 미치는 영향

이 가격 구조가 실무에서 의미하는 바를 계산해보자.

하루 500건의 고객 문의를 AI로 처리하는 소규모 이커머스를 가정한다. 건당 평균 2,000 입력 토큰, 500 출력 토큰이면:

  • GPT-5.5: 일 $5 + $7.5 = $12.5, 월 $375
  • MiniMax M3: 일 $0.60 + $0.60 = $1.20, 월 $36
  • M3 런칭가: 월 $18

10배 이상의 비용 차이다. 그동안 "AI 도입 비용이 부담"이라고 말했던 소상공인에게, 이 가격대는 진입 장벽을 사실상 제거한다.

오픈웨이트라는 점도 중요하다. 가중치 공개 후에는 로컬 서버나 저가 클라우드 인스턴스에서 자체 호스팅이 가능해진다. API 종속 없이 데이터 주권을 유지하면서 프론티어급 성능을 쓸 수 있다는 뜻이다.

anyAX 관점

도구는 바뀌지만 개념은 남는다. M3가 오늘의 가격 파괴자이고, 내일은 또 다른 모델이 그 자리를 차지할 것이다. 중요한 건 "프론티어급 AI를 월 수만 원에 쓸 수 있다"는 구조 자체가 확립됐다는 사실이다.

AX(AI Transformation)의 핵심은 비싼 도구를 쓰는 게 아니라, 자신의 문제에 AI를 정확히 적용하는 판단력이다. M3든 GPT든 Claude든, 어떤 모델이 내 업무에 맞는지 판단하고, 프롬프트를 설계하고, 워크플로우에 녹여내는 능력이 차별화 포인트다.

가격이 무너지면 진입 장벽은 낮아지지만, 동시에 "AI를 쓴다"는 것 자체는 더 이상 경쟁우위가 아니게 된다. 모두가 같은 도구에 접근할 수 있을 때, 차이를 만드는 건 도구를 어떻게 쓰는가다. GeekNews에서 오늘 화제가 된 Figma 글의 제목이 정확히 이걸 짚었다: "누구나 만들 수 있게 되면, 정말 중요한 것은 뭘까?"

답은 언제나 같다. 사람의 판단이다.

참고