결론부터 말하면, 메타가 드디어 쓸 만한 AI를 만들었어요. 그것도 무료로.
4월 8일, 메타 슈퍼인텔리전스 랩스(MSL)가 ‘뮤즈 스파크’를 공개했는데요. 독립 벤치마크 기관 Artificial Analysis 기준으로 종합 52점 — 세계 4위예요. GPT-5.4(57점), 제미나이 3.1 프로(57점), 클로드 오퍼스 4.6(53점) 바로 다음이에요.
근데 이 4위짜리 모델이 완전 무료거든요. ChatGPT도 클로드도 월 2만원 넘게 내야 하는데, 뮤즈 스파크는 0원이에요.
메타 주가? 발표 당일 6.5% 급등했어요. 시장은 이미 답을 줬네요.
뮤즈 스파크가 뭔데?
쉽게 말하면, 왓츠앱이나 인스타그램에서 쓰는 메타 AI의 두뇌가 바뀐 거예요.
이전에는 ‘라마’라는 모델이 메타 AI를 돌렸는데, 솔직히 ChatGPT랑 비교하면 좀 아쉬웠잖아요. 그래서 메타가 아예 처음부터 다시 만든 게 뮤즈 스파크예요.
개발을 이끈 사람은 알렉산더 왕 — Scale AI 창업자 출신이에요. 메타가 21조 원(약 143억 달러)에 인수한 인물이죠. 왕이 9개월 동안 팀을 꾸려서 인프라, 아키텍처, 데이터 파이프라인 전부 새로 구축했어요. 코드네임은 ‘아보카도’였다고.
핵심 특징을 정리하면:
- 멀티모달: 텍스트뿐 아니라 이미지도 이해해요. 사진 찍어서 물어보면 답해줘요
- 숙고 모드(Contemplating Mode): 여러 AI 에이전트가 동시에 문제를 풀고 결과를 합쳐요
- 무료: meta.ai, 왓츠앱, 인스타그램, 페이스북에서 바로 사용 가능
- API는 아직 없음: 개발자용 API는 비공개 프리뷰만 진행 중
어디서 잘하고, 어디서 못하나?
벤치마크 숫자로 정리해볼게요. 다 독립 기관(Artificial Analysis) 검증 결과예요.
| 영역 | 뮤즈 스파크 | GPT-5.4 | 클로드 오퍼스 | 제미나이 3.1 | 1위는? |
|---|---|---|---|---|---|
| 종합 점수 | 52 | 57 | 53 | 57 | GPT/제미나이 공동 |
| 건강·의료 | 42.8 | 40.1 | 14.8 | 20.6 | 뮤즈 스파크 1위 |
| 차트 이해 | 86.4 | 82.8 | — | 80.2 | 뮤즈 스파크 1위 |
| 멀티모달 | 80.5% | 81.2% | 75.8% | 82.4% | 제미나이 |
| 코딩 | 59.0 | 75.1 | 80.8 | 68.5 | 클로드 |
| 추상적 추론 | 42.5 | 76.1 | 75.2 | 76.5 | 제미나이 |
여기서 눈에 띄는 게 두 가지 있어요.
첫째, 건강 분야 세계 1위. HealthBench Hard라는 벤치마크에서 42.8점으로 GPT-5.4(40.1)도 이겼어요. 메타가 1,000명 이상의 의사 자문을 받아서 학습시킨 결과예요. 왓츠앱에서 건강 관련 질문하면 세계에서 가장 정확한 답을 받을 수 있다는 뜻이에요.
둘째, 코딩은 솔직히 약해요. Terminal-Bench 기준 59점인데, GPT-5.4는 75점이고 클로드는 81점이에요. 개발자가 쓸 모델은 아니에요.
근데 재밌는 건, 이미지를 코드로 변환하는 건 꽤 잘한다는 반응이 있어요. @skirano라는 유저가 “이미지를 코드로 변환할 때 에셋까지 잘라내서 정확히 사용하더라"면서 1,163개 좋아요를 받은 포스트를 올렸거든요.
왜 오픈소스를 포기했을까?
이게 한국 개발자 커뮤니티에서 가장 뜨거운 논란이에요.
메타는 그동안 라마 시리즈를 오픈소스로 공개해서 AI 민주화의 상징 같은 존재였잖아요. r/LocalLLaMA 커뮤니티(회원 80만 명 이상)도 메타 모델 덕분에 존재하는 거고요.
근데 뮤즈 스파크는 클로즈드 소스예요. 가중치도 비공개, 코드도 비공개.
왜?
바이라인네트워크와 와우테일의 분석을 종합하면:
- 라마 4가 망했어요. 2025년 출시 후 벤치마크 조작 논란까지 터졌고
- 중국 기업들(알리바바, 딥시크)이 라마를 가져다가 경쟁 모델을 만들어서 역으로 메타를 추격하는 상황이 됐고
- 알렉산더 왕 자체가 클로즈드 소스 출신이에요. Scale AI는 OpenAI, Anthropic 같은 폐쇄형 모델 회사에 데이터를 납품하던 곳이거든요
메타는 “향후 오픈소스 버전을 출시할 계획"이라고 했지만, AI타임스 보도에 따르면 개발자 커뮤니티 반응은 회의적이에요. “경쟁력 있는 모델 만든 다음에 문을 닫는 것"이라는 비판도 있고요.
지금 당장 써보는 방법
뮤즈 스파크는 이미 사용 가능해요:
- meta.ai — 브라우저에서 바로 접속 (로그인 없이도 가능)
- 왓츠앱 — 채팅 목록 하단의 파란 원 터치, 또는 그룹챗에서 @Meta AI 입력
- 인스타그램 — DM에서 Meta AI 검색
- 페이스북/메신저 — 검색창에서 Meta AI 찾기
- 레이밴 메타 안경 — 음성으로 질문
가장 빠른 체험: meta.ai 열고 이거 입력해보세요.
“2026년 한국 직장인이 배워야 할 AI 스킬 3가지를 100자 이내로 알려줘”
답변 퀄리티 보면 예전 메타 AI랑 확 다른 거 느껴질 거예요.
뭘 못하는지도 알아야 해요
솔직하게 정리하면:
- 코딩 도우미로는 부족해요. 59점이면 GPT나 클로드의 3/4 수준
- 파일 업로드 안 돼요. PDF, 엑셀 분석은 못해요. 사진만 보내기 가능
- API가 없어요. 앱 개발자가 연동해서 쓸 수 없어요
- 영어 위주예요. 한국어도 되긴 하지만 영어가 제일 정확해요
- 대화 기록이 이어지지 않을 수 있어요. 아직 장기 메모리는 제한적
그래서 ChatGPT 구독 끊어도 되나?
이게 핵심 질문이죠.
끊어도 되는 경우: 일상적인 질문, 건강 정보, 사진 분석, 인스타 캡션 작성, 간단한 번역 — 이런 거 위주로 쓰시면 뮤즈 스파크로 충분해요. 솔직히 월 2만원 아끼면서 80%는 커버 가능해요.
유지해야 하는 경우: 긴 문서 분석, 코딩, 복잡한 논리 추론, 엑셀/PDF 처리 — 이런 업무가 많으면 ChatGPT나 클로드가 아직 확실히 앞서요.
제일 현명한 방법: 평소엔 뮤즈 스파크(무료) 쓰고, 진짜 필요할 때만 유료 도구를 꺼내는 거예요. 도구에 충성할 필요 없어요. 작업에 맞는 도구를 고르면 돼요.
마무리
뮤즈 스파크는 메타의 재기 신호예요. 세계 1위는 아니지만, 무료이면서 4위라는 건 대단한 거거든요. 특히 건강 분야와 차트 이해에서는 월 2만원짜리 모델들도 못 이기는 점수를 받았고요.
오픈소스를 포기한 건 아쉽지만, 32억 명이 쓰는 앱에 세계적 수준의 AI가 무료로 탑재됐다는 건 분명한 사실이에요.
왓츠앱이나 인스타 열어서 한번 써보세요. 예전이랑 확 달라진 거 느끼실 거예요.
출처: