Claude Ultrathink: 대부분의 사용자가 모르는 숨겨진 사고 레벨

Claude에는 대부분의 사용자가 모르는 기능이 있어요.

완전히 숨겨져 있지는 않아요—Anthropic이 문서화했거든요. 하지만 Claude Code 생태계에 깊이 들어가지 않으면, 아마 이것에 대해 들어본 적이 없을 거예요.

extended thinking이라고 불려요. 그리고 그 최고 레벨에는 거의 신화 같이 들리는 것이 있어요. 바로 ultrathink입니다.

이것들이 실제로 뭘 하는지, 언제 중요한지, 그리고—가장 중요하게—언제 전혀 작동하지 않는지에 대해 꽤 오랜 시간 파고들었어요. 제가 찾은 내용입니다.

Extended Thinking이 실제로 뭔가요?

Claude에게 질문을 하면, 보통 꽤 빨리 답변해요. 당신의 프롬프트를 읽고, 답변을 생성하고, 끝.

하지만 일부 문제는 더 많은… 사고가 필요해요.

Extended thinking은 Claude에게 답변하기 전에 잠시 멈출 수 있는 권한을 줘요. 답변으로 바로 뛰어드는 대신, 문제를 단계별로 처리하고, 다양한 접근 방식을 탐색하고, 엣지 케이스를 고려해요—모두 당신이 한 글자도 보기 전에요.

이렇게 생각해봐요. 일반적인 Claude는 당신의 동료가 즉석에서 빠른 답변을 주는 거고요. Extended thinking이 있는 Claude는 같은 동료가 “잠깐, 생각해 볼게"라고 말하고 실제로 하는 거예요.

복잡한 문제의 경우—아키텍처 결정, 까다로운 디버깅, 다단계 분석—이 추가 사고 시간은 종종 극적으로 나은 결과를 만들어요.

사고의 계층: “Think"에서 “Ultrathink"까지

여기서 대박이에요.

Claude Code(Anthropic의 명령줄 코딩 도구)에는 다양한 수준의 사고를 유발하는 내장 키워드가 있어요. 각 레벨은 더 많은 “사고 예산"을 할당해요—기본적으로 Claude가 응답하기 전에 얼마나 오래 추론할 수 있는지요.

키워드	사고 예산	최적 용도
think	~4,000 tokens	일반적인 디버깅, 간단한 리팩토링
think hard / megathink	~10,000 tokens	API 설계, 데이터베이스 계획, 최적화
think harder / ultrathink	~32,000 tokens	아키텍처 재설계, 심각한 버그, 복잡한 마이그레이션

트리거 문구는 유연해요. “Think about it”, “think deeply”, “think more” 모두 megathink 레벨을 활성화해요. 최대 사고를 원하면, “think harder”, “think really hard”, “think very hard”, 아니면 그냥 “ultrathink"라고 할 수 있어요.

Ultrathink를 사용할 때 뭐가 일어나요?

ultrathink를 유발하면, Claude는 응답하기 전에 문제를 추론하기 위해 약 32,000개의 토큰을 받아요.

이건 엄청난 사고 공간이에요.

실제로는 Claude가:

약속하기 전에 여러 해결책을 고려할 수 있어요
복잡한 로직을 단계별로 처리할 수 있어요
빠른 응답에서 놓친 엣지 케이스를 포착할 수 있어요
다중 파일 변경을 일관되게 계획할 수 있어요
복잡한 문제를 체계적으로 추적하며 디버그할 수 있어요

복잡한 프로덕션 버그나 “이 시스템 전체를 리팩토링해야 할까?“라는 질문의 경우, ultrathink는 도움이 되는 답변과 정말 통찰력 있는 답변의 차이가 될 수 있어요.

중요한 주의사항: Claude Code에서만 작동해요

이건 처음에 저를 헷갈리게 한 거고, 당신도 같은 실수를 하지 않았으면 좋겠어요.

ultrathink와 extended thinking 키워드는 Claude Code—터미널/CLI 도구—에서만 작동해요.

Claude.ai의 웹 인터페이스에 “ultrathink"를 입력해도, 특별한 일은 일어나지 않아요. 그냥 프롬프트의 다른 단어일 뿐이에요. API도 마찬가지—API 요청에서 명시적으로 사고 매개변수를 설정하지 않으면, 키워드는 아무것도 유발하지 않아요.

이게 중요한 이유는 사람들이 “그냥 프롬프트에 ultrathink를 추가해"를 일반적인 팁으로 추천하는 거를 봤거든요. 그 조언은 Claude Code를 구체적으로 사용할 때만 적용돼요.

웹 챗이나 사고 매개변수 없이 API를 사용하는 다른 모든 사람에게는, 다른 프롬프팅 기법에 집중해야 해요. 키워드는 당신을 도와주지 않을 거예요.

각 레벨을 언제 사용할까요?

모든 작업이 ultrathink가 필요한 건 아니에요. 실제로, 과하게 사용하면 시간을 낭비하고—토큰당 비용을 내고 있다면—돈도 낭비돼요.

제 대략적인 가이드라인이에요.

“think”(4K tokens)를 사용할 때:

간단한 버그를 고칠 때
간단한 함수를 쓸 때
일반적인 코드 리팩토링
명확한 답변이 있는 빠른 질문

“megathink”(10K tokens)를 사용할 때:

API 구조를 설계할 때
데이터베이스 스키마를 계획할 때
성능 최적화
코드 아키텍처 검토
다단계 문제 해결

“ultrathink”(32K tokens)를 사용할 때:

시스템 아키텍처를 재설계할 때
심각한 프로덕션 문제를 디버그할 때
여러 시스템에 영향을 미치는 복잡한 마이그레이션
실수가 심각한 결과를 초래하는 문제
일반적인 접근 방식을 시도했고 더 깊은 분석이 필요할 때

핵심은 사고 레벨을 문제의 복잡성과 맞추는 거예요. 간단한 문제는 더 많은 사고에서 더 나은 답변을 얻지 못해요—그냥 더 많은 시간이 걸려요.

비용의 현실

Extended thinking은 무료가 아니에요.

현재 Claude 가격 기준:

기본 사고 (~4K tokens): 작업당 약 $0.06
향상된 사고 (~10K tokens): 작업당 약 $0.15
최대 ultrathink (~32K tokens): 작업당 약 $0.48

개인 프로젝트의 경우, 이 비용은 보통 무시할 수 있어요. 하지만 팀을 위해 Claude Code를 실행하거나 많은 작업에서 실행하는 경우, ultrathink의 체계적인 사용은 금방 쌓여요.

그럴 가치가 있는 문제에 ultrathink를 사용하세요. 기본값으로 말고요.

실제로 어떻게 사용할까요?

Claude Code를 사용하고 있고 extended thinking을 시도하고 싶다면:

중간 정도 복잡도의 경우:

Think hard about how to refactor this authentication module.
Consider security implications and backward compatibility.

최대 사고를 원할 때:

Ultrathink about this architecture. We're migrating from a
monolith to microservices. I need you to identify service
boundaries, data flow, and potential failure points.

키워드는 프롬프트의 어디든 갈 수 있어요—시작, 끝, 또는 중간. Claude Code의 전처리는 이를 감지하고 적절한 사고 예산을 할당해요.

Claude 4와 Interleaved Thinking은 어떤가요?

최신 Claude 4 모델은 “interleaved thinking"을 도입했어요—Claude는 이제 도구 호출 사이에서 생각할 수 있어요, 시작 부분만이 아니라.

이건 특히 Claude가 여러 단계를 수행하는 에이전트 작업에 강력해요. 파일 읽기, 명령 실행, 변경 사항 적용. 모든 것을 미리 계획하고 최선을 기원하는 대신, Claude는 결과에 대해 생각하고 도착하면서 접근 방식을 조정할 수 있어요.

여러 파일 작업을 포함하는 복잡한 코딩 작업의 경우, 이는 extended thinking을 훨씬 더 가치 있게 만들어요.

결론

Extended thinking은 실제 유용한 기능이에요—하지만 올바른 맥락에서만요.

복잡한 개발 작업을 위해 Claude Code를 사용한다면, 적절한 사고 수준을 유발하는 법을 배우는 것이 결과를 진정으로 개선할 수 있어요. 정형적인 작업은 “think"로 시작하고, 설계 작업은 “megathink"로 확장하고, “ultrathink"는 정말 필요한 어려운 문제를 위해 남겨두세요.

웹 인터페이스나 API를 통해 Claude를 사용하고 있다면, 이 키워드는 당신을 도와주지 않을 거예요. 대신 명확한 프롬프팅, 좋은 컨텍스트, 그리고 구조화된 요청에 집중하세요.

어느 경우든, 기억하세요. 더 많은 사고가 항상 더 나은 사고는 아니에요. 도구를 작업과 맞춰요.