커스텀 인스트럭션의 작동 원리

레슨 1에서 커스텀 인스트럭션이 뭔지, 왜 중요한지 알아봤어요. 이번 레슨에서는 그게 내부적으로 어떻게 돌아가는지 살펴볼게요. 작동 원리를 알면 “왜 내 인스트럭션이 먹히다가 안 먹히지?“라는 질문에 스스로 답할 수 있게 돼요.

프롬프트 우선순위: 누가 이기는가

AI가 응답을 생성할 때 참고하는 정보에는 위계가 있어요:

1단계: 시스템 프롬프트 (플랫폼이 설정 — 내가 못 바꿈)
2단계: 커스텀 인스트럭션 (내가 설정 — 모든 대화에 적용)
3단계: 대화 중 프롬프트 (지금 이 대화에서 내가 쓰는 메시지)

핵심 원칙: 구체적인 것이 이긴다. 커스텀 인스트럭션은 “기본값"을 설정하고, 대화 중 프롬프트는 그 기본값을 덮어씁니다.

예를 들어:

인스트럭션: “항상 200자 이내로 답변해 줘”
프롬프트: “이 주제에 대해 자세히 분석해 줘”
결과: AI는 자세히 분석 → 200자를 초과함

이건 버그가 아니에요. 의도된 설계예요. 인스트럭션은 기본 규칙이고, 대화 중 프롬프트가 “이번에는 예외"를 선언하면 AI가 따르는 거예요.

✅ Quick Check: 인스트럭션에 “한국어로 답변해 줘"라고 설정했는데, 영어 논문을 붙여넣고 “Summarize this"라고 쓰면 어떻게 될까요? (플랫폼마다 다르지만, 영어 입력이 인스트럭션의 한국어 설정을 덮어쓸 가능성이 높아요. 이런 충돌을 방지하려면 “입력이 영어여도 반드시 한국어로 답변"이라고 명시해야 해요.)

글자 수 제한: 얼마나 쓸 수 있나

각 플랫폼마다 커스텀 인스트럭션에 쓸 수 있는 분량이 달라요:

플랫폼	제한	한국어 실질 용량
ChatGPT	필드당 1,500자 (총 3,000자)	영어의 약 1/3 정보량
Claude	프로젝트 지시: ~4,000자	영어의 약 1/3 정보량
Gemini	~2,000자	영어의 약 1/3 정보량
Copilot	~1,500자	영어의 약 1/3 정보량

왜 “한국어 실질 용량"이 영어보다 훨씬 적을까요?

한국어 토큰의 비밀

여기서 한국어 사용자만의 고유한 과제가 나와요. GPT 모델은 텍스트를 “토큰"으로 나눠서 처리하는데, 한국어는 영어보다 토큰을 훨씬 더 많이 소모해요.

언어	토큰 효율	예시
영어	단어 4개 ≈ 1토큰	“I love Korean food” = ~4토큰
한국어	한 글자 ≈ 2~3토큰	“한국 음식을 좋아해요” = ~20토큰

같은 의미인데 한국어가 토큰을 5배 이상 더 써요. 커스텀 인스트럭션도 이 토큰으로 처리되기 때문에, 같은 글자 수 제한 안에 넣을 수 있는 정보량이 훨씬 적어요.

실전 팁: 한국어 인스트럭션 압축법

조사를 줄여요: “~을 위한 ~에 대한” → “~용”
불필요한 수식어를 빼요: “매우 정확하고 상세한 답변” → “정확한 답변”
규칙을 구조화해요: 문장 대신 짧은 규칙 목록 사용
영어 키워드를 섞어요: “자연어 처리” 대신 “NLP” (토큰 절약)

✅ Quick Check: ChatGPT 커스텀 인스트럭션에 1,500자까지 쓸 수 있어요. 같은 1,500자를 영어로 쓸 때와 한국어로 쓸 때, 어느 쪽이 더 많은 정보를 전달할 수 있을까요? (영어가 약 3배 더 많은 정보를 전달할 수 있어요. 한국어는 토큰을 더 많이 소모하기 때문에, 같은 글자 수 안에 넣을 수 있는 실질적 정보량이 적어요. 그래서 한국어 인스트럭션은 간결하게 쓰는 게 특히 중요합니다.)

커스텀 인스트럭션 vs 메모리 vs 프로젝트

ChatGPT에는 비슷해 보이는 세 가지 기능이 있어요. 혼동하기 쉽지만 역할이 달라요:

기능	내가 직접 쓰나?	범위	핵심 차이
커스텀 인스트럭션	직접 작성	모든 대화	내가 통제하는 영구 설정
메모리	AI가 자동 학습	모든 대화	AI가 스스로 기억한 정보
프로젝트	직접 작성	특정 프로젝트 내 대화만	프로젝트별 맞춤 설정

주의할 점: 메모리와 인스트럭션의 충돌

ChatGPT의 메모리는 대화 중에 자동으로 학습해요. 문제는 시간이 지나면서 메모리에 쌓인 정보가 커스텀 인스트럭션과 모순될 수 있다는 거예요.

예시:

인스트럭션: “해요체로 답변해 줘”
어느 날 대화 중에: “이건 보고서니까 합니다체로 써 줘”
메모리에 저장됨: “사용자가 합니다체를 선호함”
이후 대화: 인스트럭션은 해요체인데 메모리는 합니다체 → 혼란

해결법: 설정 → 개인화 → 메모리에서 주기적으로 저장된 항목을 확인하고, 인스트럭션과 충돌하는 항목을 삭제하세요.

한국어로 인스트럭션 쓰기 vs 영어로 쓰기

자주 나오는 질문: “인스트럭션을 영어로 쓰는 게 나을까요?”

방법	장점	단점
한국어로 쓰기	의도가 정확히 전달됨, 한국어 응답 유도에 유리	토큰을 더 많이 소모, 영어보다 적은 정보량
영어로 쓰기	토큰 효율적, 더 많은 규칙 입력 가능	한국어 응답이 자연스럽지 않을 수 있음
혼합 전략	양쪽의 장점 결합	일관성이 떨어질 수 있음

추천: 혼합 전략이에요. 핵심 규칙은 한국어로, 기술적 키워드나 포맷 규칙은 영어로 쓰는 거예요.

예시:

역할: 한국 IT 기업 마케팅 팀장
대상: B2B SaaS 고객사 담당자
톤: 해요체, 전문적이지만 딱딱하지 않게
Format: bullet points → explanation
Output language: 항상 한국어

핵심 정리

프롬프트 우선순위: 시스템 > 커스텀 인스트럭션 > 대화 프롬프트 — 구체적인 것이 이긴다
한국어는 영어보다 2~3배 토큰을 더 소모 → 인스트럭션을 간결하게 써야 함
커스텀 인스트럭션(직접 설정)과 메모리(AI 자동 학습)는 충돌할 수 있으니 주기적으로 점검
한국어+영어 혼합 전략이 토큰 효율과 자연스러운 한국어 응답을 동시에 달성하는 방법

다음 레슨

레슨 3에서는 직접 해 봐요. RISEN 프레임워크를 사용해서 첫 커스텀 인스트럭션을 만들고, 실제로 설치해서 효과를 확인합니다.