본문으로 건너뛰기

Ch8. 토큰 절약 8가지 꿀팁 — 비용·속도·정확도 동시에

이 장을 끝내면 할 수 있는 것: 같은 일에 토큰을 50% 이상 줄여, Claude의 답이 더 빠르고 더 정확해지는 8가지 패턴을 자기 작업에 적용할 수 있다.


1. 토큰은 셋을 동시에 결정한다 — 비용·속도·정확도

비개발자에게 "토큰" 한 단어는 살짝 무서워 보인다. 사실 단순하다.

  • 토큰 — Claude가 한 번에 다루는 글자 단위. 한국어 1글자가 보통 토큰 1~2개. "안녕하세요"는 약 3 토큰.
  • 컨텍스트 윈도우 — 한 대화에 들어갈 수 있는 토큰 한도. Claude는 200K 토큰 (한국어 약 10만 자) 정도까지 한 번에 본다.

토큰을 아껴야 하는 이유는 셋이다.

차원토큰을 줄이면
비용Pro/Max 플랜의 메시지 한도 안에서 더 오래 쓴다
속도답이 빨리 온다 (긴 컨텍스트일수록 느림)
정확도컨텍스트가 깔끔할수록 답이 정확해진다

세 번째가 가장 결정적이다. 토큰을 줄이는 건 절약 차원이 아니라 품질 관리다. 늘어진 컨텍스트는 Claude에게도 사람에게도 부담이다.

이 장이 책에서 다뤄질 가치는 한 가지다 — 8가지 패턴을 손에 익히면 같은 일에 토큰이 절반으로 줄고, 답은 더 빠르고 정확해진다.


2. 8가지 꿀팁 한 장

꿀팁 1. 주제 바뀌면 /clear

가장 단순. 주제가 바뀌면 직전 컨텍스트는 다 잊어도 된다. /clear 한 번이면 끝.

언제 쓰나: 회의록 정리 → 영수증 분류 같은 다른 도메인으로 넘어갈 때.

꿀팁 2. 대화 길어지면 /compact

/clear는 다 비우기, /compact요약해서 남기기. 이전 컨텍스트의 핵심을 자동 요약해 5분의 1 정도로 줄여 보관한다.

상태추천
같은 주제 계속 가야 하지만 대화가 길어짐/compact
다른 주제로 완전히 옮길 때/clear

꿀팁 3. 큰 파일은 요약을 첨부

100MB PDF·1만 줄 회의록을 통째로 첨부하면 컨텍스트의 절반을 잡아먹는다. 그러면 Claude는 자기 답할 여유 공간이 줄어 답이 부실해진다.

대처: 큰 파일은 먼저 Claude에게 1페이지 요약을 시킨 뒤, 그 요약본만 본 작업에 첨부. 원본은 폴더에 두고 "필요하면 data/원본.md 를 직접 읽어" 한 줄로 안내.

꿀팁 4. CLAUDE.md에 "출력 형식"을 좁게

CLAUDE.md(Ch4)에 "출력 형식: 마크다운, 5줄 이내, 표 우선" 같은 분량·형태 제한을 넣어두면 매 답이 자동으로 짧아진다. 토큰이 절반으로 줄고 가독성도 올라간다.

예시:

## 출력 형식
- 한 응답 5문장 이내. 더 길면 표나 불릿으로 분할.
- 코드 답변은 핵심 함수만. 나머지는 "필요시 추가" 안내.
- 인사·서론·결론 문장 생략.

꿀팁 5. 결과만 받고 추론은 끄기

기본 모드에서 Claude는 답하기 전에 자기 생각(reasoning)을 펼친다. 이게 길면 토큰을 많이 쓴다.

짧고 명확한 작업(예: 표 한 줄 정리)은 처음부터 "바로 결과만, 설명 없이" 한 줄을 추가. 답이 3분의 1로 줄어든다.

추천
회의록 5줄 요약"바로 결과만"
어려운 의사결정 (어느 도구를 써야?)추론 켜기 (설명 포함 요청)

꿀팁 6. 한 메시지 = 한 작업

Ch2 함정 1과 같다. "메일 정리하고, 회의록도, 영수증도..." 한 번에 시키면 각 작업이 부실해진다. 토큰도 작업 수에 비례해 늘어난다.

한 메시지 한 작업 원칙. 작업이 끝나면 /clear 또는 /compact 후 다음 작업.

꿀팁 7. 모델을 작업 크기에 맞추기

Opus는 Sonnet의 5배, Haiku의 10배 토큰을 쓴다 (대략).

작업추천 모델이유
어려운 의사결정·디자인·전략Opus5배 비싸도 1번에 끝남
일상 작업의 95% (회의록·메일·정리)Sonnet균형형 — 책의 표준
한 줄 답·번역·간단 분류Haiku매우 빠름·저렴

규칙: 모르겠으면 Sonnet. Opus는 진짜 어려운 일에만.

꿀팁 8. 자주 쓸 컨텍스트는 스킬·CLAUDE.md로 영구 보관

매번 같은 5줄을 채팅에 붙여넣고 있다면 (예: 우리 회사 톤·금기어·고객 페르소나) — 그 5줄은 컨텍스트가 아니라 영구 메모여야 한다.

대처: CLAUDE.md(폴더 단위) 또는 SKILL.md(키워드 단위)로 옮긴다. 매 대화에서 5줄을 다시 안 보내도 자동 적용.


3. ⚠️ 처음 사람들이 자주 막히는 곳

함정 1. /compact만 믿고 무한 누적

/compact는 강력하지만, 매 메시지마다 누적된 컨텍스트를 5분의 1로 줄이는 것뿐이다. 한 시간 동안 누적하면 결국 한도 근처. 5~10 메시지마다 한 번씩 /compact 또는 /clear로 초기화.

함정 2. 모델을 한 단계만 쓴다 (다 Opus 또는 다 Haiku)

비개발자에게 흔한 실수. 다 Opus면 비용이 5배. 다 Haiku면 어려운 작업에서 답이 부정확.

대처: 기본은 Sonnet. 어려운 의사결정만 Opus, 단순 분류·번역만 Haiku.

함정 3. 대화 안에서 첨부를 반복한다

같은 PDF를 한 메시지에서 한 번, 다음 메시지에서 또 첨부하는 실수. 컨텍스트에 두 번 쌓인다.

대처: 한 번 첨부한 자료는 같은 대화 안에서 다시 안 첨부. "위에서 첨부한 회의록 기준으로" 한 줄로 충분.


4. 5분 미니 실습 — 자기 작업의 토큰 다이어트

전제

  • Ch5에서 작업 폴더 1개 + CLAUDE.md 작성 완료
  • 그 폴더에서 한 시간 이상 작업해본 경험

단계

  1. 그 폴더에서 어제·오늘 작업한 대화 1개를 떠올린다.

  2. 8가지 꿀팁 중 자기가 안 쓰고 있는 것 3개를 표시한다.

    • 주제 바뀌면 /clear
    • 대화 길어지면 /compact
    • 큰 파일은 요약을 첨부
    • CLAUDE.md에 "출력 형식" 좁게
    • 결과만 받고 추론은 끄기
    • 한 메시지 = 한 작업
    • 모델을 작업 크기에 맞추기
    • 자주 쓸 컨텍스트는 스킬·CLAUDE.md로
  3. 표시한 3개 중 가장 쉬운 1개를 골라 다음 작업에 적용한다.

  4. 적용 후 토큰 사용량을 확인한다.

    /usage

    ✓ 체크포인트: 직전 작업 대비 토큰이 줄었는지 확인.

  5. 다음 주에 표시한 나머지 2개도 차례로 적용.

결과 인증

이 실습을 끝냈다면:

  • 8가지 꿀팁 중 자기가 안 쓰던 패턴을 안다
  • 한 패턴을 적용해 토큰 차이를 눈으로 확인했다
  • 매주 한 패턴씩 추가할 길이 보인다

⚠️ 트러블슈팅

문제 1: /usage가 토큰 수치를 안 보여줍니다./usage 미지원 환경(웹의 일부)에서는 Settings → Usage에서 확인. 또는 /cost로 누적 비용 확인.

문제 2: /compact가 답을 너무 많이 잘라냅니다. → 메시지에 "중요한 사실 X·Y는 보존하고 compact" 한 줄 추가. 또는 핵심을 CLAUDE.md에 옮긴 뒤 /compact.

문제 3: 모델을 바꿔도 결과 차이를 모르겠습니다. → 같은 일을 Sonnet과 Haiku로 한 번씩 시켜 비교. 차이가 없으면 Haiku 유지 (저렴·빠름).


다음 장으로: Ch9부터는 Part 2 활용 편. 첫 주제는 MCP·플러그인·커넥터 — Claude를 노션·구글드라이브·깃허브 같은 외부 세계에 연결하는 3 다리.

© 2026 COMMME · Built with Claude Code