동작하는 코드
Claude Code 세션에서 아래 명령어를 실행해보세요:
> /cost
현재 세션에서 사용한 토큰 수와 비용이 표시됩니다. 이제 길게 대화를 나눠보세요. 파일을 몇 개 읽고, 수정 요청을 하고, 다시 /cost를 확인합니다.
> src/ 디렉토리의 모든 파일을 설명해줘
> /cost
토큰 사용량이 크게 늘어난 걸 볼 수 있습니다. 이제 컨텍스트를 정리해봅시다:
> /compact
Claude가 지금까지의 대화를 짧게 요약합니다. 다시 /cost를 확인해보면 다음 요청부터 입력 토큰이 줄어드는 걸 확인할 수 있습니다.
직접 수정하기
세션에서 이 순서를 따라해보세요:
/cost로 현재 사용량을 확인합니다.- 큰 파일을 하나 읽어달라고 요청합니다.
/cost로 다시 확인 — 토큰이 얼마나 늘었나요?/compact를 실행합니다.- 새로운 질문을 하나 하고
/cost확인 — 이전보다 효율적인가요? /clear를 실행해서 대화를 완전히 초기화합니다.
"왜?" — 컨텍스트 윈도우를 알아야 하는 이유
Claude Code는 대화할 때마다 지금까지의 모든 내용을 함께 전송합니다. 이걸 컨텍스트 윈도우라고 부르며, 현재 약 200K 토큰까지 사용 가능합니다.
컨텍스트가 커지면 생기는 문제
- 비용 증가 — 입력 토큰이 많을수록 API 비용이 올라갑니다.
- 속도 저하 — 처리할 텍스트가 많으면 응답이 느려집니다.
- 정확도 하락 — 컨텍스트가 너무 길면 중요한 정보를 놓칠 수 있습니다.
컨텍스트 관리 전략
| 명령어 | 동작 | 사용 시점 |
| ---------- | -------------------- | --------------------------- |
| /compact | 대화를 요약해서 압축 | 대화가 길어졌을 때 |
| /clear | 대화 내역 완전 삭제 | 새로운 주제로 넘어갈 때 |
| /cost | 토큰 사용량 확인 | 수시로 비용 체크 |
| /context | 컨텍스트 크기 확인 | 윈도우가 얼마나 찼는지 확인 |
경험 법칙: 하나의 작업이 끝나면 /compact, 완전히 다른 작업을 시작하면 /clear.
심화 학습
토큰이 정확히 뭔가요?
토큰은 AI가 텍스트를 처리하는 기본 단위입니다. 영어는 대략 단어 하나가 1~2 토큰, 한국어는 한 글자가 1~3 토큰 정도입니다. "안녕하세요"는 약 5~7 토큰입니다.
/cost에서 보이는 입력 토큰은 Claude에게 보내는 텍스트(대화 내역 + 파일 내용), 출력 토큰은 Claude가 생성하는 응답입니다.
/compact은 정보를 잃어버리나요?
네, 어느 정도는 그렇습니다. /compact는 대화를 요약하기 때문에 세부 사항이 사라질 수 있습니다. 중요한 결정이나 맥락이 있다면 CLAUDE.md에 기록해두는 게 좋습니다 (모듈 08에서 다룹니다).
- 새 세션을 시작하고
/cost를 확인해보세요 (0에서 시작). - 프로젝트의 가장 큰 파일을 읽어달라고 요청하세요.
/cost로 비용 변화를 확인하세요./compact를 실행한 뒤 같은 질문을 다시 해보세요. 응답 품질에 차이가 있나요?
Q1. 대화가 길어져서 토큰 사용량이 많아졌을 때 가장 적절한 명령어는?
- A)
/clear— 대화를 완전히 삭제한다 - B)
/compact— 대화를 요약해서 압축한다 - C)
/cost— 비용을 확인한다 - D)
/help— 도움말을 본다