DaleSchool

컨텍스트의 힘

입문20분

학습 목표

  • 컨텍스트 윈도우가 무엇인지 설명할 수 있다
  • /compact와 /clear의 차이를 이해하고 적절히 사용할 수 있다
  • 토큰 사용량을 확인하고 비용을 관리할 수 있다

동작하는 코드

Claude Code 세션에서 아래 명령어를 실행해보세요:

> /cost

현재 세션에서 사용한 토큰 수와 비용이 표시됩니다. 이제 길게 대화를 나눠보세요. 파일을 몇 개 읽고, 수정 요청을 하고, 다시 /cost를 확인합니다.

> src/ 디렉토리의 모든 파일을 설명해줘
> /cost

토큰 사용량이 크게 늘어난 걸 볼 수 있습니다. 이제 컨텍스트를 정리해봅시다:

> /compact

Claude가 지금까지의 대화를 짧게 요약합니다. 다시 /cost를 확인해보면 다음 요청부터 입력 토큰이 줄어드는 걸 확인할 수 있습니다.

직접 수정하기

세션에서 이 순서를 따라해보세요:

  1. /cost로 현재 사용량을 확인합니다.
  2. 큰 파일을 하나 읽어달라고 요청합니다.
  3. /cost로 다시 확인 — 토큰이 얼마나 늘었나요?
  4. /compact를 실행합니다.
  5. 새로운 질문을 하나 하고 /cost 확인 — 이전보다 효율적인가요?
  6. /clear를 실행해서 대화를 완전히 초기화합니다.

"왜?" — 컨텍스트 윈도우를 알아야 하는 이유

Claude Code는 대화할 때마다 지금까지의 모든 내용을 함께 전송합니다. 이걸 컨텍스트 윈도우라고 부르며, 현재 약 200K 토큰까지 사용 가능합니다.

컨텍스트가 커지면 생기는 문제

  1. 비용 증가 — 입력 토큰이 많을수록 API 비용이 올라갑니다.
  2. 속도 저하 — 처리할 텍스트가 많으면 응답이 느려집니다.
  3. 정확도 하락 — 컨텍스트가 너무 길면 중요한 정보를 놓칠 수 있습니다.

컨텍스트 관리 전략

| 명령어 | 동작 | 사용 시점 | | ---------- | -------------------- | --------------------------- | | /compact | 대화를 요약해서 압축 | 대화가 길어졌을 때 | | /clear | 대화 내역 완전 삭제 | 새로운 주제로 넘어갈 때 | | /cost | 토큰 사용량 확인 | 수시로 비용 체크 | | /context | 컨텍스트 크기 확인 | 윈도우가 얼마나 찼는지 확인 |

경험 법칙: 하나의 작업이 끝나면 /compact, 완전히 다른 작업을 시작하면 /clear.

심화 학습

토큰이 정확히 뭔가요?

토큰은 AI가 텍스트를 처리하는 기본 단위입니다. 영어는 대략 단어 하나가 1~2 토큰, 한국어는 한 글자가 1~3 토큰 정도입니다. "안녕하세요"는 약 5~7 토큰입니다.

/cost에서 보이는 입력 토큰은 Claude에게 보내는 텍스트(대화 내역 + 파일 내용), 출력 토큰은 Claude가 생성하는 응답입니다.

/compact은 정보를 잃어버리나요?

네, 어느 정도는 그렇습니다. /compact는 대화를 요약하기 때문에 세부 사항이 사라질 수 있습니다. 중요한 결정이나 맥락이 있다면 CLAUDE.md에 기록해두는 게 좋습니다 (모듈 08에서 다룹니다).

  1. 새 세션을 시작하고 /cost를 확인해보세요 (0에서 시작).
  2. 프로젝트의 가장 큰 파일을 읽어달라고 요청하세요.
  3. /cost로 비용 변화를 확인하세요.
  4. /compact를 실행한 뒤 같은 질문을 다시 해보세요. 응답 품질에 차이가 있나요?

Q1. 대화가 길어져서 토큰 사용량이 많아졌을 때 가장 적절한 명령어는?

  • A) /clear — 대화를 완전히 삭제한다
  • B) /compact — 대화를 요약해서 압축한다
  • C) /cost — 비용을 확인한다
  • D) /help — 도움말을 본다

참고 자료