Claude Opus 4.7, 같은 일 시켰는데 왜 20% 더 나왔을까 — 토크나이저가 숨긴 청구서
지난주부터 개발자 커뮤니티에서 묘한 불만이 올라오기 시작했습니다. “어제까지 쓰던 프롬프트 그대로 돌렸는데 청구서가 20% 더 찍혔다"는 이야기입니다. 누군가는 30% 가까이 늘었다고 하더군요. 모델 단가표는 분명 그대로인데 말이죠. 범인은 가격표가 아니라 그 아래에 깔린 토크나이저입니다.
토크나이저가 뭐길래 청구서를 흔드는 건가요
LLM은 우리가 입력한 한국어든 영어든, 일단 잘게 쪼개서 숫자 ID로 바꿔야 처리할 수 있습니다. 이 쪼개는 도구가 토크나이저인데요. 우리가 “안녕하세요"라고 입력하면 모델 내부에서는 이게 4개 토큰이 될 수도, 6개가 될 수도 있습니다. 그리고 API 요금은 글자 수가 아니라 토큰 수로 계산됩니다. 즉 같은 문장이라도 토크나이저가 더 잘게 쪼개면 그만큼 더 비싸집니다.
Opus 4.6까지 쓰던 토크나이저는 영어와 코드에는 효율적이었지만, 한국어·일본어·중국어 같은 비라틴 문자 언어에는 다소 헐겁다는 평이 있었습니다. Opus 4.7은 이걸 손봤습니다. 새 어휘 사전(vocabulary)이 더 커졌고, 멀티모달 처리와 도구 호출(tool use) 토큰을 더 정밀하게 다루도록 재설계됐습니다.
그런데 왜 더 비싸진 건가요
여기서 직관과 어긋나는 일이 벌어집니다. “어휘가 늘면 한 토큰에 더 많은 글자를 담을 수 있으니 오히려 토큰 수가 줄어야 하지 않나요?“라는 질문이 자연스러운데요. 실제로 한국어 같은 일부 언어에서는 토큰 수가 줄어듭니다. 문제는 다른 곳에서 새는 비용입니다.
첫째, 시스템 프롬프트와 도구 정의 토큰이 늘었습니다. Opus 4.7은 더 정교한 도구 호출 스키마와 안전 가드를 내장하면서, 사용자가 보내지 않아도 매 요청마다 따라붙는 “보이지 않는 토큰"이 늘어났습니다. 짧은 질문 한 번에도 베이스라인 비용이 깔립니다.
둘째, 출력 토큰의 평균 길이가 길어졌습니다. 4.7은 같은 질문에도 더 풍부한 추론과 근거를 펼치는 경향이 있습니다. 품질은 좋아졌지만 출력 토큰은 입력 토큰보다 단가가 5배 비쌉니다($15 vs $75 per million tokens). 출력이 10%만 늘어도 청구서 체감은 훨씬 크죠.
셋째, thinking 토큰이 디폴트로 켜져 있습니다. 모델이 답하기 전 머릿속으로 굴리는 추론 과정이 별도 토큰으로 과금되는데, 4.7은 이 비중이 평균적으로 늘었습니다. 사용자에게는 보이지 않지만 영수증에는 또렷이 찍힙니다.
같은 작업, 다른 청구서 — 실제로 얼마나 차이날까
코드 리뷰처럼 입출력이 균형 잡힌 작업은 차이가 510% 수준에 그치는 경우가 많습니다. 반면 긴 문서를 요약하거나 에이전트가 여러 도구를 연쇄 호출하는 워크플로우에서는 2030% 증가가 흔하게 보고됩니다. 도구 호출이 많을수록, 세션이 길수록, 한국어·일본어 비중이 높을수록 변동폭이 커집니다.
특히 Claude Code 같은 에이전트 환경에서 영향이 큽니다. 파일 읽기·편집·검색이 끊임없이 토큰을 소비하는데, 4.7은 한 번의 도구 호출에 더 정밀한 컨텍스트를 끼워 넣습니다. 결과 품질은 분명 좋아졌지만, 한 세션에 30분 작업하면 청구액이 눈에 띄게 다릅니다.
그래서 어떻게 대응해야 할까요
첫 번째는 프롬프트 캐싱을 적극 쓰는 겁니다. 4.7에서 캐시 적중분은 입력 단가의 10%만 청구되니 시스템 프롬프트와 반복 컨텍스트는 무조건 캐시에 태우세요. 두 번째는 작업별로 모델을 나누는 겁니다. 단순 분류·요약은 Haiku 4.5나 Sonnet 4.6으로 충분하고, Opus 4.7은 진짜 복잡한 추론에만 호출하는 식이죠. 세 번째는 thinking 토큰 한도를 명시적으로 잡는 겁니다. budget_tokens 파라미터로 추론 길이를 제어하면 품질을 크게 해치지 않으면서도 비용을 잡을 수 있습니다.
마치며
가격표는 정직했지만, 토크나이저는 우리에게 따로 알려주지 않고 영수증을 다시 썼습니다. AI를 본격적으로 쓰는 시대로 넘어갈수록 모델 단가표만 보고 비용을 계산하는 시절은 끝나가는 것 같습니다. 같은 일을 시켰는데 왜 더 나왔는지 궁금하다면, 이제는 토큰 사용량 대시보드부터 열어봐야 할 때입니다. 여러분의 청구서는 지난달과 비교해 어떻게 달라졌나요.
댓글
댓글을 불러오는 중...