시키지도 않은 코드를 고치는 AI, '오버에디팅'이 드러낸 코딩 에이전트의 숨은 비용
“한 줄만 고쳐달라고 했는데, 파일 세 개가 바뀌어 있습니다.” 요즘 Claude Code, Cursor, Copilot 같은 코딩 에이전트를 쓰는 개발자들 사이에서 가장 자주 나오는 불평입니다. AI가 요청받지 않은 리팩터링까지 멋대로 해버리는 이른바 오버에디팅(over-editing) 문제인데요. 생산성 도구라더니, 오히려 리뷰 시간을 늘리고 있다는 이야기가 심심찮게 들립니다.
오버에디팅이란 정확히 무엇인가
오버에디팅은 말 그대로 “시킨 것보다 더 많이 고치는” 행동입니다. 버그 한 줄 수정을 부탁했더니, AI가 변수명을 바꾸고, 함수를 쪼개고, import 순서를 정렬하고, 심지어 주석까지 새로 답니다. 겉보기엔 “꼼꼼한 동료"처럼 보이지만, 실제로는 리뷰어의 시간을 잡아먹는 노이즈입니다.
한 Git diff에 의도한 변경과 무의미한 변경이 뒤섞이면 어떻게 될까요. 리뷰어는 한 줄 한 줄을 다시 검증해야 하고, PR이 커질수록 버그 유입 가능성도 올라갑니다. “AI가 대신 일해줬다"가 아니라 “AI가 만든 diff를 내가 다시 검수해야 한다”로 바뀌는 셈이죠.
왜 LLM은 자꾸 손을 대고 싶어 할까
근본 원인은 훈련 방식에 있습니다. LLM은 “좋은 코드"에 대한 수많은 예시를 학습했는데, 그 과정에서 ‘개선 편향’이 자연스럽게 새겨졌습니다. 주변에 개선할 여지가 보이면 손을 대도록 강화되어 있는 거죠. 게다가 Chain-of-Thought 추론 구조상, AI는 “문제를 넓게 본다"는 방향으로 움직이는 경향이 있습니다.
Mastra의 Mario Zechner는 3월 31일 공개한 영상 “I Hated Every Coding Agent, So I Built My Own”에서 이 문제를 정면으로 다뤘습니다. 15만 9천 뷰, 좋아요 4,837개를 기록하며 개발자 커뮤니티의 공감을 크게 얻었는데요. 그의 핵심 주장은 간단합니다. 기존 코딩 에이전트들은 “도와준다"는 명분으로 너무 많은 결정을 사용자 대신 내린다는 것입니다.
오버에디팅이 만드는 세 가지 숨은 비용
첫째, 리뷰 비용입니다. 변경 라인이 10줄에서 200줄로 늘어나면, 리뷰 시간도 비례해서 늘어납니다. 둘째, 토큰 비용입니다. AI가 불필요한 파일까지 읽고 수정하면 한 번의 요청에 들어가는 입출력 토큰이 기하급수적으로 늘어납니다.
Nate Herk가 4월 2일 올린 “18 Claude Code Token Hacks in 18 Minutes”는 18만 9천 뷰, 좋아요 6,784개를 기록했습니다. 사람들이 토큰 낭비에 얼마나 민감해졌는지를 보여주는 숫자인데요. 오버에디팅은 이 토큰 낭비의 가장 큰 주범 중 하나입니다. 셋째, 신뢰 비용입니다. AI가 건드린 코드가 많아질수록, 개발자는 “이 diff 안에 숨은 지뢰가 있지는 않나” 의심하며 작업하게 됩니다.
에이전트를 ‘최소 편집’ 모드로 길들이는 법
해결책은 결국 제약을 명시적으로 거는 것입니다. “이 함수만 고쳐줘, 다른 건 건드리지 마"라고 써도 잘 지키지 않는 경우가 많은데요. 최근 개발자들 사이에서 효과가 입증된 패턴은 이렇습니다.
프롬프트 초반에 “Surgical edits only” 같은 명시적 룰을 박아두거나, CLAUDE.md나 .cursorrules 파일에 “요청받지 않은 리팩터링 금지"를 못 박는 방식입니다. 또 하나는 변경 범위를 파일 단위가 아닌 라인 범위로 못 박는 방식인데, “L42-L55만 수정"처럼 구체적으로 지시할수록 오버에디팅이 줄어듭니다.
“The Hidden Layer” 채널이 4월 12일 올린 영상은 ‘Atomic Skills(원자적 스킬)’이라는 개념을 소개했습니다. AI에게 복잡한 작업을 통째로 맡기지 말고, 최소 단위의 기능 블록으로 쪼개서 하나씩 실행시키라는 건데요. 오버에디팅을 구조적으로 억제하는 방법으로 주목받고 있습니다.
결국 문제는 ‘위임의 단위’입니다
오버에디팅 논쟁의 본질은 “AI가 똑똑하냐"가 아닙니다. “개발자가 어느 정도까지 AI에게 판단을 넘길 것인가”입니다. 넓게 위임하면 예상치 못한 변경이 쏟아지고, 좁게 위임하면 자동화의 이점이 줄어듭니다. 이 균형을 잡는 것이 2026년 AI 시대 개발자의 새로운 숙제가 되고 있습니다.
여러분은 코딩 에이전트에게 얼마나 많은 재량을 주시나요. 혹시 AI가 멋대로 뜯어고친 코드를 복원하느라 더 많은 시간을 쓰고 계시진 않은가요.
댓글
댓글을 불러오는 중...