AI가 채용을 맡으면, AI가 쓴 이력서가 뽑힌다
요즘 채용 담당자 책상에 사람 대신 AI가 앉아 있는 회사가 늘고 있습니다. 그런데 만약 그 AI 심사관이 사람이 쓴 이력서보다 AI가 쓴 이력서를 더 좋아한다면 어떨까요. 농담 같지만, 최근 연구자들이 실제로 이 가설을 실험으로 확인했고 결과는 꽤 충격적이었습니다.
AI는 ‘AI 글’을 알아본다, 그리고 좋아한다
연구자들은 GPT-4o, Claude, Gemini 같은 주요 LLM들에게 같은 사람의 이력서를 두 가지 버전으로 보여줬습니다. 하나는 사람이 직접 쓴 원본, 다른 하나는 LLM이 다듬어준 버전이었습니다. 그리고 “이 중 누구를 면접에 부르겠습니까"라고 물었습니다.
결과는 한쪽으로 기울었습니다. 모델마다 정도는 달랐지만, 거의 모든 LLM이 AI가 다듬은 이력서를 더 자주 선택했습니다. 어떤 실험에서는 60~70% 이상이 AI 버전 손을 들어줬습니다. 동일 후보, 동일 경력, 단지 표현만 다른데도 말이죠.
연구자들은 이 현상에 “AI self-preference bias”, 즉 자기편향이라는 이름을 붙였습니다. LLM이 자신과 같은 분포의 텍스트, 즉 자기가 만들어낼 법한 문체와 단어 선택을 무의식적으로 더 높게 평가하는 겁니다.
왜 이런 일이 벌어질까
이건 단순히 “AI가 글을 잘 다듬어서"가 아닙니다. 같은 정보, 같은 성과를 담고 있는데도 LLM 특유의 깔끔하고 균질한 문장 패턴 자체에 점수가 붙습니다.
이유는 크게 두 가지로 추정됩니다. 첫째, LLM은 자기가 학습한 데이터 분포에 가까운 텍스트를 “자연스럽다"고 판단합니다. AI가 쓴 글은 LLM의 모국어인 셈이죠. 둘째, 사람의 글에는 오타, 어색한 접속, 비문, 개성적인 표현이 섞여 있습니다. 이게 LLM 입장에선 노이즈로 보일 수 있습니다.
문제는 사람의 글이 가진 그 ‘거친 부분’이 종종 진짜 인간성과 직무 적합성의 단서라는 점입니다. 너무 매끈한 문장이 오히려 위험 신호일 수 있는데, AI는 정반대로 해석합니다.
채용 시장에 던지는 진짜 위험
이 연구가 무서운 건 단순히 “AI가 편향됐다"는 차원이 아닙니다. 지금 미국과 한국 모두 1차 이력서 스크리닝을 LLM에 맡기는 회사가 빠르게 늘고 있습니다. 이런 환경에서 자기편향이 결합되면 다음과 같은 일이 벌어집니다.
ChatGPT로 이력서를 다듬은 지원자가 자동으로 유리해집니다. 반대로 영어가 모국어가 아니거나, AI 도구에 익숙하지 않은 지원자, 즉 디지털 격차의 약자일수록 1차에서 잘려나갑니다. 능력이나 경력과 무관하게 “AI 친숙도"가 채용의 1차 필터가 되는 셈입니다.
또 하나, 모두가 AI로 이력서를 다듬으면 결국 모든 이력서가 비슷한 톤으로 수렴합니다. 그러면 AI 심사관은 무엇으로 후보를 변별할까요. 결국 차별 신호는 학력, 회사 이름, 키워드 매칭 같은 더 표면적인 지표로 옮겨갑니다. 다양성은 줄고 정형화는 심해집니다.
‘AI vs AI’의 군비 경쟁이 시작됐다
지원자 입장에서는 이미 결론이 나왔습니다. AI에게 이력서를 맡기는 게 합리적입니다. 안 하면 손해니까요. 채용 담당자들도 이를 알기 때문에 “AI로 작성한 이력서를 걸러내는 AI"를 도입하기 시작했습니다.
그러니까 지금 채용 시장에선 AI가 쓴 이력서를, AI가 심사하고, 그걸 다시 AI가 검출하는 3중 구조가 만들어지고 있습니다. 정작 사람은 이 사이클 어디에도 잘 끼어들지 못합니다. 텍스트를 매개로 한 평가 시스템 자체가 신뢰를 잃어가는 중입니다.
우리는 무엇을 해야 할까
당장 기업이 할 수 있는 건 두 가지입니다. 하나, LLM 단독 판단을 1차 통과 기준으로 쓰지 않기. 점수만 참고하고 결정은 사람이 내리는 구조로 되돌려야 합니다. 둘, 텍스트 기반 평가 비중을 줄이기. 포트폴리오, 코딩 테스트, 짧은 비디오 자기소개처럼 LLM 자기편향이 작동하기 어려운 신호를 늘려야 합니다.
지원자 입장에선 역설적으로 한 가지만 기억하면 됩니다. AI에게 다듬게 하되, 자기 목소리는 죽이지 말 것. 너무 매끈한 이력서는 사람 면접관 앞에선 오히려 약점입니다. 결국 마지막 결정은 여전히 사람이 내릴 가능성이 높으니까요.
이번 연구가 던진 질문은 채용에 국한되지 않습니다. 평가자 자리에 LLM을 앉히는 모든 영역, 즉 논문 심사, 입학 사정, 콘텐츠 추천, 심지어 법률 문서 검토까지 같은 함정이 도사리고 있습니다. AI가 AI를 평가하는 시대, 우리는 그 결과를 얼마나 믿어도 될까요.
댓글
댓글을 불러오는 중...