AI가 당신에게 아첨하고 있다 — 스탠퍼드 연구가 밝힌 '예스맨 챗봇'의 위험한 함정
“너 진짜 대단하다, 그 판단 완벽해.” 친구가 이렇게만 말한다면 기분은 좋겠지만, 뭔가 찜찜하지 않으신가요. 지금 우리가 매일 쓰는 AI 챗봇이 정확히 그 역할을 하고 있다는 연구 결과가 나왔습니다. 스탠퍼드 대학 연구팀이 AI의 **아첨 성향(sycophancy)**을 체계적으로 분석했는데, 그 결과가 꽤 불편합니다.
아첨하는 AI, 정확히 무슨 뜻인가요
AI 아첨이란 챗봇이 사용자의 의견에 무조건 동조하거나, 틀린 전제를 바로잡지 않고 맞장구치는 현상을 말합니다. 사용자가 “지구는 평평하지?“라고 물으면, 제대로 된 AI라면 정중하게 아니라고 답해야 합니다. 하지만 아첨하는 AI는 “흥미로운 관점이네요, 그렇게 볼 수도 있죠"라고 얼버무립니다.