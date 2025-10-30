AI에이전트 언어능력 높을수록 양극화 심화
도덕적 판단 위임 시 책임회피-부정 행위 늘어
공손함보다 무례함이 AI 성능 높이기도
인간 약점 학습 AI, 문제적 사고 확산 우려도
하루가 멀다 하고 사람이 해 온 다양한 일을 대신 하는 인공지능(AI) 서비스들이 속속 생겨나는 가운데 이달 15일 미국 퓨리서치는 25개국 국민을 대상으로 일상생활 속 AI 사용 확대에 대한 인식 조사 결과를 발표했다. 이에 따르면 한국 응답자들은 AI 활용에 비교적 낙관적인 것으로 나타났다. 구체적으로 “기대보다 우려가 크다”고 답한 한국인은 16%로 조사대상국 중 가장 낮았고(전체 중간값 34%), 반대로 “우려보다 기대가 크다”고 응답한 비율은 22%(전체 중간값 16%)로 상대적으로 높았다.
하지만 AI는 사람만이 할 수 있다고 여겨졌던 일을 척척 해내는 신통한 도구가 아니라 인간의 편향과 한계, 비도덕성을 그대로 드러내거나 심지어 조장하기도 한다. 2024년 발표된 한 논문은 대형언어모델(LLM) 기반 AI 에이전트들이 특정 주제에 대해 토론을 반복할 때 집단의 의견이 어떻게 변화하는지를 분석했다. 온라인 공간에서 흔히 볼 수 있듯 처음에는 다양한 의견을 가지고 있었더라도 비슷한 입장을 지닌 에이전트들끼리 대화를 이어가면서 찬성과 반대로 진영이 뚜렷이 나뉘는 전형적인 양극화가 나타났다.
흥미롭게도 AI 모델의 언어 이해력이 높을수록 오히려 양극화는 심화됐다. 다른 에이전트의 의견을 더 정교하게 파악하고, 그에 맞춰 자신의 입장을 수정하는 능력이 역설적으로 상대와의 입장 차를 더욱 고착시키는 결과를 낳은 것이다. 또한 에이전트의 성격(persona)도 중요한 변수로 작용했다. 자기 입장을 좀처럼 바꾸지 않는 ‘옹고집형’보다 주변 의견에 민감하게 반응하는 ‘팔랑귀형’ 에이전트들이 토론 과정에서 더 극단으로 갈라졌다.
2025년 네이처(Nature)지에 실린 논문에 따르면 사람들이 AI 에이전트에게 업무를 위임할 때 부정행위가 발생할 가능성이 높아졌다. 주사위를 던져 나온 숫자에 따라 금전적 보상을 주는 시나리오를 가지고 실험을 진행했는데 직접 결과를 보고한 참가자 가운데 95%는 정직하게 답했지만, AI 에이전트에게 데이터를 제공하고 보고를 대신 하게 한 경우 참가자의 75%만 정직하게 결과를 입력했다. ‘남의 손으로 코 푸는’ 도덕적 책임회피가 발생한 것이다.
한편 참여자가 일부 수치를 부풀려 보고하도록 요청한 경우 인간 대리인은 28%만 이에 응했다. 반면 AI 에이전트는 무려 52%가 이 부도덕한 요청에 순응했다. 거짓 보고를 노골적으로 지시한 상황에서는 인간과 기계의 차이가 더욱 뚜렷하게 나타났다. 인간 대리인의 절반은 부정행위를 거절했으나, AI 에이전트가 명령을 거부할 확률은 단지 7%에 그쳤다. 마치 연령에 따라 요금이 달라지는 식당에서 누가 물어보면 나이를 줄여 말하도록 엄마한테 단단히 훈련을 받은 초등학생 같다고나 할까.
최근 연구는 심지어 AI가 인간에게 ‘나쁜 버릇’을 가르칠 가능성까지 제기한다. 우리는 어려서부터 타인을 대할 때, 특히 부탁이나 도움을 청할 때 공손하고 예의 바르게 말해야 한다고 배워 왔다. 영어권에서 아이들에게 말끝에 “플리즈(please)”를 붙이라고 가르치는 것도 그 이유다. 그런데 LLM에 공손한 지시문(프롬프트)을 입력하면 오히려 결과의 정확도가 떨어질 수 있다는 실험 결과가 보고됐다. 예를 들어 “이런 것도 못 푸냐? 어디 풀 수 있나 보자”와 같이 무례하게 말하면 “다음 문제를 친절히 검토하시고 답을 알려주시겠어요?”처럼 공손하게 부탁하는 경우에 비해 챗봇의 정답 제공 확률이 더 높게 나타났다. 물론 실험 규모가 작고, 단일 AI 모델을 사용한 데다 객관식 문제풀이에 한정돼 연구 결과를 일반화하기에는 무리가 있다. 하지만 연구진의 추정대로 무례한 지시문이 AI로 하여금 불필요한 문맥을 배제하고 문제 해결에 집중하게 만들어서 성능이 향상된 것이라면, 이용자로서는 무례한 프롬프트를 쓰는 것이 더 합리적일 수 있다.
‘아이들 보는 데서는 찬물도 못 마신다’는 말이 있다. 그저 보고 듣는 대로 별 생각 없이 주변 사람의 행동을 따라 하는 아이들의 습성을 가리키는 표현이다. 앞으로 AI 기술이 어떤 방향으로 진화할지는 알 수 없지만, 당장은 인공일반지능(AGI)이 인간을 지배하는 것보다 닮지 않았으면 좋았을 인간의 약점을 그대로 학습한 AI가 더 걱정스럽다. 그런 AI가 인간의 문제적 사고와 행동을 이전보다 훨씬 빨리, 폭넓게 확산시킬 수 있기 때문이다. 인간은 ‘바담풍’이라 해도 AI만큼은 ‘바람풍’이라고 답하길 바라는 건 무리인가.
