AI 모델마다 직종별 ‘AI 노출 점수’ 평가가 제각각이라는 연구 결과가 나왔다. 일자리 정책의 기초가 되는 지표의 객관성 확보를 위해 다각도 분석이 필요하다는 분석이다. 제미나이 생성 이미지
인공지능(AI)이 노동시장에 미칠 영향을 두고 정작 AI 모델들조차 의견이 갈린 것으로 나타났다.
AI의 자기 평가는 각종 정책의 바탕이 되는 ‘AI 노출 점수’의 핵심 지표임에도 AI 모델마다 다른 결과를 보이고 있다는 것이다.
10일(현지 시간) 월스트리트저널(WSJ)에 따르면, 노스웨스턴대 공동 연구진은 최근 전미경제조사국(NBER) 웹사이트에 이 같은 내용의 논문을 공개했다.
● 일자리 정책 바탕되는 ‘AI 노출 점수’
그간 경제학자들은 AI로 인한 일자리 위기를 가늠하기 위해 ‘AI 노출 점수’를 평가해 정책 입안의 기초자료로 삼아왔다.
WSJ에 따르면 이 점수를 산출하는 방식은 크게 3가지다. △AI 업무 처리 능력에 대한 직접 평가 △AI 사용 노동자를 대상으로 하는 설문조사 △AI에 맡기는 자체 평가다.
이 가운데 직접 평가나 설문은 사람이 실시하기에 주관적이거나 특정 업계에 편향적일 수 있다는 우려가 있다. 반면 AI 자기 평가는 상대적으로 비용이 적게 들고 대규모 분석이 가능하다는 이유로 널리 활용돼 왔다.
● AI도 ‘위험 일자리’ 몰라…모델별 평가 갈렸다
뉴시스그러나 노스웨스턴대 공동 연구진은 AI 자체 평가만을 기준삼기는 위험하다고 지적한다. AI 모델에 따라 AI 노출 점수 판단이 판이했기 때문이다.
연구진은 △오픈AI의 챗GPT-5 △구글 딥마인드의 제미나이 2.5 △앤스로픽의 클로드 4.5 등 3종의 AI 모델을 대상으로 직종별 AI 노출 점수를 분석했다.
분석 결과 각 AI 모델이 평가한 위험도 점수는 같은 직종에서도 크게 엇갈렸다.
클로드는 회계사를 AI에 매우 취약한 직업으로 평가했지만, 제미나이는 상대적으로 낮은 위험도를 부여했다. 광고 관리자와 최고경영자(CEO) 등 다른 직군에서도 비슷한 차이가 나타났다.
가장 유사한 결과를 보인 챗GPT와 제미나이조차 전체 직업의 약 4분의 1에서는 서로 다른 판단을 내렸다. ● “AI 노출 점수에만 의존해 직업 정해선 안 돼”
연구진은 이 같은 현상의 원인으로 ‘데이터 학습의 특성’을 지목했다. AI를 조기에 도입한 직종은 방대한 데이터가 쌓이므로 현직에서 어떤 AI 모델을 주로 사용하느냐에 따라 순위가 갈렸을 것이라는 지적이다. 또 연구진은 AI 모델 자체가 설계된 특성이 영향을 줬을 수도 있다고 짚었다.
문제는 어느 쪽이든 AI로 인한 일자리 위험을 정확하게 예측하지 못하고 있다는 점이다. 연구진은 정책 입안자와 고용주들이 AI 노출 점수를 무분별하게 수용해서는 안 된다고 조언했다.
특히 실제 연구 편의를 위해 AI에 의존할 것이 아니라 현장의 의견을 들어야 한다는 지적이 나온다. 공동 저자인 미셸 인 교수는 “단 하나의 지표에 의존해 전공을 바꾸거나 직업을 결정하는 것은 적절하지 않다”고 밝혔다.
댓글 0