NIA, 유해 표현 검출하는 AI 모델 및 학습용 데이터 공개

입력 | 2025-04-14 16:03:00

한국지능정보사회진흥원은 AI 허브의 외부 기관 데이터 페이지 내 유해 표현 검출 모델 및 유해 표현 데이터를 공개했다. 한국지능정보사회진흥원 제공

한국지능정보사회진흥원(NIA)과 한국정보통신기술협회(TTA)는 인공지능(AI) 허브를 통해 대규모 언어 모델(LLM) 학습용 데이터 내의 ‘유해 표현 검출 인공지능 모델’과 ‘유해 표현 학습용 데이터’를 공개했다고 14일 밝혔다.

AI 허브는 과학기술정보통신부와 NIA가 운영하는 국내 최대 AI 학습용 데이터 제공 플랫폼이다.

이번 유해 표현 검출 AI 모델 및 데이터는 과학기술정보통신부 초거대 AI 확산 생태계 조성 사업의 일환으로 개발됐다. LLM 데이터의 품질검증 과정에서 유해성을 측정하기 위한 것으로, 자체 성능 검증 결과 80~90% 정확도를 달성했다.

광고 로드중

공개된 인공지능 모델은 말뭉치 데이터에서 유해 표현을 검출하고 다양한 카테고리로 분류한다. 학습에 활용한 데이터는 유해 표현 검출용 데이터 20만 건과 유해 표현 카테고리 구분용 데이터 21만 건으로 구성됐다.

AI 모델과 데이터는 AI 허브를 통해 누구나 활용할 수 있다. NIA 측은 인공지능이 생성하는 콘텐츠의 안전성을 강화하고 다양한 산업 분야에서 인공지능 윤리를 지키는 데 일조할 수 있을 것으로 기대한다.

황종성 NIA 원장은 “인공지능 기술의 발전은 기술적 진보뿐만 아니라 사회적 책임을 담보할 수 있는 윤리적 고려가 반드시 병행돼야 한다”며 “이번 AI 모델 및 데이터의 공개가 한국어 LLM의 신뢰성과 안전성을 강화하는 계기가 될 것으로 기대한다”고 말했다.

이한규 기자 hanq@donga.com

NIA, 유해 표현 검출하는 AI 모델 및 학습용 데이터 공개

트랜드뉴스

출근 않고 홀로 북한산 오른 실종 여성, 28일 만에 숨진 채 발견

“美 반도체 산업을 훔쳐갔다” 중국 다녀온 트럼프, 대만에 화살

한혜진, ♥기성용과 오랜만에 데이트…딸과 함께 ‘훈훈’ 나들이

“삼성전자, ‘연봉의 607%’ 메모리 성과급 제안했었다”

피곤한데 잠이 안 온다?…‘두 가지 성분’ 함께 먹으면 꿀잠

이재용 회장 “국민께 머리 숙여 사죄…비바람 제가 맞겠다”

중학생 아들 ‘욕설’에 손으로 엉덩이 때렸다고…경찰, 父 입건 조사

“美 반도체 산업을 훔쳐갔다” 중국 다녀온 트럼프, 대만에 화살

“삼성전자, ‘연봉의 607%’ 메모리 성과급 제안했었다”

[단독]삼성 파업 위기… 정부 ‘긴급조정권 발동’ 물밑작업 속도

지금 뜨는 뉴스

‘불닭 신화’ 쓴 삼양식품 며느리 김정수, 회장 된다

‘금빛 랠리’였던 금값 주춤… “금리 오르면 현금이 유리” 심리 퍼져[글로벌 포커스]

경찰청 “운동회에 경찰 출동 지양하라” 지시…‘민원’보다는 ‘교육’