한국지능정보사회진흥원은 AI 허브의 외부 기관 데이터 페이지 내 유해 표현 검출 모델 및 유해 표현 데이터를 공개했다. 한국지능정보사회진흥원 제공
AI 허브는 과학기술정보통신부와 NIA가 운영하는 국내 최대 AI 학습용 데이터 제공 플랫폼이다.
이번 유해 표현 검출 AI 모델 및 데이터는 과학기술정보통신부 초거대 AI 확산 생태계 조성 사업의 일환으로 개발됐다. LLM 데이터의 품질검증 과정에서 유해성을 측정하기 위한 것으로, 자체 성능 검증 결과 80~90% 정확도를 달성했다.
광고 로드중
AI 모델과 데이터는 AI 허브를 통해 누구나 활용할 수 있다. NIA 측은 인공지능이 생성하는 콘텐츠의 안전성을 강화하고 다양한 산업 분야에서 인공지능 윤리를 지키는 데 일조할 수 있을 것으로 기대한다.
황종성 NIA 원장은 “인공지능 기술의 발전은 기술적 진보뿐만 아니라 사회적 책임을 담보할 수 있는 윤리적 고려가 반드시 병행돼야 한다”며 “이번 AI 모델 및 데이터의 공개가 한국어 LLM의 신뢰성과 안전성을 강화하는 계기가 될 것으로 기대한다”고 말했다.
이한규 기자 hanq@donga.com