Go to contents

LG发布可同时理解文档与图像的“ExaOne 4.5”,性能超越GPT-5 Mini

LG发布可同时理解文档与图像的“ExaOne 4.5”,性能超越GPT-5 Mini

Posted April. 10, 2026 09:07   

Updated April. 10, 2026 09:07


LG人工智能(AI)研究院9日宣布,公开推出能够同时理解并推理文本与图像的多模态人工智能模型“ExaOne 4.5”。多模态是指能够同时理解并处理文本、图像、语音、视频等多种形式数据的人工智能。

ExaOne 4.5结合了自主研发的视觉编码器与大型语言模型(LLM),可同时理解文字和图像。该模型在读取和分析合同、技术图纸、财务报表等实际产业领域中使用的复杂资料方面具有优势。LG人工智能研究院表示,该模型是自主基础模型“K-ExaOne”未来发展过程中的一个阶段,旨在使其能够处理更多样化形式的数据。

在性能方面,该模型也展现出竞争力。在科学、技术、工程、数学五个指标的平均得分为77.3分,超过了开放人工智能“GPT-5 Mini”(73.5分)、Anthropic“Claude Sonnet 4.5”(74.6分)和阿里巴巴“千问3”(77.0分)。在13项视觉能力评估指标的平均得分上也超过了GPT-5 Mini和Claude Sonnet 4.5等模型。LG人工智能研究院表示,人工智能已达到了能够同时理解图像与文本语境并回答问题的水平。


李敏娥记者 omg@donga.com