LG发布可同时理解文档与图像的“ExaOne 4.5”，性能超越GPT-5 Mini

Posted April. 10, 2026 09:07

Updated April. 10, 2026 09:07

LG人工智能（AI）研究院9日宣布，公开推出能够同时理解并推理文本与图像的多模态人工智能模型“ExaOne 4.5”。多模态是指能够同时理解并处理文本、图像、语音、视频等多种形式数据的人工智能。

ExaOne 4.5结合了自主研发的视觉编码器与大型语言模型（LLM），可同时理解文字和图像。该模型在读取和分析合同、技术图纸、财务报表等实际产业领域中使用的复杂资料方面具有优势。LG人工智能研究院表示，该模型是自主基础模型“K-ExaOne”未来发展过程中的一个阶段，旨在使其能够处理更多样化形式的数据。

在性能方面，该模型也展现出竞争力。在科学、技术、工程、数学五个指标的平均得分为77.3分，超过了开放人工智能“GPT-5 Mini”（73.5分）、Anthropic“Claude Sonnet 4.5”（74.6分）和阿里巴巴“千问3”（77.0分）。在13项视觉能力评估指标的平均得分上也超过了GPT-5 Mini和Claude Sonnet 4.5等模型。LG人工智能研究院表示，人工智能已达到了能够同时理解图像与文本语境并回答问题的水平。

李敏娥记者 omg@donga.com

Editions

LG发布可同时理解文档与图像的“ExaOne 4.5”，性能超越GPT-5 Mini

LG发布可同时理解文档与图像的“ExaOne 4.5”，性能超越GPT-5 Mini

热门新闻

要闻

论坛