LG發布可同時理解文檔與圖像的“ExaOne 4.5”，性能超越GPT-5 Mini

Posted April. 10, 2026 09:11

Updated April. 10, 2026 09:34

LG人工智能（AI）研究院9日宣布，公開推出能夠同時理解並推理文本與圖像的多模態人工智能模型“ExaOne 4.5”。多模態是指能夠同時理解並處理文本、圖像、語音、視頻等多種形式數據的人工智能。

ExaOne 4.5結合了自主研發的視覺編碼器與大型語言模型（LLM），可同時理解文字和圖像。該模型在讀取和分析合同、技術圖紙、財務報表等實際産業領域中使用的複雜資料方面具有優勢。LG人工智能研究院表示，該模型是自主基礎模型“K-ExaOne”未來發展過程中的壹個階段，旨在使其能夠處理更多樣化形式的數據。

在性能方面，該模型也展現出競爭力。在科學、技術、工程、數學五個指標的平均得分爲77.3分，超過了開放人工智能“GPT-5 Mini”（73.5分）、Anthropic“Claude Sonnet 4.5”（74.6分）和阿裏巴巴“千問3”（77.0分）。在13項視覺能力評估指標的平均得分上也超過了GPT-5 Mini和Claude Sonnet 4.5等模型。LG人工智能研究院表示，人工智能已達到了能夠同時理解圖像與文本語境並回答問題的水平。

李敏娥記者 omg@donga.com

Editions

LG發布可同時理解文檔與圖像的“ExaOne 4.5”，性能超越GPT-5 Mini

LG發布可同時理解文檔與圖像的“ExaOne 4.5”，性能超越GPT-5 Mini

熱門新聞

要聞

論壇