Go to contents

LG發布可同時理解文檔與圖像的“ExaOne 4.5”,性能超越GPT-5 Mini

LG發布可同時理解文檔與圖像的“ExaOne 4.5”,性能超越GPT-5 Mini

Posted April. 10, 2026 09:11   

Updated April. 10, 2026 09:34


LG人工智能(AI)研究院9日宣布,公開推出能夠同時理解並推理文本與圖像的多模態人工智能模型“ExaOne 4.5”。多模態是指能夠同時理解並處理文本、圖像、語音、視頻等多種形式數據的人工智能。

ExaOne 4.5結合了自主研發的視覺編碼器與大型語言模型(LLM),可同時理解文字和圖像。該模型在讀取和分析合同、技術圖紙、財務報表等實際産業領域中使用的複雜資料方面具有優勢。LG人工智能研究院表示,該模型是自主基礎模型“K-ExaOne”未來發展過程中的壹個階段,旨在使其能夠處理更多樣化形式的數據。

在性能方面,該模型也展現出競爭力。在科學、技術、工程、數學五個指標的平均得分爲77.3分,超過了開放人工智能“GPT-5 Mini”(73.5分)、Anthropic“Claude Sonnet 4.5”(74.6分)和阿裏巴巴“千問3”(77.0分)。在13項視覺能力評估指標的平均得分上也超過了GPT-5 Mini和Claude Sonnet 4.5等模型。LG人工智能研究院表示,人工智能已達到了能夠同時理解圖像與文本語境並回答問題的水平。


李敏娥記者 omg@donga.com