ＬＧ、文書・画像推論ＡＩ「ＥＸＡＯＮ４．５」公開　ＧＰＴ５ミニ上回る性能

Posted April. 10, 2026 09:01,

Updated April. 10, 2026 09:01

ＬＧＡＩ研究院は９日、テキストと画像を同時に理解し推論できるマルチモーダル人工知能（ＡＩ）モデル「ＥＸＡＯＮ４．５」を発表した。マルチモーダルとは、テキストや画像、音声、映像など多様な形式のデータを同時に理解し処理するＡＩのこと。

ＥＸＡＯＮ４．５は、独自開発のビジョンエンコーダーと大規模言語モデル（ＬＬＭ）を組み合わせ、文章と画像を同時に理解できる。契約書や技術図面、財務諸表など実際の産業現場で用いられる複雑な資料の読み取り・分析する能力に優れる。ＬＧＡＩ研究院は、今回のモデルが独自の基盤モデル「Ｋ－ＥＸＡＯＮ」を、より多様なデータ処理へと拡張する発展段階に当たると説明した。

性能面でも競争力を示した。科学・技術・工学・数学（ＳＴＥＭ）分野の５指標の平均スコアは７７．３点で、ＧＰＴ－５ｍｉｎｉ（７３．５点）、クロード・ソネット４．５（７４．６点）、Ｑｗｅｎ３（７７．０点）を上回った。１３の視覚能力評価指標の平均スコアでもＧＰＴ５ミニやクロード・ソネット４．５などを上回った。ＬＧＡＩ研究院は「ＡＩが画像とテキストの文脈を統合的に理解し、質問に答えられる水準に到達した」と説明した。

イ・ミンア記者 omg@donga.com