
研究人員開發出壹款能如人類般對字迹潦草的數學答案進行評分並予以批改的人工智能(AI)“教師”。
蔚山科學技術院(UNIST)17日宣布,該院人工智能研究生院教授金泰煥與浦項科技大學計算機工程系教授高成安團隊,成功開發出可對手寫複雜數學答案進行評分的人工智能模型“貝米(VEHME)”。
主觀題數學答案因筆迹與答案布局各異,且混合數學公式、圖表、圖形等非結構化數據,人工智能難以准確識別並評分。而“貝米”能精准識別公式位置與上下文,恰似人類跟隨解題思路進行判斷。研究團隊使用“貝米”對從小學算術至微積分等不同難度數學解題過程進行評分測試,結果顯示其准確度與OpenAI研究中心“GPT-4o”、谷歌“雙子座2.0閃存版”相當。
“貝米”優異性能得益于研究團隊研發的“數學公式識別視覺提示法(EVPM)”技術。該技術通過爲“貝米”標注複雜排列公式的虛擬方框,使其在學習過程中不遺漏解題順序。研究團隊將“貝米”作爲開源系統發布,供學校及補習班等教育機構免費使用。金泰煥教授表示:“手寫數學答案評分是教育科技人工智能領域的難題之壹。‘貝米’在穩定性與效率方面已達到適用于實際教育現場的水平,這具有重要意義。”
崔智媛記者 jwchoi@donga.com






