
研究人员开发出一款能如人类般对字迹潦草的数学答案进行评分并予以批改的人工智能(AI)“教师”。
蔚山科学技术院(UNIST)17日宣布,该院人工智能研究生院教授金泰焕与浦项科技大学计算机工程系教授高成安团队,成功开发出可对手写复杂数学答案进行评分的人工智能模型“贝米(VEHME)”。
主观题数学答案因笔迹与答案布局各异,且混合数学公式、图表、图形等非结构化数据,人工智能难以准确识别并评分。而“贝米”能精准识别公式位置与上下文,恰似人类跟随解题思路进行判断。研究团队使用“贝米”对从小学算术至微积分等不同难度数学解题过程进行评分测试,结果显示其准确度与OpenAI研究中心“GPT-4o”、谷歌“双子座2.0闪存版”相当。
“贝米”优异性能得益于研究团队研发的“数学公式识别视觉提示法(EVPM)”技术。该技术通过为“贝米”标注复杂排列公式的虚拟方框,使其在学习过程中不遗漏解题顺序。研究团队将“贝米”作为开源系统发布,供学校及补习班等教育机构免费使用。金泰焕教授表示:“手写数学答案评分是教育科技人工智能领域的难题之一。‘贝米’在稳定性与效率方面已达到适用于实际教育现场的水平,这具有重要意义。”
崔智媛记者 jwchoi@donga.com






