【技术实现步骤摘要】
基于双解码器融合的数学应用题自动解答方法及系统
[0001]本专利技术属于自然语言处理领域,尤其涉及基于双解码器融合的数学应用题自动解答方法及系统
。
技术介绍
[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术
。
[0003]近年来,基于自然语言处理
(Natural Language Processing
,
NLP)
的问题求解
、
自动证明
、
类人答题等应用已经成为研究的热点
。
数学应用题的求解是评估机器阅读理解能力级别的一个重要场景,需要机器根据简短的文本描述生成问题的解表达式,此过程包含着复杂而密集的推理
。
在初等教育中,数学应用题是
K
‑
12
教研的重要内容,如果机器能够完美理解题目并用于辅导学生,这将对人工智能在教育领域的应用产生巨大影响,同时推动教育事业的发展
。
此外,教育辅助企业
(
如小猿搜题
、
题拍拍
、
答案喵等
)
的数据库中有很多用户上传或通过爬虫获取的数学应用题,许多题目存在答案缺失或错误的问题
。
目前,企业主要通过众筹人工的方式解答或核验题目,效率低且成本高,迫切需要一种自动解答数学应用题的方法
。
[0004]自动求解数学应用题问题
(Math Word Pro ...
【技术保护点】
【技术特征摘要】
1.
基于双解码器融合的数学应用题自动解答方法,其特征在于,包括:对待求解的问题文本进行预处理,并根据标点划分为多段短文本;利用语法依存分析,提取预处理后问题文本中的数字及与数字相关的属性词;引入数字实体嵌入,重构基于数学语料增强的预训练语言模型作为编码器,得到输入数据的问题表示和编码器最终隐藏层状态;基于编码器结构和参数,构建参数权重共享的序列到序列解码器,输入编码器最终隐藏层状态,推理生成中缀
、
后缀形式解表达式;基于序列到序列解码器结构和树解码器结构,构建二者融合的多形式表达式生成模型,结合预处理后的问题文本
、
数字和其相关属性词,学习生成多形式表达式并计算得到问题答案
。2.
如权利要求1所述的基于双解码器融合的数学应用题自动解答方法,其特征在于,所述预处理包括文本分词
、
数据纠错
、
数字替换
、
表达式清理和数据增强处理
。3.
如权利要求1所述的基于双解码器融合的数学应用题自动解答方法,其特征在于,所述数字实体嵌入包括数字位置嵌入和属性词位置嵌入
。4.
如权利要求1所述的基于双解码器融合的数学应用题自动解答方法,其特征在于,所述重构基于数学语料增强的预训练语言模型作为编码器,得到输入数据的问题表示和编码器最终隐藏层状态具体为:将预处理后的文本数据和提取的数字
、
属性词位置列表输入编码器,经由编码器处理输出问题表示和编码器最终隐藏层状态
。5.
如权利要求1所述的基于双解码器融合的数学应用题自动解答方法,其特征在于,所述融合的多形式表达式生成模型的具体步骤为:将数字和数字相关属性词转化为,其所在预处理后问题文本中位置的对应表示,进而转化为数字实体嵌入;叠加数字实体嵌入
、
文本的词嵌入和位置嵌入,作为问题嵌入输入编码器;编码器提取
、
解析问题嵌入中的语义信息,转化为隐表示并生成问题输出...
【专利技术属性】
技术研发人员:马坤,衣禹桥,纪科,陈贞翔,杨波,
申请(专利权)人:济南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。