基于变分知识蒸馏的算术文字题自动解答方法及系统技术方案

技术编号:40339985 阅读:26 留言:0更新日期:2024-02-09 14:28
本发明专利技术公开基于变分知识蒸馏的算术文字题自动解答方法及系统,包括:构建知识蒸馏模型;所述知识蒸馏模型包括:教师模型和学生模型;对所述教师模型进行训练;基于预设的自适应知识蒸馏策略,所述学生模型从训练后的教师模型中转移预设知识来学习多样性方程;基于学习后的所述学生模型,生成多样化解答方程。本发明专利技术以选择性地转移教师模型的高质量知识,从而更好地指导学生模型的学习,以及使学生模型能够学习解方程的多样性分布。

【技术实现步骤摘要】

本专利技术属于自然语言处理,尤其涉及基于变分知识蒸馏的算术文字题自动解答方法及系统


技术介绍

1、数学推理能力一直被认为是计算机面临的基本挑战。数学单词问题(mathwordproblem,mwp)求解旨在根据自然语言描述的数学问题生成解方程。解决mwp问题需要自然语言理解能力和数学推理能力。处理和智能教育领域都给予了高度关注。

2、为了解决mwp解算任务,研究人员开发了各种方法,包括统计机器学习方法、语义解析方法和深度学习方法。传统的统计机器学习方法和语义解析方法需要人工收获特征工程或模板设计,很难应用于大型数据集。最近,深度学习模型作为一种有前途的mwp解决范例出现了。得益于序列到序列(seq2seq)模型在nlp领域的巨大成功,研究人员引入了seq2seq模型来解决mwp任务。seq2seq模型使用编码器-解码器框架将输入的问题描述转化为数学方程。然而,这些seq2seq模型忽略了方程的结构信息,可能会生成无法计算的无效方程。为了更好地利用方程结构信息,一些研究通过采用基于树的解码器来改进seq2seq模型。

3、虽然这些现本文档来自技高网...

【技术保护点】

1.基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,包括:

2.根据权利要求1所述的基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,所述教师模型采用编码器-解码器的模型结构;

3.根据权利要求1所述的基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,所述学生模型采用编码器-解码器的模型结构;其中,所述编码器-解码器的模型结构中引入了条件变异自动编码器;

4.根据权利要求1所述的基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,所述预设的自适应知识蒸馏策略包括:自适应硬知识提炼和自适应软知识提炼;

5.根据权利要求4所述的...

【技术特征摘要】

1.基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,包括:

2.根据权利要求1所述的基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,所述教师模型采用编码器-解码器的模型结构;

3.根据权利要求1所述的基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,所述学生模型采用编码器-解码器的模型结构;其中,所述编码器-解码器的模型结构中引入了条件变异自动编码器;

4.根据权利要求1所述的基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,所述预设的自适应知识蒸馏策略包括:自适应硬知识提炼和自适应软知识提炼;

5.根据权利要求4所述的基于变分知识蒸馏的算术文字题自动解答方法,其特征在于,

6.根据权利要求4所述的基于变分知识蒸馏的算术文字题...

【专利技术属性】
技术研发人员:周光有张怡谢志文
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1