当前位置: 首页 > 专利查询>中山大学专利>正文

基于词性标注信息的语义空间融合的阅读理解问答方法及系统技术方案

技术编号:41743005 阅读:31 留言:0更新日期:2024-06-19 13:03
本发明专利技术涉及机器阅读技术,为基于词性标注信息的语义空间融合的阅读理解问答方法及系统。其方法主要步骤包括:通过标注文档数据训练阅读理解模型;获得输入问题,对输入问题进行处理,得到问题文本Q;根据问题文本和文档数据库中的文档,通过多重语义筛选获得相关文档P;通过阅读理解模型抽取预选答案;在满足先决条件的前提下,将概率最高的预选答案作为最终输出答案。本发明专利技术利用分词词性标注器丰富问题文本的语义与词性信息,避免因问题表述不同而导致不一致的答案;多层知识融合层提高了模型在不同领域的泛用性,解决了在特定领域性能良好但在其他领域性能急剧下降的问题。

【技术实现步骤摘要】

本专利技术涉及机器阅读技术,具体为一种基于词性标注信息的语义空间融合的阅读理解问答方法及系统


技术介绍

1、机器阅读理解(mrc)任务作为自动问答(qa)的一个重要子任务,又分为抽取式、生成式、选择题、完型填空和会话等五个类别。虽然深度学习模型在抽取式阅读理解任务中能不断提高最佳性能,但在鲁棒性方面依然存在较大的缺陷,当模型面临不同分布或干扰性强的数据时,模型性能会受到严重影响。

2、为了解决深度学习模型在抽取式mrc上存在的鲁棒性问题,如模型通常对输入问题存在过敏感的问题,不同的问法模型对同样意思的问题可能会提供与正确答案不一致的回答。此外,虽然模型可以在一个领域范围内的数据集上训练得很好,但如果将模型迁移到另外一个领域则性能就会急剧下降,存在泛用性不足的问题。

3、因此,现有算法模型存在以上过敏感性和缺乏泛用性等的问题,有待解决。


技术实现思路

1、为了解决现有技术所存在的问题,本专利技术提供了一种基于词性标注信息的语义空间融合的阅读理解问答方法及系统,基于输入问题的文本词性标注本文档来自技高网...

【技术保护点】

1.一种基于词性标注信息的语义空间融合的阅读理解问答方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的阅读理解问答方法,其特征在于,所述通过标注文档数据训练阅读理解模型,包括以下步骤:

3.根据权利要求1所述的阅读理解问答方法,其特征在于,对输入问题进行处理,包括去除输入问题中的特殊符号以及空格。

4.根据权利要求1所述的阅读理解问答方法,其特征在于,所述通过多重语义筛选获得相关文档P,包括以下步骤:

5.根据权利要求1所述的阅读理解问答方法,其特征在于,所述将概率最高的预选答案作为最终输出答案,包括以下步骤:</p>

6.根据...

【技术特征摘要】

1.一种基于词性标注信息的语义空间融合的阅读理解问答方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的阅读理解问答方法,其特征在于,所述通过标注文档数据训练阅读理解模型,包括以下步骤:

3.根据权利要求1所述的阅读理解问答方法,其特征在于,对输入问题进行处理,包括去除输入问题中的特殊符号以及空格。

4.根据权利要求1所述的阅读理解问答方法,其特征在于,所述通过多重语义筛选获得相关文档p,包括以下步骤:

5.根据权利要求1所述的阅读理解问答方法,其特征在于,所述将概率最高的预选答案作为最终输出答案,包括...

【专利技术属性】
技术研发人员:刘帆戴宪华
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1