一种答案抽取模型的训练方法及装置制造方法及图纸

技术编号：32430104 阅读：28 留言：0更新日期：2022-02-24 18:40

本申请提供一种答案抽取模型的训练方法及装置，其中所述答案抽取模型的训练方法包括：从原始语料中确定样本文本，并在预先构建的问题集中筛选与所述样本文本相关联的至少一个待查询问题以及对应的答案标签；将任意一个所述待查询问题与所述样本文本输入预训练的答案抽取模型，确定所述待查询问题的答案抽取结果；基于所述答案抽取结果以及所述答案标签生成所述答案抽取模型的目标损失值，并基于所述目标损失值对所述答案抽取模型进行优化，获得目标答案抽取模型。获得目标答案抽取模型。获得目标答案抽取模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种答案抽取模型的训练方法及装置

[0001]本申请涉及计算机
，特别涉及一种答案抽取模型的训练方法及装置、计算设备和计算机可读存储介质。

技术介绍

[0002]随着互联网的高速发展，越来越多的信息以电子文本的形式呈现给用户。为了帮助用户在海量信息中快速找到所需要的信息，提出了信息抽取的概念。信息抽取是指从自然语言文本中抽取事实信息，并且以结构化的形式描述信息；而机器阅读理解是致力于教会机器阅读人类的语言并理解其内涵的研究，机器阅读理解任务更注重于对于篇章文本的理解，机器必须自己从篇章中学习到相关信息，而不是利用预设好的世界知识、常识来回答问题。
[0003]目前，训练机器去阅读理解人类语言的方法，重要的一种实现方式就是通过建立机器阅读理解模型，进一步通过对建立的机器阅读理解模型进行训练来获得想要的机器阅读理解模型，从而在训练获得的机器阅读理解模型的基础上在文本片段中找出问题的答案。但目前的机器阅读理解模型训练过程中，针对中文答案抽取任务，无法生成与某些论元类型匹配的查询问题；另外，模型训练过程中考虑的损失不够...

【技术保护点】

【技术特征摘要】
1.一种答案抽取模型的训练方法，其特征在于，包括：从原始语料中确定样本文本，并在预先构建的问题集中筛选与所述样本文本相关联的至少一个待查询问题以及对应的答案标签；将任意一个所述待查询问题与所述样本文本输入预训练的答案抽取模型，确定所述待查询问题的答案抽取结果；基于所述答案抽取结果以及所述答案标签生成所述答案抽取模型的目标损失值，并基于所述目标损失值对所述答案抽取模型进行优化，获得目标答案抽取模型。2.如权利要求1所述的答案抽取模型的训练方法，其特征在于，所述问题集通过以下方式进行构建：从所述原始语料中提取文本的事件类型标签以及答案类型标签；将所述事件类型标签与所述答案类型标签进行整合，生成问题标签；根据所述问题标签中包含的答案类型标签所属类别生成与所述问题标签匹配的查询问题，并基于所述查询问题构建问题集。3.如权利要求2所述的答案抽取模型的训练方法，其特征在于，所述根据所述问题标签中包含的答案类型标签所属类别生成与所述问题标签匹配的查询问题，包括：若所述问题标签中包含的答案类型标签为第一类别，则获取预定义的问题模板，并基于所述问题标签和所述问题模板构建与所述问题标签匹配的查询问题；若所述问题标签中包含的答案类型标签为第二类别，则对所述原始语料中与所述第二类别的答案类型标签相关的事件句进行统计分析，根据分析结果构建与所述问题标签匹配的查询问题。4.如权利要求1所述的答案抽取模型的训练方法，其特征在于，所述将任意一个所述待查询问题与所述样本文本输入预训练的答案抽取模型，确定所述待查询问题的答案抽取结果，包括：将任意一个所述待查询问题与所述样本文本作为输入集输入所述答案抽取模型，所述答案抽取模型的向量编码模块对所述输入集中每个词单元对应的字向量、文本向量以及位置向量加和，生成所述每个词单元对应的编码向量；基于所述编码向量计算所述每个词单元作为所述待查询问题对应的预测答案的起始位置以及结束位置的概率分布；根据所述起始位置以及结束位置的概率分布，确定所述待查询问题对应的答案抽取结果。5.如权利要求4所述的答案抽取模型的训练方法，其特征在于，所述根据所述起始位置以及结束位置的概率分布，确定所述待查询问题对应的答案抽取结果，包括：将所述起始位置的概率分布中概率最大的词单元在所述样本文本中的位置作为所述答案的起始位置；将所述结束位置的概率分布中概率最大的词单元在所述样本文本中的位置作为所述答案的结束位置；以及，将所述起始位置以及结束位置之间的词单元作为所述答案抽取结果。6....

【专利技术属性】
技术研发人员：孙雪，李长亮，
申请(专利权)人：北京金山数字娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人