阅读理解方法及装置制造方法及图纸

技术编号：22055708 阅读：31 留言：0更新日期：2019-09-07 15:24

本发明专利技术提出一种阅读理解方法及装置，其中，该方法包括：通过获取预设的目标问题和待阅读的文本；根据预设的阅读理解模型对所述待阅读的文本进行理解分析，生成所述目标问题的答案类型概率、答案文本以及对应的置信度；根据所述答案类型概率、所述答案文本以及对应的置信度确定与所述目标问题对应的目标答案。从而基于预设的阅读理解模型对目标问题和待阅读文本很好地理解出高质量的长答案文本或短答案文本，都不同的实际情形均能表现良好，不再局限于现有的专用模型只对一种答案类型的答案的理解效果好，且相比现有的通用模型提高了对不同答案类型的答案的理解效果。

Reading Comprehension Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
阅读理解方法及装置
本专利技术涉及人工智能领域，尤其涉及一种阅读理解方法及装置。
技术介绍
人工智能(ArtificialIntelligence，AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理、问答系统和专家系统等。目前，将待回答的问题和相关的阅读材料输入到训练完毕的阅读理解模型进行人工智能式阅读理解已经越来越广泛。现有的阅读理解模型分主要有专用模型和通用模型：专用模型是采用同一答案类型的阅读材料训练得到的，但专用模型的局限性在于只能对一种答案类型的理解效果比较好。例如采用海量的长答案类型的样本得到的长答案模型，采用海量的短答案类型的样本训练得到的短答案模型，由于长答案模型和短答案模型有着不同的模型参数和训练数据，长答案模型对长答案的理解效果比较好，而对短答案的理解效果不好，短答案模型只能对短答案的理解效果比较好，而对长答案的理解效果不好。通用模型尽...

【技术保护点】
1.一种阅读理解方法，其特征在于，包括：获取预设的目标问题和待阅读的文本；根据预设的阅读理解模型对所述待阅读的文本进行理解分析，生成所述目标问题的答案类型概率、答案文本以及对应的置信度；根据所述答案类型概率、所述答案文本以及对应的置信度确定与所述目标问题对应的目标答案。

【技术特征摘要】
1.一种阅读理解方法，其特征在于，包括：获取预设的目标问题和待阅读的文本；根据预设的阅读理解模型对所述待阅读的文本进行理解分析，生成所述目标问题的答案类型概率、答案文本以及对应的置信度；根据所述答案类型概率、所述答案文本以及对应的置信度确定与所述目标问题对应的目标答案。2.根据权利要求1所述的方法，其特征在于，所述根据所述答案文本类型概率、所述答案文本以及对应的置信度确定与所述目标问题对应的目标答案包括：获取长答案类型概率和长答案文本的置信度的第一乘积、短答案类型概率和短答案文本的置信度的第二乘积；判断所述第一乘积是否大于所述第二乘积；若是，则将所述长答案文本确定为与所述目标问题对应的目标答案；若否，则将所述短答案文本确定为与所述目标问题对应的目标答案。3.根据权利要求1所述的方法，其特征在于，在所述获取预设的目标问题和待阅读的文本之前，还包括：获取第一样本集，其中，所述第一样本集中的第一样本包括训练问题和阅读材料样本、长答案类型的正确答案在阅读材料样本中的开始位置和结束位置、用于表征所述第一样本的答案类型为长答案的标注数据；获取第二样本集，其中，所述第二样本集中的第二样本包括训练问题和阅读材料样本、短答案类型的正确答案在阅读材料样本中的开始位置和结束位置、用于表征所述第二样本的答案类型为短答案的标注数据；基于所述第一样本集和所述第二样本集训练初始的阅读理解模型，得到所述预设的阅读理解模型。4.根据权利要求3所述的方法，其特征在于，所述初始的阅读理解模型至少包括编码器、第一预测层、第二预测层、分类器，所述基于所述第一样本集和所述第二样本集训练初始的阅读理解模型，得到所述预设的阅读理解模型包括：将所述第一样本集中的所述第一样本和所述述第二样本集中的所述第二样本分别输入到所述编码器中进行编码；采用各个编码后的所述第一样本训练所述第一预测层，并采用各个编码后的所述第二样本集训练所述第二预测层、以及采用各个编码后的所述第一样本集和各个编码后的所述第二样本集训练所述分类器，以得到所述预设的阅读理解模型；其中，训练完毕的第一预测层能够预测需要回答的问题对应的长答案文本及其置信度，训练完毕的第二预测层能够预测需要回答的问题对应的短答案文本及其置信度，训练完毕的分类器能够判别需要回答的问题对应的答案类型概率。5.根据权利要求1至4任一项所述的方法，其特征在于，在所述获取预设的目标问题和待阅读的文本之后，还包括：对所述目标问题和所述待阅读的文本进行拼接，其中，在拼接过程中，在所述目标问题的前面添加表征问题的分隔符，在所述待阅读的文本的段落的前面添加表征段落的分隔符。6.一种阅读理解装置，其特征在于，包括：获取模块，用于获取预设的目标问题和待阅读的文本；生成模块，用于根据预设的阅读理解模型对所述...

【专利技术属性】
技术研发人员：李弘宇，刘璟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人