长度损失确定方法以及装置制造方法及图纸

技术编号：32971029 阅读：17 留言：0更新日期：2022-04-09 11:37

本申请提供长度损失确定方法以及装置，其中，所述长度损失确定方法包括：确定预测答案在样本文章中的预测起始位置和预测结尾位置；计算所述预测起始位置到所述预测结尾位置的字节长度，作为所述预测答案的字节长度；确定所述预测答案的字节长度与目标答案的字节长度的字节长度差值，作为所述预测答案的长度损失。本申请提供的长度损失确定方法，不仅提高了长度损失的准确度，还充分反映预测出答案的损失，有利于提高阅读理解模型的训练效率，使训练获得的阅读理解模型的预测准确率更高。训练获得的阅读理解模型的预测准确率更高。训练获得的阅读理解模型的预测准确率更高。

全部详细技术资料下载

【技术实现步骤摘要】
长度损失确定方法以及装置

[0001]本申请涉及自然语言处理
，特别涉及一种长度损失确定方法。本申请同时涉及一种长度损失确定装置，一种计算设备，以及一种计算机可读存储介质。

技术介绍

[0002]自然语言处理是研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法，而随着自然语言处理的飞速发展，作为自然语言处理领域中一个热门方向的机器阅读理解也受到了广泛关注，机器阅读理解是致力于教会机器阅读人类的语言并理解其内涵的研究，机器阅读理解任务更注重于对于篇章文本的理解，机器必须自己从篇章中学习到相关信息，而不是利用预设好的世界知识、常识来回答问题，所以更具有挑战性。
[0003]目前，训练机器去阅读理解人类语言的方法，重要的一种实现方式就是通过建立机器阅读理解模型，进一步通过对建立的机器阅读理解模型进行训练来获得想要的机器阅读理解模型，从而在训练获得的机器阅读理解模型的基础上在文本片段中找出问题的答案。但目前的机器阅读理解模型训练过程中考虑的损失不够精确，无法充分反映预测出答案的损失，最终预测出答案的准确率较低。

技术实现思路

[0004]有鉴于此，本申请实施例提供了一种长度损失确定方法和一种阅读理解模型训练方法，以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种长度损失确定装置，一种阅读理解模型训练装置，一种计算设备，以及一种计算机可读存储介质。
[0005]本申请提供一种阅读理解模型训练方法，包括：
[0006]获取包含样本问题及其在样本文章中对应目标答案的训...

【技术保护点】

【技术特征摘要】
1.一种长度损失确定方法，其特征在于，包括：确定预测答案在样本文章中的预测起始位置和预测结尾位置；计算所述预测起始位置到所述预测结尾位置的字节长度，作为所述预测答案的字节长度；确定所述预测答案的字节长度与目标答案的字节长度的字节长度差值，作为所述预测答案的长度损失。2.根据权利要求1所述的长度损失确定方法，其特征在于，所述确定预测答案在样本文章中的预测起始位置和预测结尾位置之前，还包括：确定所述预测答案在所述样本文章中预测起始位置的起始位置损失，以及所述预测答案在所述样本文章中预测结尾位置的结尾位置损失。3.根据权利要求2所述的长度损失确定方法，其特征在于，所述确定所述预测答案的字节长度与所述目标答案的字节长度的字节长度差值，作为所述预测答案的长度损失之后，还包括：基于所述起始位置损失、所述结尾位置损失和所述长度损失，确定所述预测答案的准确度损失。4.根据权利要求2所述的长度损失确定方法，其特征在于，所述确定所述预测答案在所述样本文章中预测起始位置的起始位置损失，以及所述预测答案在所述样本文章中预测结尾位置的结尾位置损失之前，还包括：获取包含样本问题及其在样本文章中对应目标答案的训练样本；通过将所述训练样本输入阅读理解模型生成所述样本问题的预测答案。5.根据权利要求3所述的长度损失确定方法，其特征在于，所述基于所述起始位置损失、所述结尾位置损失和所述长度损失，确定所述预测答案的准确度损失之后，还包括：基于所述准确度损失确定损失函数，利用所述损失函数对阅读理解模型进行优化。6.根据权利要求4或5所述的长度损失确定方法，其特征在于，所述阅读理解模型为Attentive Reader、Attention Sum Reader、Stanford Attentive Reader和Gated Attention Reader中的任意一种。7.根据权利要求2所述的长度损失确定方法，其特征在于，所述确定所述预测答案在所述样本文章中预测起始位置的起始位置损失，以及所述预测答案在所述样本文章中预测结尾位置的结尾位置损失，包括：计算所述样本文章包含的字单元为所述预测答案的起始字的起始概率分布，以及所述字单元为所述预测答案的结尾字的结尾概率分布；基于所述起始概率分布和所述结尾概率分布确定所述预测答案在所述样本文章中的预测起始位置和预测结尾位置；基于所述起始概率分布中包含的所述预测起始位置对应的概率数值确定所述预测起始位置的起始位置损失，以及基于所述结尾概率分布中包含的所述预测结尾位置对应的概率数值确定所述预测结尾位置的结尾位置损失。8.根据权利要求7所述的长度损失确定方法，其特征在于，所述预测起始位置，包括：所述起始概率分布中包含的概率数值最大的字单元在所述样本文章中的位置；所述预测结尾位置，包括：所述结尾概率分布中包含的概率数值最大的字单元在所述
样本文章中的位置。9.根据权利要求8所述的长度损失确定方法，其特征在于，所述起始位置损失，包括：所述预测起始位置对应的概率数值与所述目标答案的起始位置...

【专利技术属性】
技术研发人员：李长亮，李小龙，唐剑波，徐智涛，
申请(专利权)人：成都金山互动娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人