机器阅读理解方法及其装置、电子设备及存储介质制造方法及图纸

技术编号：37994566 阅读：16 留言：0更新日期：2023-06-30 10:08

本发明专利技术公开了一种机器阅读理解方法及其装置、电子设备及存储介质，涉及人工智能领域，其中，该机器阅读理解方法包括：对接收到的预设问题文本和预设段落文本进行处理，得到输入序列，将输入序列输入至预训练模型，输出向量特征集合，对向量特征集合中每两个相邻的向量特征进行整合，得到目标向量特征集合，基于目标向量特征集合，从预设段落文本中确定与预设问题文本匹配的答案文本。本发明专利技术解决了相关技术中无法整合相邻字符之间的语义相关性，导致机器阅读理解准确性较低的技术问题。机器阅读理解准确性较低的技术问题。机器阅读理解准确性较低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
机器阅读理解方法及其装置、电子设备及存储介质

[0001]本专利技术涉及人工智能领域，具体而言，涉及一种机器阅读理解方法及其装置、电子设备及存储介质。

技术介绍

[0002]机器阅读理解是自然语言处理(NLP)中一项具有挑战性的任务，在智能问答、信息检索等领域有很好的应用前景。机器阅读理解旨在让机器学会根据相关文本内容自动回答相关问题，是自然语言理解(NLU)和强人工智能的重要基础。当前，根据答案的类型，可以将机器阅读理解任务分成完形填空、多项选择、区间提取和自由回答四种类型。由于存在比完形填空和多项选择模式更加贴合现实应用场景、比自由回答类型更容易评价的特性，区间提取式(Span Extraction)机器阅读理解已经成为最受欢迎的选择。给定段落和相关问题，机器需要提取段落中一段连续的文本区间作为答案。不局限于单词或实体，根据特定情况，答案可以是一个很长的句子。
[0003]预训练语言模型，如BERT等，可以有效利用非标注数据进行模型训练，从而学习丰富的词向量表示。对于下游任务而言，不再需要从零开始训练一个模型，从...

【技术保护点】

【技术特征摘要】
1.一种机器阅读理解方法，其特征在于，包括：对接收到的预设问题文本和预设段落文本进行处理，得到输入序列，其中，所述输入序列包括：多个字符；将所述输入序列输入至预训练模型，输出向量特征集合，其中，所述向量特征集合包括多个向量特征，每个所述向量特征对应一个所述字符；对所述向量特征集合中每两个相邻的所述向量特征进行整合，得到目标向量特征集合；基于所述目标向量特征集合，从所述预设段落文本中确定与所述预设问题文本匹配的答案文本，其中，所述答案文本是所述预设段落文本中一段连续的文本。2.根据权利要求1所述的机器阅读理解方法，其特征在于，对接收到的预设问题文本和预设段落文本进行处理，得到输入序列的步骤，包括：确定第一符号、第二符号以及第三符号，其中，所述第一符号是所述输入序列的开始符号，所述第二符号用于区分所述预设问题文本以及所述预设段落文本，所述第三符号用于区分所述预设段落文本以及预设补充文本，所述预设补充文本是增加的空白文本；将所述预设问题文本划分为多个问题字符，并将所述预设段落文本划分为多个段落字符；基于所述第一符号、所述第二符号、所述第三符号、所述问题字符以及所述段落字符，构建所述输入序列。3.根据权利要求1所述的机器阅读理解方法，其特征在于，在得到输入序列之后，还包括：确定所述输入序列中每个所述字符的输入结构，其中，所述输入结构包括：字符语义编码、字符类型编码、位置编码；确定预设特征提取器的编码层数以及所述向量特征的向量长度。4.根据权利要求3所述的机器阅读理解方法，其特征在于，将所述输入序列输入至预训练模型，输出向量特征集合的步骤，包括：将所述输入序列中每个所述字符的结构转换为所述输入结构；将转换后的所述输入序列输入至所述预训练模型；基于所述预训练模型，采用所述预设特征提取器对所述输入序列进行连续所述编码层数的编码，得到所述向量特征集合，其中，所述向量特征集合中每个所述向量特征的长度为所述向量长度。5.根据权利要求1所述的机器阅读理解方法，其特征在于，对所述向量特征集合中每两个相邻的所述向量特征进行整合，得到目标向量特征集合的步骤，包括：对所述向量特征进行升维操作，得到升维向量特征；基于第一预设卷积核、第一预设步长以及第一预设补充类型，对每两个相邻的所述升维向量特征进行卷积，得到新增向量特征；基于第二预设卷积核、第二预设步长以及第二预设补充类型，确定所述新增向量特征的向量权重；基于所述升维向量特征、所述向量权重与所...

【专利技术属性】
技术研发人员：唐伟佳，
申请(专利权)人：工银科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人