非结构化文本的机器理解制造技术

技术编号:39567680 阅读:27 留言:0更新日期:2023-12-03 19:18
本文所描述的是用于提供自然语言理解系统的系统和方法,该自然语言理解系统采用两阶段过程以用于文本的机器理解

【技术实现步骤摘要】
非结构化文本的机器理解
[0001]相关申请
[0002]本申请是申请号为
201780031054.6、
专利技术名称为“非结构化文本的机器理解”的专利技术专利申请的分案申请


技术介绍

[0003]由机器在近人类层面理解自然语言是针对人工智能的主要目标

实际上,大多数人类知识都是以文本的自然语言来收集的

因此,对非结构化

真实世界文本的机器理解已经得到来自科学家

工程师和学者的极大关注

这至少部分是由于许多自然语言处理任务
(
诸如信息提取

关系提取

文本摘要或机器翻译
)
隐式地或显式地取决于机器利用自然语言理解和推理的能力的事实


技术实现思路

[0004]本文所公开的实施例提供了一种采用级联的第一和第二处理电路装置的自然语言理解系统

第一处理电路装置分析文本并指示可能回答问题的一个或多个实体
。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种方法,包括:接收与文本有关的完形填空式问题;由第一处理电路装置处理所述文本以及所述完形填空式问题,以产生所述完形填空式问题的候选答案集合,其中所述候选答案集合中的每个候选答案被包括在所述文本中;以及由第二处理电路装置处理所述文本和假设集合以确定预测的答案,其中处理的操作包括:通过将每个候选答案插入到所述完形填空式问题中来形成假设,其中每个假设被包括在所述假设集合中;确定所述文本与每个假设之间的相似性;以及输出所述假设中具有最高相似性的所述候选答案作为所述完形填空式问题的预测的答案
。2.
根据权利要求1所述的方法,其中由所述第一处理电路装置处理所述文本和所述问题以产生所述问题的候选答案集合的操作包括:基于对所述完形填空式问题和所述文本的审阅,确定一个或多个可能的答案;确定针对每个可能的答案的第一概率;以及基于与每个可能的答案相关联的所述第一概率,过滤所述一个或多个可能的答案以产生所述候选答案集合
。3.
根据权利要求2所述的方法,其中确定所述文本与每个假设之间的相似性的操作包括:将所述文本定义成句子的序列;将所述假设与句子的所述序列中的每个句子进行比较;测量所述假设与句子的所述序列之间的文本蕴涵;确定所述假设中的所述候选答案是所述完形填空式问题的所述预测的答案的第二概率;以及将所述第一概率与所述第二概率组合,以产生与所述候选答案相关联的分数
。4.
根据权利要求3所述的方法,其中输出具有所述最高相似性的所述假设作为所述预测的答案的操作包括:基于与每个候选答案相关联的所述分数,重新排序所述候选答案集合中的候选答案;以及选择具有最高分数的所述假设作为所述预测的答案
。5.
根据权利要求4所述的方法,其中选择具有所述最高分数的所述假设作为预测的答案的操作使所述预测的答案通过网络被传输到客户端计算设备
。6.
根据权利要求5所述的方法,其中所述预测的答案的接收使所述客户端计算设备将所述预测的答案呈现在显示器上,所述显示器被包括在所述客户端计算设备中,或者所述显示器被连接到所述客户端计算设备
。7.
根据权利要求5所述的方法,其中所述预测的答案的接收使所述客户端计算设备将所述预测的答案呈现给扬声器,所述扬声器被包括在所述客户端计算设备中,或者所述扬声器被连接到所述客户端计算设备

8.
根据权利要求1所述的方法,其中所述第一处理电路装置包括一对具有门控递归单元的双向递归神经网络
。9.
根据权利要求1所述的方法,其中所述第二处理电路装置包括一对卷积网络,所述一对卷积网络被连接到具有门控递归单元的递归神经网络
。10.
根据权利要求1所述的方法,还包括:在接收所述完形填空式问题之前,将问题转变为完形填空式问题
。11.
一种方法,包括:基于对问题和相关联的文本的粗略审阅来确定问题的可能的答案的集合;确定每个可能的答案正确的第一概率;基于与每个可能的答案相关联的所述第一概率,确定候选答案集合;针对所述候选答案集合中的每个候选答案形成假设,其中所述假设包括插入到所述问题中的该候选答案;针对每个假设,基于该假设与所述相关联的文本的语义比较来测量蕴涵;针对所述候选答案集合中的每个候选答案,基于所测量...

【专利技术属性】
技术研发人员:A
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1