【技术实现步骤摘要】
一种数据型问答系统
本专利技术涉及问答模型
,具体为一种数据型问答系统。
技术介绍
在现有的技术中对一个问题检索出若干文档之后,会使用阅读理解模型根据该问题对这些文档里面的全部句子一一计算,获取问题可能对应的答案。阅读理解模型是对给定问题和文档预测出答案在文档中的起始位置和结束位置,起始位置和结束位置之间字符串为答案。将整个文档放到阅读理解模型进行计算获取答案需要的计算量比较大,当文档比较长的时候,很难实现放回结果;而且,将文档全部放入到阅读理解模型会有较大的噪声,导致预测出来的结构不太正确。解决方案是将数据库里面全部文档中的句子通过预训练语言模型先编码成一个向量。当用户提出一个新的问题,先通过预训练语言模型编码为一个向量,然后计算问题的句向量和文档中各个句子句向量的距离来判断是否包含答案的一个度量。将得分比较高的句子集中在一起,输入到阅读理解模型,最后预测答案的范围。现有技术方案中方案内技术量较大,并且计算中并不能通过阅读理解模型判定文档中对应内容的是否为该答案的支撑事实。r>
技术实现思路
...
【技术保护点】
1.一种数据型问答系统,问答系统主要技术理论方法为流水线方法,在流水线QA系统,需要选择一个段落并将其传递给段落级问答模型,其包含了获取原始问题、得到待选回答组、计算参考回答与待选回答组中各个待回答的相似度,输出最大相识度对应的待选回答,其特征在于:所述数据型问答系统包含了:/n输出问题答案基于多个支持文档;/n待选回答组对应支持文档;/n对比输出问题支持文档和待选回答组对应支撑文档;/n计算输出问题支持文档和待选回答组对应支撑文档的相识度,输出最大相识度对应的待选回答。/n
【技术特征摘要】
1.一种数据型问答系统,问答系统主要技术理论方法为流水线方法,在流水线QA系统,需要选择一个段落并将其传递给段落级问答模型,其包含了获取原始问题、得到待选回答组、计算参考回答与待选回答组中各个待回答的相似度,输出最大相识度对应的待选回答,其特征在于:所述数据型问答系统包含了:
输出问题答案基于多个支持文档;
待选回答组对应支持文档;
对比输出问题支持文档和待选回答组对应支撑文档;
计算输出问题支持文档和待选回答组对应支撑文档的相识度,输出最大相识度对应的待选回答。
2.根据权利要求1所述数据型问答系统,其特征在于:段落级问答模型其核心部分主要为
A.Embedding:使用预训练的词向量嵌入单词,并通过使用学习的嵌入矩阵嵌入字符,然后应用卷积神经网络和最大池,将这些与字符派生的词嵌入相结合;
B.Pre-Process:这里使用了共享的双向GRU(Bi-GRU)来处理问题与文章的嵌入;
C.Attention:通过使用双向注意流(Bi-DirectionalAttentionFlow,BiDAF)的Attention机制来构建语言的上下文表示;
i,j:答案范围内的单词和问题里的单词;
hi,qj:段落单词i的词向量和问题单词j的词向量;
nq,nc:问题的长度和答案范围的上下文长度;
w1、w2和w3:学习向量,是元素乘法;
ci:为每个上下文标签(开始/结束)计算的参与向量;
qc:上下文查询向量;
每个标签的最终向量是通过连接得到的,并通过一个带有ReLU激活的线性层传递结果;
D.Self-Attention:输入通过另一个双向GRU(Bi-GRU),应用相同的Attention机制,不过这里没有qc了,而是设置;
E.Prediction:在模型的最后一层,应用了双向GRU,然后通过线性层计算出每个开始标记的答案分数,
将隐藏状态与输入相结合,再通过另一个双向GRU和线性层计算出每个结束标记的答案分数,这里应用到了softmax函数,来计算...
【专利技术属性】
技术研发人员:莫迪,
申请(专利权)人:中科能效北京科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。