【技术实现步骤摘要】
一种多视角融合的阅读理解选择题的答案选择方法
本专利技术涉及机器阅读理解领域,特别是涉及一种多视角融合的阅读理解选择题的答案选择方法。
技术介绍
随着大数据和人工智能技术的快速发展,答案选择技术广泛应用于各行各业,例如智能问答、搜索、推荐系统等。目前,自动问答技术研究大致分为以下几类:基于知识图谱的问答系统、基于机器阅读理解式的问答系统、答案选择式的问答系统。本案所研究的是最后一种:答案选择式的问答系统。不同于其他两种问答系统,答案选择式的问答系统中问题的对应答案一般较长,需要更加复杂的语义推理和综合回答。现有的技术关于答案选择式的问答系统存在以下缺点:(1)基于模板的方法通用性差,严重依赖人工编写模板和预定义的特征集;(2)基于神经网络的方法仅仅考虑到问题与候选答案之间的匹配信息。
技术实现思路
本专利技术主要解决的技术问题是提供一种多视角融合的阅读理解选择题的答案选择方法,通过采用多项选择式阅读理解技术来解决答案选择任务,相比传统的答案选择方法,本案提出的技术能够学习到段落文本与候选答案、问题与候选答案之间的多视角交互信息,进而能够准确地找到最佳答案,通过利用一种增强型的预训练语言模型来获取FACNmodel所需的上下文(段落文本),能够极大地区分问题对应的答案类型、通过利用多视角下的融合注意力机制和门控下的胶囊网络层应用于答案选择任务,可以极大提高任务的效果,利用门控下的胶囊网络层应用于答案选择任务,能够有效地捕获事实类问题还是非事实类问题的特性,进而不同方式处理,在 ...
【技术保护点】
1.一种多视角融合的阅读理解选择题的答案选择方法,其特征在于,包括以下步骤:。/n(1)获取上下文段落文本:/n(1.1)检索上下文段落文本:/n对于一个给定的初始问题Q,借助搜索引擎,检索出与问题相关的排名前10个的上下文段落文本;/n(1.2)获取候选答案集和段落文本:/n对于每个已检索出的上下文段落文本,利用增强型的预训练语言模型,分别计算候选答案集A与每个已检索出的上下文段落文本的相似度,由此得到10个相似度分数,降序输出相似度最高分数对应的段落文本,标记为P;/n(1.3)编为三元组信息:/n经过步骤(1.1)、步骤(1.2)的处理,可以获取到初始问题Q、段落文本P、候选答案集A,编为三元组(Q,P,A)信息,用于后续的模型训练;/n(2)FACN模型:/n(2.1)初始问题Q、段落文本P、候选答案集A编码表示:/n借助开源的自然语言处理工具分别对初始问题Q、段落文本P、候选答案集A进行处理,把他们(P,Q,A)对应的词性标注特征、实体识别特征和词向量拼接在一起,送入到双向长短记忆BiLSTM网络,分别得到段落文本、问题和候选答案的隐藏层表示,即为
【技术特征摘要】
1.一种多视角融合的阅读理解选择题的答案选择方法,其特征在于,包括以下步骤:。
(1)获取上下文段落文本:
(1.1)检索上下文段落文本:
对于一个给定的初始问题Q,借助搜索引擎,检索出与问题相关的排名前10个的上下文段落文本;
(1.2)获取候选答案集和段落文本:
对于每个已检索出的上下文段落文本,利用增强型的预训练语言模型,分别计算候选答案集A与每个已检索出的上下文段落文本的相似度,由此得到10个相似度分数,降序输出相似度最高分数对应的段落文本,标记为P;
(1.3)编为三元组信息:
经过步骤(1.1)、步骤(1.2)的处理,可以获取到初始问题Q、段落文本P、候选答案集A,编为三元组(Q,P,A)信息,用于后续的模型训练;
(2)FACN模型:
(2.1)初始问题Q、段落文本P、候选答案集A编码表示:
借助开源的自然语言处理工具分别对初始问题Q、段落文本P、候选答案集A进行处理,把他们(P,Q,A)对应的词性标注特征、实体识别特征和词向量拼接在一起,送入到双向长短记忆BiLSTM网络,分别得到段落文本、问题和候选答案的隐藏层表示,即为计算公式如下所示:
其中,h为隐藏层表示,e为词向量,p为词性标注特征,n为实体识别特征,t表示第t个词块,
对规整后,即为Hp,Hq,Ha;
(2.2)融合式的问题段落文本和候选答案注意力:
利用经典的attention机制来分别对齐问题段落文本和候选答案中重要的词语,分别得到对齐的上下文表示向量Attpa,Attap,计算公式如下:
其中,表示段落文本和候选答案对齐交互矩阵,Wpa表示训练权重参数,softmax和tanh表示神经网络的激活函数,
为了从不同视角获取问题段落文本和候选答案交互信息,利用highwaynetwork来融合隐藏层表示和上下文表示向量,计算公式如下:
fp=relu(Wf[Hp;Attpa;Hp-Attpa;Hp⊙Attpa])
gp=σ(Wg[Hp;Attpa;Hp-Attpa;Hp⊙Attpa])
Op=gp⊙fp+(1-gp)⊙Hp
其中,Op表示多视角的段落文本融合向量fp和段落文本隐藏层表示向量Hp的门控输出,Wf,Wg表示训练权重参数,relu和σ表示神经网络的激活函数,⊙,-分别表示元素级的乘法和减法运算,
类似地,能够得到多视角融合下的段落文本下候选答案的门控输出向量Opa,
同样地,利用以上的计算方法获取问题和候选答案对齐交互矩阵上下文对齐向量Attqa,Attaq,多视角融合下的问题下候选答案问题下的门控输出向量Oqa,问题感知的门控输出向量Oq,
为了充分利用之前的网络层输出,接着利用BiLSTM来编码历史网络层输出,分别得到关于段落文本、问题以及候选答案的上下文感知的隐层向量Fp,Fq,Fa。计算公式如下:
Fp=BiLSTM(Wfp[Op;Hp])
Fq=BiLSTM(Wf...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。