基于卷积循环神经网络的答案选择方法、装置和电子设备制造方法及图纸

技术编号:19778486 阅读:31 留言:0更新日期:2018-12-15 11:22
本申请涉及基于卷积循环神经网络的答案选择方法,装置和电子设备。所述方法包括:获取问题数据以及包括标题数据和摘要数据的答案数据;通过双向长短期记忆层处理获得问题隐状态序列、标题隐状态序列和摘要隐状态序列;以卷积神经网络分别获得问题特征表示、标题特征表示和摘要特征表示;对问题特征表示进行池化操作以获得问题最终表示,且对标题特征表示和摘要特征表示进行拼接池化操作以获得答案最终表示;以及计算问题最终表示和答案最终表示之间的相似度以获得相关性分数。这样,可以通过双向长短期记忆网络挖掘深层语义信息,并通过卷积神经网络提取向量中的特定特征以确定问题数据和答案数据之间的相关性,从而提升答案选择的准确性。

【技术实现步骤摘要】
基于卷积循环神经网络的答案选择方法、装置和电子设备
本专利技术总体地涉及数据处理领域,且更为具体地,涉及一种基于卷积循环神经网络的答案选择方法、装置和电子设备。
技术介绍
随着人工智能领域关键技术的快速发展,人工智能助手应用逐渐成熟,各大科技公司相继发布了自己的家用人工智能产品。受益于语音识别和自然语言处理领域的新技术,用户可以通过语音的方式更自然地与这类产品进行交互。在这种交互场景中,一个很重要的部分就是由人工智能产品回答人类用户以自然语言提出的问题。因此,在这种真实的开放领域问答应用场景下,需要能够自动发现真实世界的海量知识,以获得与问题对应的答案。此外,随着互联网技术的发展,越来越多的人选择在网上搜索问题,并获取与问题相关的答案。常见地,网民可以通过社区问答系统(Community-basedQuestionAnswering),例如百度知道,知乎、StackOverflow等,检索自己想了解的问题,并获取与问题相关的满意答案。但是,通常当基于问题进行搜索时,会获得与问题对应的大量答案,因此,因此,需要改进的答案选择方案。
技术实现思路
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于卷积循环神经网络的答案选择方法、装置和电子设备,其通过双向长短期记忆网络挖掘深层语义信息,并通过卷积神经网络提取向量中的特定特征以确定问题数据和答案数据之间的相关性,从而提升答案选择的准确性。根据本申请的一方面,提供了一种基于卷积循环神经网络的答案选择方法,包括:获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;通过双向长短期记忆层分别处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;以卷积神经网络分别从所述问题隐状态序列、标题隐状态序列和摘要隐状态序列获得问题特征表示、标题特征表示和摘要特征表示;对所述问题特征表示进行池化操作以获得问题最终表示,且对所述标题特征表示和所述摘要特征表示进行拼接池化操作以获得答案最终表示;以及,计算所述问题最终表示和所述答案最终表示之间的相似度以获得所述答案数据相对于所述问题数据的相关性分数。在上述基于卷积循环神经网络的答案选择方法中,进一步包括:基于与所述问题数据对应的多条答案数据的多个分数对所述多条答案数据进行排序。在上述基于卷积循环神经网络的答案选择方法中,所述多条答案数据是通过多个搜索引擎获得的所述问题数据的多条候选答案数据。在上述基于卷积循环神经网络的答案选择方法中,获取问题数据和与所述问题数据对应的答案数据包括:对所述多条候选答案数据中的每条候选答案数据进行文本分词和去除停用词。在上述基于卷积循环神经网络的答案选择方法中,以卷积神经网络分别从所述问题隐状态序列、标题隐状态序列和摘要隐状态序列获得问题特征表示、标题特征表示和摘要特征表示包括:以卷积神经网络直接从所述问题隐状态序列获得所述问题特征表示;将所述问题特征表示在序列长度上进行平均以获得更新向量;以所述更新向量对于所述标题隐状态序列和所述摘要隐状态序列分别进行词级别注意力的更新以获得更新后的标题隐状态序列和摘要隐状态序列;以及,以卷积神经网络分别从所述更新后的标题隐状态序列和摘要隐状态序列获得所述标题特征表示和所述摘要特征表示。在上述基于卷积循环神经网络的答案选择方法中,对所述问题特征表示进行池化操作以获得问题最终表示,且对所述标题特征表示和所述摘要特征表示进行拼接池化操作以获得答案最终表示包括:对所述问题特征表示进行最大值池化操作以获得问题最终表示;对所述标题特征表示和所述摘要特征表示进行向量拼接;以及,对拼接后的所述标题特征表示和摘要特征表示进行最大值池化操作以获得答案最终表示。在上述基于卷积循环神经网络的答案选择方法中,计算所述问题最终表示和所述答案最终表示之间的相似度以获得所述答案数据相对于所述问题数据的相关性分数包括:计算所述问题最终表示和所述答案最终表示之间的向量的余弦相似度以获得所述答案数据相对于所述问题数据的相关性分数。根据本申请的另一方面,提供了一种基于卷积循环神经网络的答案选择装置,包括:数据获取单元,用于获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;循环网络单元,用于通过双向长短期记忆层处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;卷积网络单元,用于以卷积神经网络分别从所述问题隐状态序列、标题隐状态序列和摘要隐状态序列获得问题特征表示、标题特征表示和摘要特征表示;池化操作单元,用于对所述问题特征表示进行池化操作以获得问题最终表示,且对所述标题特征表示和所述摘要特征表示进行拼接池化操作以获得答案最终表示;以及,分数计算单元,用于计算所述问题最终表示和所述答案最终表示之间的相似度以获得所述答案数据相对于所述问题数据的相关性分数。在上述基于卷积循环神经网络的答案选择装置中,进一步包括:排序单元,用于基于与所述问题数据对应的多条答案数据的多个相关性分数对所述多条答案数据进行排序。在上述基于卷积循环神经网络的答案选择装置中,所述多条答案数据是通过多个搜索引擎获得的所述问题数据的多条候选答案数据。在上述基于卷积循环神经网络的答案选择装置中,所述数据获取单元用于:对所述多条候选答案数据中的每条候选答案数据进行文本分词和去除停用词。在上述基于卷积循环神经网络的答案选择装置,进一步包括:注意力机制单元,用于:将所述问题特征表示在序列长度上进行平均以获得更新向量;以及,以所述更新向量对于所述标题隐状态序列和所述摘要隐状态序列分别进行词级别注意力的更新以获得更新后的标题隐状态序列和摘要隐状态序列;以及所述卷积网络单元用于以卷积神经网络分别从所述更新后的标题隐状态序列和摘要隐状态序列获得所述标题特征表示和所述摘要特征表示。在上述基于卷积循环神经网络的答案选择装置中,所述池化操作单元用于:对所述问题特征表示进行最大值池化操作以获得问题最终表示;对所述标题特征表示和所述摘要特征表示进行向量拼接;以及,对拼接后的所述标题特征表示和摘要特征表示进行最大值池化操作以获得答案最终表示。在上述基于卷积循环神经网络的答案选择装置中,所述分数计算单元用于:计算所述问题最终表示和所述答案最终表示之间的向量的余弦相似度以获得所述答案数据相对于所述问题数据的相关性分数。根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述基于卷积循环神经网络的答案选择方法。根据本申请的又一方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,当所述计算机程序指令被计算装置执行时,可操作来执行如上所述的基于卷积循环神经网络的答案选择方法。本申请提供的基于卷积循环神经网络的答案选择方法、装置和电子设备,可以通过双向长短期记忆网络挖掘深层语义信息,并通过卷积神经网络提取向量中的特定特征以确定问题数据和答本文档来自技高网...

【技术保护点】
1.一种基于卷积循环神经网络的答案选择方法,包括:获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;通过双向长短期记忆层分别处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;以卷积神经网络分别从所述问题隐状态序列、标题隐状态序列和摘要隐状态序列获得问题特征表示、标题特征表示和摘要特征表示;对所述问题特征表示进行池化操作以获得问题最终表示,且对所述标题特征表示和所述摘要特征表示进行拼接池化操作以获得答案最终表示;以及计算所述问题最终表示和所述答案最终表示之间的相似度以获得所述答案数据相对于所述问题数据的相关性分数。

【技术特征摘要】
1.一种基于卷积循环神经网络的答案选择方法,包括:获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;通过双向长短期记忆层分别处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;以卷积神经网络分别从所述问题隐状态序列、标题隐状态序列和摘要隐状态序列获得问题特征表示、标题特征表示和摘要特征表示;对所述问题特征表示进行池化操作以获得问题最终表示,且对所述标题特征表示和所述摘要特征表示进行拼接池化操作以获得答案最终表示;以及计算所述问题最终表示和所述答案最终表示之间的相似度以获得所述答案数据相对于所述问题数据的相关性分数。2.如权利要求1所述的基于卷积循环神经网络的答案选择方法,进一步包括:基于与所述问题数据对应的多条答案数据的多个相关性分数对所述多条答案数据进行排序。3.如权利要求2所述的基于卷积循环神经网络的答案选择方法,其中,所述多条答案数据是通过多个搜索引擎获得的所述问题数据的多条候选答案数据。4.如权利要求3所述的基于卷积循环神经网络的答案选择方法,其中,获取问题数据和与所述问题数据对应的答案数据包括:对所述多条候选答案数据中的每条候选答案数据进行文本分词和去除停用词。5.如权利要求1所述的基于卷积循环神经网络的答案选择方法,其中,以卷积神经网络分别从所述问题隐状态序列、标题隐状态序列和摘要隐状态序列获得问题特征表示、标题特征表示和摘要特征表示包括:以卷积神经网络直接从所述问题隐状态序列获得所述问题特征表示;将所述问题特征表示在序列长度上进行平均以获得更新向量;以所述更新向量对于所述标题隐状态序列和所述摘要隐状态序列分别进行词级别注意力的更新以获得更新后的标题隐状态序列和摘要隐状态序列;以及以卷积神经网络分别从所述更新后的标题隐状态序列和摘要隐状态序列获得所述标题特征表示和所述摘要特征表示。6.如权利要求1所述的基于卷积循环神经网络的答案选择方法,其中,对所述问题特征表示进行池化操作以获得问题最终表示,且对所述标题特征表示和所述摘要特征表示进行拼接池化操作以获得答案最终表示包括:对所述问题特征表示进行最大值池化操作以获得问题最终表示;对所述标题特征表示和所述摘要特...

【专利技术属性】
技术研发人员:杨鹏
申请(专利权)人:北京慧闻科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1