基于全息神经网络的答案选择方法、装置和电子设备制造方法及图纸

技术编号:19745089 阅读:27 留言:0更新日期:2018-12-12 04:42
本申请涉及基于全息神经网络的答案选择方法,装置和电子设备。所述方法包括:获取问题数据和答案数据,该答案数据包括标题数据和摘要数据;通过双向长短期记忆层处理获得问题隐状态序列、标题隐状态序列和摘要隐状态序列;拼接标题隐状态序列和摘要隐状态序列以获得答案隐状态序列;对问题隐状态序列和答案隐状态序列进行圆相关操作以获得全息组合向量;以及以多重感知机模型基于全息组合向量获得答案数据相对于问题数据的相关性分数。这样,可以通过双向长短期记忆网络挖掘深层语义信息,并通过全息组合向量发现问题数据和答案数据之间的相关性特征,从而提升答案选择的准确性。

【技术实现步骤摘要】
基于全息神经网络的答案选择方法、装置和电子设备
本专利技术总体地涉及数据处理领域,且更为具体地,涉及一种基于全息神经网络的答案选择方法、装置和电子设备。
技术介绍
随着人工智能领域关键技术的快速发展,人工智能助手应用逐渐成熟,各大科技公司相继发布了自己的家用人工智能产品。受益于语音识别和自然语言处理领域的新技术,用户可以通过语音的方式更自然地与这类产品进行交互。在这种交互场景中,一个很重要的部分就是由人工智能产品回答人类用户以自然语言提出的问题。因此,在这种真实的开放领域问答应用场景下,需要能够自动发现真实世界的海量知识,以获得与问题对应的答案。此外,随着互联网技术的发展,越来越多的人选择在网上搜索问题,并获取与问题相关的答案。常见地,网民可以通过社区问答系统(Community-basedQuestionAnswering),例如百度知道,知乎、StackOverflow等,检索自己想了解的问题,并获取与问题相关的满意答案。但是,通常当基于问题进行搜索时,会获得与问题对应的大量答案,因此,因此,需要改进的答案选择方案。
技术实现思路
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于全息神经网络的答案选择方法、装置和电子设备,其通过双向长短期记忆网络挖掘深层语义信息,并通过全息组合向量发现问题数据和答案数据之间的相关性特征,从而提升答案选择的准确性。根据本申请的一方面,提供了一种基于全息神经网络的答案选择方法,包括:获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;通过双向长短期记忆层处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;拼接所述标题隐状态序列和所述摘要隐状态序列以获得与所述答案数据对应的答案隐状态序列;对所述问题隐状态序列和所述答案隐状态序列进行圆相关操作以获得全息组合向量;以及,以多重感知机模型基于所述全息组合向量获得所述答案数据相对于所述问题数据的相关性分数。在上述基于全息神经网络的答案选择方法中,进一步包括:基于与所述问题数据对应的多条答案数据的多个分数对所述多条答案数据进行排序。在上述基于全息神经网络的答案选择方法中,所述多条答案数据是通过多个搜索引擎获得的所述问题数据的多条候选答案数据。在上述基于全息神经网络的答案选择方法中,获取问题数据和与所述问题数据对应的答案数据包括:对所述多条候选答案数据中的每条候选答案数据进行文本分词和去除停用词。在上述基于全息神经网络的答案选择方法中,对所述问题隐状态序列和所述答案隐状态序列进行圆相关操作以获得全息组合向量包括:确定所述问题隐状态序列的第一长度和所述答案隐状态序列的第二长度是否相等;响应于所述第一长度不等于所述第二长度,以零填充所述问题隐状态序列和所述答案隐状态序列中的长度较短者以使得两者的长度相同;以及,对填充后的问题隐状态序列和答案隐状态序列进行圆相关操作以获得所述全息组合向量。在上述基于全息神经网络的答案选择方法中,对填充后的问题隐状态序列和答案隐状态序列进行圆相关操作以获得所述全息组合向量包括:对所述填充后的问题隐状态序列和答案隐状态序列分别进行快速傅里叶变换以获得问题傅里叶表达和答案傅里叶表达;计算所述问题傅里叶表达与所述答案傅里叶表达的元素级乘积的复共轭;以及,对所述复共轭进行快速傅里叶逆变换以获得所述全息组合向量。在上述基于全息神经网络的答案选择方法中,以多重感知机模型基于所述全息组合向量获得所述答案数据相对于所述问题数据的相关性分数包括:计算所述问题隐状态序列与所述答案隐状态序列之间的双线性相似度特征;引入至少一个词重叠特征;以及,以多重感知机模型基于所述全息组合向量、所述双线性相似度特征和所述词重叠特征获得所述答案数据相对于所述问题数据的相关性分数。在上述基于全息神经网络的答案选择方法中,所述至少一个词重叠特征包括第一问题标题词重叠特征、第一问题摘要词重叠特征、第二问题标题词重叠特征和第二问题摘要词重叠特征;所述第一问题标题词重叠特征和第一问题摘要词重叠特征采用直接计数方式计算;以及,第二问题标题词重叠特征和第二问题摘要词重叠特征采用词频-逆文档频率加权方式计算。根据本申请的另一方面,提供了一种基于全息神经网络的答案选择装置,包括:数据获取单元,用于获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;序列获得单元,用于通过双向长短期记忆层处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;序列拼接单元,用于拼接所述标题隐状态序列和所述摘要隐状态序列以获得与所述答案数据对应的答案隐状态序列;全息组合单元,用于对所述问题隐状态序列和所述答案隐状态序列进行圆相关操作以获得全息组合向量;以及,分数计算单元,用于以多重感知机模型基于所述全息组合向量获得所述答案数据相对于所述问题数据的相关性分数。在上述基于全息神经网络的答案选择装置中,进一步包括:答案排序单元,用于基于与所述问题数据对应的多条答案数据的多个分数对所述多条答案数据进行排序。在上述基于全息神经网络的答案选择装置中,所述多条答案数据是通过多个搜索引擎获得的所述问题数据的多条候选答案数据。在上述基于全息神经网络的答案选择装置中,所述数据获取单元用于:对所述多条候选答案数据中的每条候选答案数据进行文本分词和去除停用词。在上述基于全息神经网络的答案选择装置中,所述全息组合单元用于:确定所述问题隐状态序列的第一长度和所述答案隐状态序列的第二长度是否相等;响应于所述第一长度不等于所述第二长度,以零填充所述问题隐状态序列和所述答案隐状态序列中的长度较短者以使得两者的长度相同;以及,对填充后的问题隐状态序列和答案隐状态序列进行圆相关操作以获得所述全息组合向量。在上述基于全息神经网络的答案选择装置中,所述全息组合单元进行圆相关操作包括:对所述填充后的问题隐状态序列和答案隐状态序列分别进行快速傅里叶变换以获得问题傅里叶表达和答案傅里叶表达;计算所述问题傅里叶表达与所述答案傅里叶表达的元素级乘积的复共轭;以及,对所述复共轭进行快速傅里叶逆变换以获得所述全息组合向量。在上述基于全息神经网络的答案选择装置中,所述分数计算单元用于:计算所述问题隐状态序列与所述答案隐状态序列之间的双线性相似度特征;引入至少一个词重叠特征;以及,以多重感知机模型基于所述全息组合向量、所述双线性相似度特征和所述词重叠特征获得所述答案数据相对于所述问题数据的相关性分数。在上述基于全息神经网络的答案选择装置中,所述至少一个词重叠特征包括第一问题标题词重叠特征、第一问题摘要词重叠特征、第二问题标题词重叠特征和第二问题摘要词重叠特征;所述第一问题标题词重叠特征和第一问题摘要词重叠特征采用直接计数方式计算;以及,第二问题标题词重叠特征和第二问题摘要词重叠特征采用词频-逆文档频率加权方式计算。根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运本文档来自技高网...

【技术保护点】
1.一种基于全息神经网络的答案选择方法,包括:获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;通过双向长短期记忆层处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;拼接所述标题隐状态序列和所述摘要隐状态序列以获得与所述答案数据对应的答案隐状态序列;对所述问题隐状态序列和所述答案隐状态序列进行圆相关操作以获得全息组合向量;以及以多重感知机模型基于所述全息组合向量获得所述答案数据相对于所述问题数据的相关性分数。

【技术特征摘要】
1.一种基于全息神经网络的答案选择方法,包括:获取问题数据和与所述问题数据对应的答案数据,所述答案数据包括标题数据和摘要数据;通过双向长短期记忆层处理所述问题数据、标题数据和摘要数据的词向量表示以获得与所述问题数据对应的问题隐状态序列、与所述标题数据对应的标题隐状态序列和与所述摘要数据对应的摘要隐状态序列;拼接所述标题隐状态序列和所述摘要隐状态序列以获得与所述答案数据对应的答案隐状态序列;对所述问题隐状态序列和所述答案隐状态序列进行圆相关操作以获得全息组合向量;以及以多重感知机模型基于所述全息组合向量获得所述答案数据相对于所述问题数据的相关性分数。2.如权利要求1所述的基于全息神经网络的答案选择方法,进一步包括:基于与所述问题数据对应的多条答案数据的多个分数对所述多条答案数据进行排序。3.如权利要求2所述的基于全息神经网络的答案选择方法,其中,所述多条答案数据是通过多个搜索引擎获得的所述问题数据的多条候选答案数据。4.如权利要求3所述的基于全息神经网络的答案选择方法,其中,获取问题数据和与所述问题数据对应的答案数据包括:对所述多条候选答案数据中的每条候选答案数据进行文本分词和去除停用词。5.如权利要求1所述的基于全息神经网络的答案选择方法,其中,对所述问题隐状态序列和所述答案隐状态序列进行圆相关操作以获得全息组合向量包括:确定所述问题隐状态序列的第一长度和所述答案隐状态序列的第二长度是否相等;响应于所述第一长度不等于所述第二长度,以零填充所述问题隐状态序列和所述答案隐状态序列中的长度较短者以使得两者的长度相同;以及对填充后的问题隐状态序列和答案隐状态序列进行圆相关操作以获得所述全息组合向量。6.如权利要求5所述的基于全息神经网络的答案选择方法,其中,对填充后的问题隐状态序列和答案隐状态序列进行圆相关操作以获得所述全息组合向量包括:对所述填充后的问题隐状态序列和答案隐状态序列分别进行快速傅里叶变换以获得问题傅里叶表达和答案傅里叶表达;计算所述问题傅里叶表达与述答案傅里叶表达的元素级乘积的复共轭;以及对所述复共轭进行快速傅里叶逆变换以获得...

【专利技术属性】
技术研发人员:杨鹏
申请(专利权)人:北京慧闻科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1