The invention discloses a natural language question and answer method based on deep convolution neural network. The method comprises the following steps: 1) the representation of natural language questions and database information centralized information into vector sequences with the structure, and the formation of vector matrix; 2) with deep convolutional neural network to vector matrix, corresponding to the deep semantic feature extraction; 3) according to the deep semantic feature calculation of natural language problems and database information centralized information semantic relevance degree; 4) according to the semantic relevance to select the database information on the information obtained, generate natural language questions. The invention can better extract the semantic features of the deep generalizations, accurately locate and support the data information, so as to achieve a better natural language question and answer effect.
【技术实现步骤摘要】
一种基于深层卷积神经网络的自然语言问答方法
本专利技术涉及一种利用深层卷积神经网络提取自然语言问题与候选信息的语义特征,以增强相关度计算的效果,从而提高自然语言问答准确性的方法,属于自然语言问答领域。
技术介绍
随着信息技术和互联网的发展,信息过载越来越严重,如何有效地理解用户的需求,跨越查询到已有信息之间的不一致性鸿沟,从而有效地从大量的信息中获取用户所需,便成为一项非常重要的问题。用户的查询通常表现为一个使用自然语言表达问题。而提供回答信息的资源数据库的表现形式可以有很多种,可以是由形如(主体,谓词,客体)的三元组构成结构化知识库,比如(中国,首都,北京)这条三元组就蕴含了“中国的首都是北京”这条知识;也可以是由大量普通自然语言句子构成的文本集,语料可能来自百科全书、新闻、社交媒体等多种平台及其组合,比如“我来到中国的首都——北京——读大学。”同样也蕴含了中国的首都是北京这条知识;同样的,资源数据库也可以是由多条多种形式的信息的组合构成的。自然语言问答中一个重要的过程就是评价资源数据库中的信息与用户查询的问题之间的语义相关度,从而选取最有效的信息来帮助回答用户 ...
【技术保护点】
一种基于深层卷积神经网络的自然语言问答方法,其特征在于,包括以下步骤:1)将自然语言问题和数据库信息集中的信息表示成具有序列结构的向量,并形成向量矩阵;2)采用深层卷积神经网络对向量矩阵进行处理,提取对应的深层语义特征;3)根据深层语义特征计算自然语言问题与数据库信息集中的信息的语义相关度;4)根据计算得出的语义相关度选择数据库信息集中的信息,生成自然语言问题的回答。
【技术特征摘要】
1.一种基于深层卷积神经网络的自然语言问答方法,其特征在于,包括以下步骤:1)将自然语言问题和数据库信息集中的信息表示成具有序列结构的向量,并形成向量矩阵;2)采用深层卷积神经网络对向量矩阵进行处理,提取对应的深层语义特征;3)根据深层语义特征计算自然语言问题与数据库信息集中的信息的语义相关度;4)根据计算得出的语义相关度选择数据库信息集中的信息,生成自然语言问题的回答。2.如权利要求1所述的方法,其特征在于,步骤1)所述数据库信息集是原始数据库信息集,或者是经过信息筛选得到的缩小范围后的候选信息集。3.如权利要求1所述的方法,其特征在于,步骤2)使用多层卷积神经网络根据步骤1)生成的向量矩阵ME生成深层语义特征fE,即满足:其中,Mi为第i层过后的特征矩阵;为用于调整Mi与Mi+1之间可能存在的特征数差异的宽为1、滤波器数量为∑jkij的卷积层计算,表示一次宽为1,过滤器数量为∑jkij的带有激活函数的卷积操作,在∑jkij=∑jki-1j时可以忽略成恒同变换;concat为连接函数,将输入的一系列张量在最后一个分量上进行连接,concat下方的j表示对维度j进行连接;pooling为池化函数,通过计算矩阵每行最大值、最小值、平均值、中位数,将输入矩阵化成一个向量;mij为第i层第j种卷积核的宽度,kij为第i层第j种卷积核的个数,表示一次宽为mij,过滤器数量为kij的带有激活函数的卷积操作。4.如权利要求1所述的方法,其特征在于,步骤2)使用多层卷积神经网络根据步骤1)生成的向量矩阵ME生成深层语义特征fE,即满足:其中,Mi为第i层过后的特征矩阵;为用于调整Mi与Mi+1之间可能存在的特征数差异的宽为1、滤波器数量为∑jkij的卷积层计算,在∑jkij=∑jki-1j时可以忽略成恒同变换;concat为连接函数,将输入的一系列张量在最后一个分量上进行连接;fl...
【专利技术属性】
技术研发人员:来雨轩,冯岩松,贾爱霞,赵东岩,
申请(专利权)人:北京大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。