基于卷积神经网络的主题提取方法、装置、介质和设备制造方法及图纸

技术编号:20025764 阅读:26 留言:0更新日期:2019-01-06 04:37
本发明专利技术提供了一种基于卷积神经网络的主题提取方法、装置、介质和设备,其中,该方法包括:获取与网络舆情相关的待提取文本的词向量矩阵;根据词向量矩阵构造初始特征矩阵,将初始特征矩阵作为题提取模型的输入并输入至第一顺位的区域块,并确定区域块的输出;区域块每个隐含层的输入来自于区域块内所有其他隐含层的输出;将当前区域块的输出作为下一个区域块的输入,继续确定所有区域块的输出;根据所有区域块的输出修正后的主题权重,根据修正后的主题权重提取待提取文本的关键词。该方法采用的网络结构可以使得网络特征和梯度的传递更加有效,避免了损失函数信息逐层传递造成的梯度消失问题,保证了扩大网络深度的同时能够避免梯度消失问题。

【技术实现步骤摘要】
基于卷积神经网络的主题提取方法、装置、介质和设备
本专利技术涉及主题提取
,特别涉及一种基于卷积神经网络的主题提取方法、装置、介质和设备。
技术介绍
随着移动互联网技术的发展,网络信息呈爆发式的增长,网络中充斥了大量有用或无用的文本;例如,网络舆情作为社会舆论的一种表现形式,公众基于互联网对当下流行的社会问题发表不同的看法或网络舆论。由于网络文本信息量巨大,需要快速提取网络信息的主要信息,即提取信息的主题或摘要,以方便用户快速定位自己感兴趣的内容。当前的主题提取模型一般基于词袋模型和循环神经网络模型为主,而词袋模型没有考虑词的位置因素,且文本特征是0阶统计的;而循环神经网络的计算效率较低,参数较多不容易调参,且随着不断迭代会导致梯度越来越小,即出现梯度消失问题。假如采用传统卷积神经网络模型(CNN)单纯地增加网络层,也会导致梯度消失和准确率下降的问题,该方式也不能提高主题提取的效果。
技术实现思路
本专利技术提供一种基于卷积神经网络的主题提取方法、装置、介质和设备,用以解决现有利用卷积神经网络的主题提取模型存在梯度消失问题的缺陷。本专利技术提供的一种基于卷积神经网络的主题提取方法,包括:获取与网络舆情相关的待提取文本,依次将所述待提取文本中的每个词转换为词向量,并确定所述待提取文本的词向量矩阵,为每个词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重;根据所述词向量矩阵构造初始特征矩阵,将所述初始特征矩阵作为训练后的主题提取模型的输入,所述主题提取模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,所述全连接层的输出为所述主题提取模型的输出;将所述主题提取模型的输入作为第一顺位的区域块的输入,并确定所述区域块的输出;所述区域块包含多个隐含层,且每个隐含层的输入来自于所述区域块内所有其他隐含层的输出;将当前区域块的输出作为下一个区域块的输入,继续确定下一个区域块的输出,直至确定所有区域块的输出,并将所有区域块的输出传至全连接层;所述全连接层根据所有区域块的输出生成所述待提取文本的每个词向量的修正后的主题权重;根据词向量修正后的主题权重提取所述待提取文本的关键词。在一种可能的实现方式中,在所述将所述初始特征矩阵作为训练后的主题提取模型的输入之前,该方法还包括:构建初始模型,所述初始模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,全连接层的输出为所述初始模型的输出;获取词向量预设矩阵,所述词向量预设矩阵中每个词向量对应一个主题权重;通过将所述词向量预设矩阵作为所述初始模型的输入、将相应的修正后的主题权重作为所述初始模型的输出,对所述初始模型进行训练,确定所述初始模型的模型参数,将确定模型参数的初始模型作为主题提取模型。在一种可能的实现方式中,所述确定所述待提取文本的词向量矩阵包括:依次将所述待分类文本中的每个词转换为词向量,并将所述待提取文本的一个句子中所有词向量顺序拼接形成相应的句子序列;对所有的所述句子序列进行尾部补零处理,尾部补零处理后的句子序列具有相同的序列长度;依次将所有的尾部补零处理后的句子序列作为矩阵的一行或一列,生成所述待提取文本的词向量矩阵。在一种可能的实现方式中,所述为每个词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重包括:为每个词向量分配一个用于表示相应词为主题关键词可能性大小的相同的主题权重;或根据词向量的词频为词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重,所述词向量的主题权重与所述词向量的词频为正相关关系。在一种可能的实现方式中,所述确定所述区域块的输出包括:预设所述区域块内所有隐含层的处理序列;根据所述区域块的输入确定所述处理序列中第一顺位的隐含层的输出,之后按照所述处理序列、根据所述区域块的输入和已经确定输出的之前的隐含层的输出依次确定每个隐含层的输出;按照所述处理序列、依次根据所述区域块内所有其他隐含层的输出对当前隐含层的输出进行更新;在更新预设次数后,将所述处理序列中最后顺位的隐含层更新后的输出作为所述区域块的输出。在一种可能的实现方式中,所述按照所述处理序列、依次根据所述区域块内所有其他隐含层的输出对当前隐含层的输出进行更新包括:按照所述处理序列、根据更新公式依次确定每个隐含层的输出;所述更新公式为:其中,表示所述处理序列中第i个隐含层在第k次更新后的输出,g()表示激活函数,*表示卷积运算;Wmi表示第m个隐含层与第i个隐含层之间的权重,表示第m个隐含层在第k次更新后的输出,Wni表示第n个隐含层与第i个隐含层之间的权重,表示第n个隐含层在第k-1次更新后的输出;且当k=1时,第k-1次更新表示未更新。在一种可能的实现方式中,所述根据词向量修正后的主题权重提取所述待提取文本的关键词包括:将修正后的主题权重大于预设权重所对应的词向量作为目标词向量,将所述目标词向量对应的词作为所述待提取文本的关键词;或对修正后的主题权重进行排序,将排序后最大的预设数量的主题权重所对应的词向量作为目标词向量,将所述目标词向量对应的词作为所述待提取文本的关键词。基于同样的专利技术构思,本专利技术还提供一种基于卷积神经网络的主题提取装置,包括:获取模块,用于获取与网络舆情相关的待提取文本,依次将所述待提取文本中的每个词转换为词向量,并确定所述待提取文本的词向量矩阵,为每个词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重;输入确定模块,用于根据所述词向量矩阵构造初始特征矩阵,将所述初始特征矩阵作为训练后的主题提取模型的输入,所述主题提取模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,所述全连接层的输出为所述主题提取模型的输出;输出确定模块,用于将所述主题提取模型的输入作为第一顺位的区域块的输入,并确定所述区域块的输出;所述区域块包含多个隐含层,且每个隐含层的输入来自于所述区域块内所有其他隐含层的输出;全局处理模块,将当前区域块的输出作为下一个区域块的输入,继续确定下一个区域块的输出,直至确定所有区域块的输出,并将所有区域块的输出传至全连接层;所述全连接层根据所有区域块的输出生成所述待提取文本的每个词向量的修正后的主题权重;主题提取模块,用于根据词向量修正后的主题权重提取所述待提取文本的关键词。基于同样的专利技术构思,本专利技术还提供一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行上述任意一项所述的方法。基于同样的专利技术构思,本专利技术还提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任意一项所述的方法。本专利技术实施例提供的一种基于卷积神经网络的主题提取方法、装置、介质和设备,基于待提取文本的词向量可构建二维的词向量矩阵,之后利用有依次连接的区域块和与所有区域块均连接的全连接层的主题提取模型确定词的主题权重,进而提取出相应的关键词。利用多个隐含层组成区域块,可以减少每个隐含层输出特征图的数量,从而减小网络参数的数量;该主题提取模型的网络结构可以使得网络特征和梯度的传递更加有效,网络也就更加容易训练;且避免了损失函数信息逐层传递造成的梯度消本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的主题提取方法,其特征在于,包括:获取与网络舆情相关的待提取文本,依次将所述待提取文本中的每个词转换为词向量,并确定所述待提取文本的词向量矩阵,为每个词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重;根据所述词向量矩阵构造初始特征矩阵,将所述初始特征矩阵作为训练后的主题提取模型的输入,所述主题提取模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,所述全连接层的输出为所述主题提取模型的输出;将所述主题提取模型的输入作为第一顺位的区域块的输入,并确定所述区域块的输出;所述区域块包含多个隐含层,且每个隐含层的输入来自于所述区域块内所有其他隐含层的输出;将当前区域块的输出作为下一个区域块的输入,继续确定下一个区域块的输出,直至确定所有区域块的输出,并将所有区域块的输出传至全连接层;所述全连接层根据所有区域块的输出生成所述待提取文本的每个词向量的修正后的主题权重;根据词向量修正后的主题权重提取所述待提取文本的关键词。

【技术特征摘要】
1.一种基于卷积神经网络的主题提取方法,其特征在于,包括:获取与网络舆情相关的待提取文本,依次将所述待提取文本中的每个词转换为词向量,并确定所述待提取文本的词向量矩阵,为每个词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重;根据所述词向量矩阵构造初始特征矩阵,将所述初始特征矩阵作为训练后的主题提取模型的输入,所述主题提取模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,所述全连接层的输出为所述主题提取模型的输出;将所述主题提取模型的输入作为第一顺位的区域块的输入,并确定所述区域块的输出;所述区域块包含多个隐含层,且每个隐含层的输入来自于所述区域块内所有其他隐含层的输出;将当前区域块的输出作为下一个区域块的输入,继续确定下一个区域块的输出,直至确定所有区域块的输出,并将所有区域块的输出传至全连接层;所述全连接层根据所有区域块的输出生成所述待提取文本的每个词向量的修正后的主题权重;根据词向量修正后的主题权重提取所述待提取文本的关键词。2.根据权利要求1所述的方法,其特征在于,在所述将所述初始特征矩阵作为训练后的主题提取模型的输入之前,还包括:构建初始模型,所述初始模型包括依次连接的区域块和与所有区域块输出端连接的全连接层,全连接层的输出为所述初始模型的输出;获取词向量预设矩阵,所述词向量预设矩阵中每个词向量对应一个主题权重;通过将所述词向量预设矩阵作为所述初始模型的输入、将相应的修正后的主题权重作为所述初始模型的输出,对所述初始模型进行训练,确定所述初始模型的模型参数,将确定模型参数的初始模型作为主题提取模型。3.根据权利要求1所述的方法,其特征在于,所述确定所述待提取文本的词向量矩阵包括:依次将所述待分类文本中的每个词转换为词向量,并将所述待提取文本的一个句子中所有词向量顺序拼接形成相应的句子序列;对所有的所述句子序列进行尾部补零处理,尾部补零处理后的句子序列具有相同的序列长度;依次将所有的尾部补零处理后的句子序列作为矩阵的一行或一列,生成所述待提取文本的词向量矩阵。4.根据权利要求1所述的方法,其特征在于,所述为每个词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重包括:为每个词向量分配一个用于表示相应词为主题关键词可能性大小的相同的主题权重;或根据词向量的词频为词向量分配一个用于表示相应词为主题关键词可能性大小的主题权重,所述词向量的主题权重与所述词向量的词频为正相关关系。5.根据权利要求1-4任一所述的方法,其特征在于,所述确定所述区域块的输出包括:预设所述区域块内所有隐含层的处理序列;根据所述区域块的输入确定所述处理序列中第一顺位的隐含层的输出,之后按照所述处理序列、根据所述区域块的输入和已经确定输出的之前的隐含层的输出依次确定每个隐含层的输出;按照所述处理序列、依次根据所述区域...

【专利技术属性】
技术研发人员:金戈徐亮肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利