一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置制造方法及图纸

技术编号:17265822 阅读:170 留言:0更新日期:2018-02-14 13:29
本发明专利技术涉及一种基于文本流输入的深度神经网络的可视化分析方法及装置,包括:设计实现一个基于文本输入的分层深度神经网络结构;使用标签相关性传播算法(LRP)得到每一层因素(factor)对于预测结果的权重,进而从中提取重要的因素;对得到的重要因素进行聚类,以得到整体的聚类信息,进而构建因素层次结构;对结果进行可视化,在可视化中,将预测结果与因素聚类结果并列展示,聚类结果可以进一步展开直至最小粒度的因素。采用本发明专利技术,通过分层的因素分析方法,可以帮助用户更好的分析深度神经网络的结果和运行机制。

A hierarchical factor visualization analysis method and device for deep neural network based on text flow input

The invention relates to a method and device, visual analysis of the depth of the neural network to the text stream based on input include: design and implementation of a layered depth neural network structure based on the input text; use correlation label propagation algorithm (LRP) to get each layer factor (factor) weight on the prediction results, and then extract the important factors from; to cluster the important factors to get, to get the clustering information of the whole, and then construct factor hierarchical structure; the results are visualized in visualization, the prediction results and factors of clustering results and column shows, factor clustering results can be further expanded to the minimum size. By using the method of stratified factor analysis, this invention can help users to better analyze the results and operating mechanism of the deep neural network.

【技术实现步骤摘要】
一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置
本专利技术涉及深度学习和可视化领域,具体地说,涉及一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置。
技术介绍
深度学习技术正在改观大数据研究领域的预测分析,并且已经在图像和语音识别、知识问答、机器翻译以及其他很多应用领域取得了重大突破。通常,深度学习方法是将输入数据经由多层神经网络结构,如前馈神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等,通过多次的迭代训练,最终得到学习模型。然而,相对于传统的机器学习方法,如线性回归和支持向量机,深度学习模型有一个众所周知的缺陷,即它难以解释。这个缺陷使得难以理解深度学习模型和进一步分析。在有些领域,例如图像识别,深度学习的原理已经被部分解释。例如,从基本的视觉特征到图案最后到对象的细节特区提取。在大多数其他领域,对于深度学习模型如何工作仍然只有很少的线索。例如在文本预测中,文本输入的使用引入了额外的词向量步骤来将文本集合映射到特征空间,使得解释预测模型更加困难。以股票预测为例,已经证实金融新闻和推特等文本数据对股市走势的预测是有用的。例如,雅虎金融新闻“Amazonprofitbeatsforecasts”会伴随着亚马逊股价的激增,而“Oilpricehitsarecordhigh”则引发了对汽车行业的担忧并且削弱了他们在股市的表现。过去的使用大量金融新闻以及深度神经网络的工作已经在每日股价的预测上达到了高于60%的准确率。然而,金融用户(如交易者,投资者等)不能直接运用深度学习的结果。第一,这些用户通常已经建立了他们自己的一系列交易规则,并且不会依赖单一的不可知的预测算法。第二,他们的交易通常是小时级甚至是分钟级的,然而在研究领域,为了和交易的新闻周期一致,基于文本的预测是按天运行的。因此,金融领域用户只有理解了预测模型并且将模型中学到的知识与自己在股市的领域经验相结合,才能从深度学习技术中受益。为了更好的理解深度学习模型的运行机制,近几年出现了一些深度神经网络的可视化的方法,如Google公司的TensorflowPlayground提供了一个在线可视化工具来帮助非领域专家理解深度学习模型的结构和训练过程。但是之前的工作大多集中于使用卷积神经网络的图像分类领域,来帮助理解神经网络的结构,而没有展示文本流与预测值的关联关系方面的工作。另外,在可视化展示文本数据与预测结果的相关性时,通常文本数据量很大,在这种情况下,由于计算机显示器屏幕大小有限,不可能同时向用户展示全部文本数据。如果采用按照相关性排序的方式,则只能对文本数据的一部分进行显示,这就缺少了相关文本的整体情况。
技术实现思路
本专利技术技术解决问题:克服现有技术的不足,提供一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置,通过分层因素的展示和分析,可以将输入文本数据与模型预测结果的关系予以展示,并进一步通过添加重要关键词、逐级展开因素以及查看原始文本数据等交互,以帮助用户分析和理解深度学习模型的结果。本专利技术技术解决方案:一种基于文本流输入的深度神经网络的分层因素可视化分析方法,包括以下步骤:(1)设计一个基于文本流输入的深度神经网络的模型,使用训练集和开发集对该模型进行训练,再使用训练好的模型在测试集上进行预测,得到预测结果;(2)使用标签相关性传播算法(LRP)获得步骤(1)中设计的深度神经网络中每一层因素对于预测结果的权重,从这些因素中提取权重绝对值大于设定阈值的文本作为重要因素;(3)对步骤(2)得到的重要因素进行聚类,得到重要因素的聚类结果,根据聚类结果构建这些重要因素,的层次树;树的第一层为对预测结果影响权重大于设定阈值的关键词的聚类,第二层为各个关键词,第三层为包含这些关键词的二元词组,第四层为包含这些关键词的文本文档;(4)对步骤(1)中的预测结果以及步骤(3)得到的重要因素的聚类结果以及重要因素的层次树进行联动可视化展示。所述步骤(1)中的深度神经网络的模型为分层结构,具体结构如下:共有四层,分别是词向量层、词组向量层、标题向量层和回归网络层,从文本数据到最终预测结果,词向量层以原始文本数据作为输入,并将其中每个单词转换成一个实数的词向量;词组向量层在以上词向量的基础上构建相邻两单词组成的词组的向量;标题向量层汇总标题,包括新闻标题、推文中出现的所有词组向量,并构建标题的向量表示;回归网络层接收标题向量层的输出,并通过一个带有残差连接项的前向神经网络将接收到的标题向量层的输出映射到一个实数预测值。所述步骤(2)中,使用标签相关性传播算法获得步骤(1)中设计的深度神经网络中每一层因素对于预测结果的权重,实现如下:(1)将第l层的第i个神经元记作其相关性分数记作将神经网络训练时前向过程中从神经元到神经元的信息贡献函数定义为m(j→i),最后一层的相关性分数为预测结果,首先计算经过传播到的相关性分数增量为:再按照此公式计算第l层的所有神经元传播到的相关性分数增量;(2)累加步骤(1)得到的相关性分数增量即得到第l‐1层的神经元Rj的相关性分数即:按照此方法可得到l‐1层每个神经元的标签相关分数和(3)将l‐1层得到的相关性分数按(1)(2)中同样的规则传播到第l‐2层,得到l‐2层的相关性分数,由l‐2层得到的相关性分数按照同样的规则传播到l‐3层,得到l‐3层的相关性分数,不断计算直至得到第一层的相关性分数,这样便得到每一层因素的相关性分数,从中选取相关性分数绝对值大于某个阈值的因素作为重要因素。步骤(3)中,聚类采用k‐means聚类算法,具体实现如下:(1)对步骤2得到每个重要因素,即影响权重绝对值较大的关键词,在语义空间上找到它的最相近的n个关键词,然后将这些关键词的相关性向量加和作为该关键词最终的向量;(2)在向量的空间中选取任意k个点为中心进行聚类,分别计算每个点距离各个中心点的位置,距离同一个中心点最近的点被归为一类,每类中所有点的中心点作为新的聚类中心点。聚类中心的每次更新为一次迭代,迭代一定次数后算法终止,得到k个聚类结果;(3)选用轮廓测量(Silhouettemeasure)方法来评价上述聚类结果的效果,选取最优的聚类个数和聚类结果。所述k取2到15。步骤(4)中,联动可视化展示采用以下情形的任意一种:m.当显示被预测值序列的页面时,在图表信息中突出实际值与预测值及其差别;n.当显示被预测值序列的页面时,同时显示相应因素的时序曲线,突出两者之间的相关性;o.当改变被预测值序列的时间区间时,相应改变相应因素的曲线;p.使用共用时间轴的方式对时序预测值和输入文本流因素进行联动的显示;q.使用降维技术和散点图对文本因素的分布情况进行显示;r.使用可以展开的树形结构展示文本因素,将文本因素的聚类按层次展开;s.使用文档列表的展示方式来联动的显示选中时间片段对应的原始文本数据;t.优选地,在上述文本流因素的视图中添加该因素与预测值的互相关系数曲线来展示该因素的影响;u.优选地,将层次因素视图与散点图联动的显示,在上述散点图中突出显示包含选中因素视图中的因素的点;v.展开因素曲线的视图至下一层次的因素时序图;w.输入新的关键词因素,并提交到系统,系统增加该关键词的时序图;x.对本文档来自技高网
...
一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置

【技术保护点】
一种基于文本流输入的深度神经网络的分层因素可视化分析方法,其特征在于,包括以下步骤:(1)设计一个基于文本流输入的深度神经网络的模型,使用训练集和开发集对该模型进行训练,再使用训练好的模型在测试集上进行预测,得到预测结果;(2)使用标签相关性传播算法(LRP)获得步骤(1)中设计的深度神经网络中每一层因素对于预测结果的权重,从这些因素中提取权重绝对值大于设定阈值的文本作为重要因素;(3)对步骤(2)得到的重要因素进行聚类,得到重要因素的聚类结果,根据聚类结果构建这些重要因素,的层次树;树的第一层为对预测结果影响权重大于设定阈值的关键词的聚类,第二层为各个关键词,第三层为包含这些关键词的二元词组,第四层为包含这些关键词的文本文档;(4)对步骤(1)中的预测结果以及步骤(3)得到的重要因素的聚类结果以及重要因素的层次树进行联动可视化展示。

【技术特征摘要】
1.一种基于文本流输入的深度神经网络的分层因素可视化分析方法,其特征在于,包括以下步骤:(1)设计一个基于文本流输入的深度神经网络的模型,使用训练集和开发集对该模型进行训练,再使用训练好的模型在测试集上进行预测,得到预测结果;(2)使用标签相关性传播算法(LRP)获得步骤(1)中设计的深度神经网络中每一层因素对于预测结果的权重,从这些因素中提取权重绝对值大于设定阈值的文本作为重要因素;(3)对步骤(2)得到的重要因素进行聚类,得到重要因素的聚类结果,根据聚类结果构建这些重要因素,的层次树;树的第一层为对预测结果影响权重大于设定阈值的关键词的聚类,第二层为各个关键词,第三层为包含这些关键词的二元词组,第四层为包含这些关键词的文本文档;(4)对步骤(1)中的预测结果以及步骤(3)得到的重要因素的聚类结果以及重要因素的层次树进行联动可视化展示。2.根据权利要求1所述的基于文本流输入的深度神经网络的分层因素可视化分析方法,其特征在于:所述步骤(1)中的深度神经网络的模型为分层结构,具体结构如下:共有四层,分别是词向量层、词组向量层、标题向量层和回归网络层,从文本数据到最终预测结果,词向量层以原始文本数据作为输入,并将其中每个单词转换成一个实数的词向量;词组向量层在以上词向量的基础上构建相邻两单词组成的词组的向量;标题向量层汇总标题,包括新闻标题、推文中出现的所有词组向量,并构建标题的向量表示;回归网络层接收标题向量层的输出,并通过一个带有残差连接项的前向神经网络将接收到的标题向量层的输出映射到一个实数预测值。3.根据权利要求1所述的基于文本流输入的深度神经网络的分层因素可视化分析方法,其特征在于:所述步骤(2)中,使用标签相关性传播算法获得步骤(1)中设计的深度神经网络中每一层因素对于预测结果的权重,实现如下:(1)将第l层的第i个神经元记作其相关性分数记作将神经网络训练时前向过程中从神经元到神经元的信息贡献函数定义为m(j→i),最后一层的相关性分数为预测结果,首先计算经过传播到的相关性分数增量为:再按照此公式计算第l层的所有神经元传播到的相关性分数增量;(2)累加步骤(1)得到的相关性分数增量即得到第l‐1层的神经元Rj的相关性分数即:按照此方法可得到l‐1层每个神经元的标签相关分数和(3)将l‐1层得到的相关性分数按(1)(2)中同样的规则传播到第l‐2层,得到l‐2层的相关性分数,由l‐2层得到的相关性分数按照同样的规则传播到l‐3层,得到l‐3层的相关性分数,不断计算直至得到第一层的相关性分数,这样便得到每一层因素的相关性分数,从中选取相关性分数绝对值大于某个阈值的因素作为重要因素。4.根据权利要求1所述的基于文本流输入的深度神经网络的分层因素可视化分析方法,其特征在于:步骤(3)中,聚类采用k‐...

【专利技术属性】
技术研发人员:时磊王乐黄聪聪
申请(专利权)人:中国科学院软件研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1