基于人工智能算法的情报系统建模分析方法技术方案

技术编号:33795419 阅读:17 留言:0更新日期:2022-06-12 14:58
本发明专利技术涉及基于人工智能算法的情报系统建模分析方法,包括步骤:使用神经语言模型对模型文档进行分析,得到若干个词向量;对模型文档进行章节分解,获得模型文档对应的模型全文和n个章节,模型全文和n个章节中均包含若干词向量;通过LSTM循环神经网络对模型全文进行处理,生成全文思想向量c;通过LSTM循环神经网络基于全文思想向量c对n个章节进行处理,生成章节思想向量cp;通过LSTM循环神经网络将对章节思想向量cp进行处理,生成模型摘要,实现意图解析。本方案使用的LSTM循环神经网络具有正确的意图解析,自动处理生成模型摘要,不仅能提高情报分析结果的准确性,还能减轻情报分析人员的时间、精力成本。精力成本。精力成本。

【技术实现步骤摘要】
基于人工智能算法的情报系统建模分析方法


[0001]本专利技术涉及情报分析
,特别涉及一种基于人工智能算法的情报系统建模分析方法。

技术介绍

[0002]随着信息技术的发展,大量新技术应用于情报分析领域,情报的搜集能力得到了大幅提高。情报是决策的前提和基础,但并不是多多益善,因为如果超过了一定的界限,事情就可能走向反面,尤其是信息泛滥的今天。互联网各类信息铺天盖地,真假难辨,情报不经过分析是无法直接使用的,有价值的情报也必须通过分析才能得出。
[0003]情报分析实质上是一个信息选择和综合的过程,分析人员采用传统的分析方式通过常规搜索引擎获取数据,通过人工整理文档的方式管理数据等操作,耗费了大量的时间和精力,并且在此过程中积累的情报分析模型并不能直接在情报的搜集和分析的过程中使用,致使情报分析效果不理想。
[0004]情报分析领域已经大量地借鉴和应用了各类模型,情报分析模型也越来越走向计算化、智能化、全源化和模式化。然后情报分析模型如何真正用于实际的信息系统中,实现自动化、智能化,却存在比较大的难度,因为情报的业务建模没有一定之规,无法结构化,因此情报分析模型一般采用自然语言。但是,当前使用的情报分析模型在进行情报搜集和分析时面临如下几个问题:一,如何让计算机读取情报分析模型,准确领会建模人员的意图。要实现情报搜集和分析的智能化,必须对模型进行意图解析,这种解析的正确性决定了最后情报分析结果的准确性。
[0005]二,对搜索到的情报如何进行分析,使其能够最大限度贴近原模型的需求,进而生成分析报告。信息技术对于情报搜集和分析产生了很大的促进作用,如可以使用关键词等进行快速搜索和分析,目前的情报搜索系统会不分良莠的将情报资料全部吸收进来,对情报分析人员的时间和精力造成巨大消耗。
[0006]因此,如何提高情报分析结果的准确性和减轻情报分析人员的时间、精力成本,是需要进一步改进的。

技术实现思路

[0007]本专利技术的目的在于提高情报分析结果的准确性和减轻情报分析人员的时间、精力成本,提供一种基于人工智能算法的情报系统建模分析方法。
[0008]为了实现上述专利技术目的,本专利技术实施例提供了以下技术方案:基于人工智能算法的情报系统建模分析方法,包括以下步骤:步骤S1:使用情报分析模型进行情报搜集和分析,从而生成模型文档;步骤S2:使用基于领域语料库训练的神经语言模型对模型文档进行分析,从而得到若干个词向量,所述神经语言模型为Word2Vec模型;对模型文档进行章节分解,从而获得
模型文档对应的模型全文和n个章节,所述模型全文和n个章节中均包含若干词向量;步骤S3:通过LSTM循环神经网络对所述模型全文进行处理,生成全文思想向量c;通过LSTM循环神经网络基于全文思想向量c对n个章节进行处理,生成章节思想向量cp;步骤S4:通过LSTM循环神经网络将对章节思想向量cp进行处理,生成模型摘要,实现意图解析。
[0009]在上述方案中,使用现有的情报分析模型获取情报,但此时获取的情报是杂乱无章、良莠不齐的,因此本方案接着对情报分析模型所获取的情况进行处理,处理过程为先将情报(即模型文档)分解为若干词向量,再通过LSTM循环神经网络对这些词向量进行自动处理后,生成模型摘要,从模型摘要中即能得出关键性的情报。LSTM循环神经网络具有正确的意图解析,自动处理生成模型摘要,不仅能提高情报分析结果的准确性,还能减轻情报分析人员的时间、精力成本。
[0010]所述步骤S1具体包括以下步骤:利用情报分析模型根据用户分析需求建立任务节点,为各个情报分析模型建立的节点设置工作内容,工作内容可以为搜索内容、搜索范围、分析方法等,从而形成一个分析链路,该分析链路即为模型文档。
[0011]所述步骤S3之前还包括步骤:对LSTM循环神经网络进行训练:所述LSTM循环神经网络包括编码器、解码器;向LSTM循环神经网络的编码器依次输入词向量训练集X={x
t
},t∈N,N为大于等于1的整数,x
t
表示在t时刻输入编码器的词向量;在t=1时,向编码器输入第一初始隐状态h0和x1,编码器输出此时刻的隐状态h1;在t>1时,向编码器输入上一时刻的隐状态h
t
‑1和此时刻的词向量x
t
,编码器输出此时刻的隐状态h
t
;直到所有的词向量x
t
都输入编码器完毕,最后编码器输出第N个时刻的隐状态h
N
;向LSTM循环神经网络的解码器依次输入预测值训练集Y={y
t`
},t`∈M,M为大于等于1的整数,y
t`
表示在t`时刻输入解码器的预测值;在t`=1时,向解码器输入第二初始隐状态h`0和初始预测值y1,所述第二初始隐状态h`0为编码器输出第N个时刻的隐状态h
N
,初始预测值y1为自定义值<bos>,解码器输出此时刻的隐状态h`1和下一次时刻的预测值y2;在t`>1时,向解码器输入上一时刻的隐状态h`
t`
‑1和此时刻的预测值y
t`
,解码器输出此时刻的隐状态h`
t`
和下一时刻的预测值y
t`+1
;直到所有的预测值y
t`
都输入解码器,或直到解码器输出自定义预测值y
t`+1
=<eos>;从而获得训练好的编码器、训练好的解码器。
[0012]在上述方案中,收集大量的词向量作为训练集对LSTM循环神经网络的编码器和解码器进行训练,使得LSTM循环神经网络能够具有正确的意图解析。
[0013]所述通过LSTM循环神经网络对所述模型全文进行处理,生成全文思想向量c的步骤,包括:所述LSTM循环神经网络包括训练好的编码器、训练好的解码器;所述模型全文中包含T个词向量x,将词向量X={x
t
}依次输入编码器,t∈T,T为大于等于1的整数,x
t
表示在t时刻输入编码器的词向量;当t=1时,向训练好的编码器输入第一初始隐状态h0词向量x1,编码器输出此时刻的隐状态h1;当t>1时,向编码器输入上一时刻的隐状态h
t
‑1和此时刻的词向量x
t
,编码器输出此时刻的隐状态h
t
;直到所有词向量x
t
都输入编码器后,得到第T个时刻的隐状态h
T

重新计时,将预测词Y={y
t`
}依次输入解码器,t`∈T`,T`为大于等于1的整数,y
t`
表示在t`时刻输入解码器的预测值;当t`=1时,向训练好的解码器输入第二初始隐状态h`0和初始预测值y1,所述第二初始隐状态h`0为编码器输出的隐状态h
T
,初始预测值y1为自定义值<bos>,解码本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于人工智能算法的情报系统建模分析方法,其特征在于:包括以下步骤:步骤S1:使用情报分析模型进行情报搜集和分析,从而生成模型文档;步骤S2:使用基于领域语料库训练的神经语言模型对模型文档进行分析,从而得到若干个词向量,所述神经语言模型为Word2Vec模型;对模型文档进行章节分解,从而获得模型文档对应的模型全文和n个章节,所述模型全文和n个章节中均包含若干词向量;步骤S3:通过LSTM循环神经网络对所述模型全文进行处理,生成全文思想向量c;通过LSTM循环神经网络基于全文思想向量c对n个章节进行处理,生成章节思想向量cp;步骤S4:通过LSTM循环神经网络将对章节思想向量cp进行处理,生成模型摘要,实现意图解析。2.根据权利要求1所述的基于人工智能算法的情报系统建模分析方法,其特征在于:所述步骤S1具体包括以下步骤:利用情报分析模型根据用户分析需求建立任务节点,为各个情报分析模型建立的节点设置工作内容,工作内容可以为搜索内容、搜索范围、分析方法等,从而形成一个分析链路,该分析链路即为模型文档。3.根据权利要求1所述的基于人工智能算法的情报系统建模分析方法,其特征在于:所述步骤S3之前还包括步骤:对LSTM循环神经网络进行训练:所述LSTM循环神经网络包括编码器、解码器;向LSTM循环神经网络的编码器依次输入词向量训练集X={x
t
},t∈N,N为大于等于1的整数,x
t
表示在t时刻输入编码器的词向量;在t=1时,向编码器输入第一初始隐状态h0和x1,编码器输出此时刻的隐状态h1;在t>1时,向编码器输入上一时刻的隐状态h
t
‑1和此时刻的词向量x
t
,编码器输出此时刻的隐状态h
t
;直到所有的词向量x
t
都输入编码器完毕,最后编码器输出第N个时刻的隐状态h
N
;向LSTM循环神经网络的解码器依次输入预测值训练集Y={y
t`
},t`∈M,M为大于等于1的整数,y
t`
表示在t`时刻输入解码器的预测值;在t`=1时,向解码器输入第二初始隐状态h`0和初始预测值y1,所述第二初始隐状态h`0为编码器输出第N个时刻的隐状态h
N
,初始预测值y1为自定义值<bos>,解码器输出此时刻的隐状态h`1和下一次时刻的预测值y2;在t`>1时,向解码器输入上一时刻的隐状态h`
t`
‑1和此时刻的预测值y
t`
,解码器输出此时刻的隐状态h`
t`
和下一时刻的预测值y
t`+1
;直到所有的预测值y
t`
都输入解码器,或直到解码器输出自定义预测值y
t`+1
=<eos>;从而获得训练好的编码器、训练好的解码器。4.根据权利要求1所述的基于人工智能算法的情报系统建模分析方法,其特征在于:所述通过LSTM循环神经网络对所述模型全文进行处理,生成全文思想向量c的步骤,包括:所述LSTM循环神经网络包括训练好的编码器、训练好的解码器;所述模型全文中包含T个词向量x,将词向量X={x
t
}依次输入编码器,t∈T,T为大于等于1的整数,x
t
表示在t时刻输入编码器的词向量;当t=1时,向训练好的编码器输入第一初始隐状态h0词向量x1,编码器输出此时刻的隐状态h1;当t>1时,向编码器输入上一时刻的隐状态h
t
‑1和此时刻的词向量x
t
,编码器输出此时刻的隐状态h
t
;直到所有词向量x
t
都输入编码器后,得到第T个时刻的隐状态h
T
;重新计时,将预测词Y={y
t`
}依次输入解码器,t`∈T`,T`为大于等于1的整数,y
t`
表示在t`时刻输入解码器的预测值;当t`=1时,向训练好的解码器输入第二初始隐状态h`0和初始
预测值y1,所述第二初始隐状态h`0为编码器输出的隐状态h
T
,初始预测值y1为自定义值<bos>,解码器输出此时刻的隐状态h`1和下一时刻的预测值y2;在t`>1时,向解码器输入上一时刻的隐状态h`
t`
‑1和此时刻的预测值y
t`
,解码器输出此时刻的隐状态h`

【专利技术属性】
技术研发人员:张晟杨晓冬王吉平
申请(专利权)人:北京道达天际科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1