System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于开源事件高阶表征的国家行为预测方法与系统技术方案_技高网

一种基于开源事件高阶表征的国家行为预测方法与系统技术方案

技术编号:41150557 阅读:3 留言:0更新日期:2024-04-30 18:17
本发明专利技术提出一种基于开源事件高阶表征的国家行为预测方法和系统,本发明专利技术涉及基于神经网络的深度学习技术领域,该方法包括:依据构建的国家行为因子库,对开源历史报道中所包含的与国家行为因子对应的各类征候事件进行关联检索,获得相关开源报道及事件实例集合,使用预训练自然语言处理模型来获取事件实例集合的深度表征;沿词频维度进行池化操作,形成降维聚合后的深度表征,将各项因子的归一化频率作为标记位,置于降维聚合后的深度表征向量的末位,作为事件实例集合的归一化频率标记的降维聚合后的深度表征;通过高阶池化操作后获得事件高阶深度表征,并馈送至异常行为预测器,输出预测结果。通过本发明专利技术,模型的可复用性好、能够精准预测。

【技术实现步骤摘要】

本专利技术属于基于神经网络的深度学习,尤其涉及一种基于开源事件高阶表征的国家行为预测方法与系统


技术介绍

1、对国家行为进行分析预测具有重要的现实意义,但是与之相关的事件样本通常较难获取,一般研究人员仅可通过互联网查找有关开源信息(如新闻报道、社交平台等),并在此基础上开展分析。因此,面对诸如文本信息来源复杂、内容噪声较高、分析机理显著依赖于领域专家知识等现实挑战,亟需提出一种准确、高效的国家行为预测方法。

2、目前业界关于国家行为预测的技术研究相对较少,大多数从业者都聚焦于特定国家行为事件的后验分析及解释,而缺乏对行为预测的考量。该研究的技术难点在于基于传统研判方式从海量文本信息中抽取所关心的事件信息需要花费大量的时间和人力成本,同时所获取的事件信息噪声较高,导致研判准确率受限。虽然本专利技术所针对的分析任务在本质上属于文本分类范畴,但其使用的数据样本以及构造方式和传统文本分类差异较大,目前暂未发现类似针对国家行为预测的具体技术方案。此外,传统基于文本信息的事件预测方案大多采用一阶表征完成分析预测,但这种简单的特征提取方法难以有效利用情报信息在时间、空间上的事件相关性,从而导致预测精度有限。

3、如何设计一种端到端的国家行为预测方法与系统,利用特定时间窗口内的国家开源事件信息,尽可能准确地预测该国家潜在动向。这一问题的难点可进一步分解为如下两个部分:1)如何在不过度依赖专家知识的前提下,设计扩展性良好的国家行为因子库,提升开源事件检测模型的可复用性;2)如何充分利用大量开源事件之间时域和空间域共现信息,尽可能地提升国家行为趋势预测准确率。


技术实现思路

1、为解决上述技术问题,本专利技术提出一种基于开源事件高阶表征的国家行为预测技术方案。

2、本专利技术第一方面公开了一种基于开源事件高阶表征的国家行为预测方法;该方法包括:

3、依据构建的国家行为因子库(k表示国家行为因子集合中的第k项因子,δk表示国家行为因子集合中第k项因子指标),因子总数为k,对开源历史报道中所包含的与国家行为因子对应的各类征候事件进行关联检索,获得相关开源报道it(对于第t个历史时间窗口而言,it为该时间窗口内的相关开源报道),获得事件实例集合其中,为δk在it中出现的频次,表示在第t个历史时间窗口对应的事件实例,j表示δk在it中出现的频次变量,相关开源报道的历史时间窗口对应范围为t∈{t1...tm};

4、使用预训练自然语言处理模型来获取事件实例集合的一阶深度表征,获得事件实例集合的一阶深度表征:

5、将该事件实例集合的一阶深度表征沿词频维度进行池化操作,将降维至其中d表示深度表征维度,将各因子降维后的一阶深度表征拼接聚合,形成降维聚合后的一阶深度表征φt∈rk×d,k∈{1...k},t∈{t1...tm},将各项因子δk的归一化频率作为标记位,置于降维聚合后的一阶深度表征向量的末位,形成作为事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,其中的每一行对应不同国家行为因子相关事件的特征原型;

6、基于所提取的事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,进一步通过高阶池化操作获取各项征候事件间的时空共现信息,获得开源事件的高阶表征时空共现信息;

7、将生成的开源事件的高阶表征时空共现信息馈送至异常行为预测器,输出最终的国家行为趋势预测结果pt。

8、根据本专利技术第一方面的方法,获得开源事件的高阶表征时空共现信息的方法如下:

9、基于单个历史时间窗口t∈{t1...tm}内的开源事件高阶表征时空共现信息的方法,对m个历史时间窗口内的事件开展跨时域高阶融合,将历史事件高阶表征的维度扩充至ψt∈rmk×mk,将ψt作为开源事件的高阶表征时空共现信息,其中表示的第k列,g(x,γ)表示的第k列,表示的第k列,表示的第k列,g(x,γ)为的转置,g(x,γ)为幂正则化函数,g(x,γ)用于调整高阶共现表征中的特征能量分布,实现事件共现信息的均衡表达,其中γ为其超参数,用于调节幂正则化函数的函数曲率。

10、根据本专利技术第一方面的方法,异常行为预测器以浅层(2层至6层)卷积神经网络为基本架构,以交叉熵作为损失函数。

11、根据本专利技术第一方面的方法,在该损失函数中,通过随机梯度下降算法对该卷积神经网络网络参数进行迭代拟合,当损失函数值不再下降时,保存当前神经网络网络参数作为预测器的最优参数,对国家行为趋势进行推理预测。

12、根据本专利技术第一方面的方法,获得事件实例集合的同时获得yt,yt表示在第t个历史时间窗口内的国家行为异常程度标签。

13、根据本专利技术第一方面的方法,交叉熵损失函数为l=-∑tytlogpt,其中pt表示输出最终的国家行为趋势预测结果,yt表示在第t个历史时间窗口内的国家行为异常程度标签。

14、根据本专利技术第一方面的方法,用fθ(·)表示所使用的预训练自然语言处理模型,其中θ为其模型参数,获得事件实例集合的一阶深度表征:

15、

16、根据本专利技术第一方面的方法,将该事件实例集合的一阶深度表征沿词频维度进行池化操作为平均池化。

17、本专利技术第二方面公开了一种基于开源事件高阶表征的国家行为预测系统;该系统包括:

18、第一处理模块,被配置为,依据构建的国家行为因子库(k表示国家行为因子集合中的第k项因子,δk表示国家行为因子集合中第k项因子指标),因子总数为k,对开源历史报道中所包含的与国家行为因子对应的各类征候事件进行关联检索,获得相关开源报道it(对于第t个历史时间窗口而言,it为该时间窗口内的相关开源报道),获得事件实例集合其中,为δk在it中出现的频次,表示在第t个历史时间窗口对应的事件实例,j表示δk在it中出现的频次变量,相关开源报道的历史时间窗口对应范围为t∈{t1...tm};

19、第二处理模块,被配置为,使用预训练自然语言处理模型来获取事件实例集合的一阶深度表征,获得事件实例集合的一阶深度表征:

20、第三处理模块,被配置为,将该事件实例集合的一阶深度表征沿词频维度进行池化操作,将降维至其中d表示深度表征维度,将各因子降维后的一阶深度表征拼接聚合,形成降维聚合后的一阶深度表征φt∈rk×d,k∈{1...k},t∈{t1...tm},将各项因子δk的归一化频率作为标记位,置于降维聚合后的一阶深度表征向量的末位,形成作为事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,其中的每一行对应不同国家行为因子相关事件的特征原型;

21、第四处理模块,被配置为,基于所提取的事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,进一步通过高阶池化操作获取各项征候事件间的时空共现信息,获得开源事件的高阶表征时空共现信息;

22、第五处理模块,被配置为,将生成的开源事件的高阶表征时空共现信息馈送至异常行为预测器,输出最终的国家行为趋势预测结果pt本文档来自技高网...

【技术保护点】

1.一种基于开源事件高阶表征的国家行为预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,获得开源事件的高阶表征时空共现信息的方法如下:

3.根据权利要求1-2任一所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,所述异常行为预测器以浅层卷积神经网络为基本架构,以交叉熵作为损失函数。

4.根据权利要求3所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,在所述损失函数中,通过随机梯度下降算法对所述卷积神经网络参数进行迭代拟合,当损失函数值不再下降时,保存当前神经网络参数作为预测器的最优参数,对国家行为趋势进行推理预测。

5.根据权利要求4所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,获得事件实例集合的同时获得在第t个历史时间窗口内的国家行为异常程度标签yt。

6.根据权利要求5所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,交叉熵损失函数为L=-∑tytlogpt,其中pt表示输出最终的国家行为趋势预测结果,yt表示在第t个历史时间窗口内的国家行为异常程度标签。

7.根据权利要求6所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,用fθ(·)表示所使用的预训练自然语言处理模型,其中θ为其模型参数,通过拼接函数cat()获得事件实例集合的一阶深度表征:

8.根据权利要求7所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,将所述事件实例集合的一阶深度表征沿词频维度进行池化操作为平均池化。

9.一种基于开源事件高阶表征的国家行为预测系统,其特征在于,所述系统包括:

10.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至8中任一项所述的一种基于开源事件高阶表征的国家行为预测方法中的步骤。

...

【技术特征摘要】

1.一种基于开源事件高阶表征的国家行为预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,获得开源事件的高阶表征时空共现信息的方法如下:

3.根据权利要求1-2任一所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,所述异常行为预测器以浅层卷积神经网络为基本架构,以交叉熵作为损失函数。

4.根据权利要求3所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,在所述损失函数中,通过随机梯度下降算法对所述卷积神经网络参数进行迭代拟合,当损失函数值不再下降时,保存当前神经网络参数作为预测器的最优参数,对国家行为趋势进行推理预测。

5.根据权利要求4所述的一种基于开源事件高阶表征的国家行为预测方法,其特征在于,获得事件实例集合的同时获得在第t个历史时间窗口内的国家行为异常程度标签yt。

6.根据权利要求5所述的一种基于开源事...

【专利技术属性】
技术研发人员:杨林张洪广杨雄军赵凯南刘錞
申请(专利权)人:中国人民解放军军事科学院系统工程研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1