数据融合方法、装置、设备及存储介质制造方法及图纸

技术编号:38923880 阅读:17 留言:0更新日期:2023-09-25 09:33
本公开提供了一种数据融合方法、装置、设备及存储介质,可以应用于空战决策技术领域。该方法包括:为每个该传感器采集的检测数据赋予初始的权重,得到融合数据,将该数据融合系统作为智能体,该融合数据作为该智能体的动作,该数据融合系统应用的场景作为环境,在该环境下该智能体的观测为状态进行强化学习,以最大化该环境的奖励为学习目标,对该权重进行优化。在时效性和可靠性要求高的环境下,本专利设计的方法能在不需要先验知识的情况下,很好的进行多传感器权值调整和数据融合,协助空战环境中数据的精确性和可靠性。战环境中数据的精确性和可靠性。战环境中数据的精确性和可靠性。

【技术实现步骤摘要】
数据融合方法、装置、设备及存储介质


[0001]本公开涉及空战决策领域,尤其涉及一种数据融合方法、装置、设备、介质和程序产品。

技术介绍

[0002]在军事化技术日趋成熟的现代,许多国家开始广泛采用空战的军事策略,特别是应用隐形飞机等人工智能技术,导致空战环境更加复杂。为了在这种环境下检测目标数据,通常采用多传感器去实施。
[0003]但是由于传感器噪声和空战环境等不确定性的影响,多传感器检测到的目标数据可能会产生误差。为了减小误差通常需要获取大量的先验知识,而实际空战是不断变化的,先验知识难以获取。

技术实现思路

[0004]鉴于上述问题,本公开提供了数据融合方法、装置、设备、介质和程序产品,可以解决在空战中干扰环境下的多传感器数据融合中出现的时效性可靠性低,先验知识难以获取的技术问题。
[0005]根据本公开的第一个方面,提供了一种数据融合方法,应用于数据融合系统,所述数据融合系统用于按照权重融合多个传感器采集的检测数据,其中,所述方法包括:
[0006]为每个所述传感器采集的检测数据赋予初始的权重,得到融合数据;
[0007]将所述数据融合系统作为智能体,所述融合数据作为所述智能体的动作,所述数据融合系统应用的场景作为环境,在所述环境下所述智能体的观测为状态进行强化学习;
[0008]以最大化所述环境的奖励为学习目标,对所述权重进行优化。
[0009]可选的,所述奖励包括当前收益和延时收益,所述以最大化所述环境的奖励为学习目标,对所述权重进行优化包括:
[0010]获取在所述环境下处于当前状态和下一状态的所述目标属性I的费雪尔信息;
[0011]利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息,确定执行所述动作的当前收益;
[0012]利用执行所述动作的当前收益计算执行所述动作的奖励,对所述权重进行优化。
[0013]可选的,所述利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息,确定执行所述动作的当前收益包括:
[0014]在处于所述下一状态的目标属性I的费雪尔信息大于处于所述当前状态的目标属性I的费雪尔信息的情况下,执行所述动作的当前收益为处于所述下一状态的目标属性I的费雪尔信息。
[0015]可选的,所述利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息,确定执行所述动作的当前收益还包括:
[0016]在处于所述下一状态目标属性I的费雪尔信息不大于处于所述当前状态目标属性
I的费雪尔信息的情况下,执行所述动作的当前收益为0。
[0017]可选的,
[0018]其中,a
t
为所述动作,s
t
为当前状态,s

为下一状态,r
t
为执行所述动作的当前收益,γ为折现因子,δ为学习率,Q(s
t
,a
t
)为在所述环境处于所述当前状态s
t
下执行所述动作a
t
所得到的奖励,Q(s

,a
t
)为在所述环境处于所述下一状态s

下执行所述动作a
t
所得到的奖励。
[0019]可选的,所述方法还包括:
[0020]在所述强化学习的学习目标实现的情况下,获取每一所述检测数据的最优权重;
[0021]按照所述最优权重,使所述数据融合系统融合所述检测数据。
[0022]本公开的第二方面提供了一种数据融合装置,应用于数据融合系统,所述数据融合系统用于按照权重融合多个传感器采集的检测数据,其中,所述装置包括:
[0023]赋权模块,由于为每个所述传感器采集的检测数据赋予初始的权重,得到融合数据;
[0024]学习模块,用于将所述数据融合系统作为智能体,所述融合数据作为所述智能体的动作,所述数据融合系统应用的场景作为环境,在所述环境下所述智能体的观测为状态进行强化学习;
[0025]优化模块,用于以最大化所述环境的奖励为学习目标,对所述权重进行优化。
[0026]可选的,所述优化模块包括:
[0027]获取子模块,用于获取在所述环境下处于当前状态和下一状态的所述目标属性I的费雪尔信息;
[0028]确定子模块,用于利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息,确定执行所述动作的当前收益;
[0029]优化子模块,用于利用执行所述动作的当前收益计算执行所述动作的奖励,对所述权重进行优化。
[0030]本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述方法。
[0031]本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述方法。
[0032]本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法。
[0033]根据本公开提供的数据融合方法、装置、设备、介质和程序产品,为每个该传感器采集的检测数据赋予初始的权重,得到融合数据,将该数据融合系统作为智能体,该融合数据作为该智能体的动作,该数据融合系统应用的场景作为环境,在该环境下该智能体的观测为状态进行强化学习,以最大化该环境的奖励为学习目标,对该权重进行优化。在时效性和可靠性要求高的环境下,本专利设计的方法能在不需要先验知识的情况下,很好的进行多传感器权值调整和数据融合,协助空战环境中数据的精确性和可靠性。
附图说明
[0034]通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
[0035]图1示意性示出了根据本公开实施例的数据融合方法、装置、设备、介质和程序产品的应用场景图;
[0036]图2示意性示出了根据本公开实施例的数据融合方法的流程图;
[0037]图3示意性示出了根据本公开实施例数据融合系统与环境交互的逻辑示意图;
[0038]图4示意性示出了根据本公开实施例的权重优化的流程示意图;
[0039]图5示意性示出了根据本公开实施例的数据融合装置的结构框图;以及
[0040]图6示意性示出了根据本公开实施例的适于实现数据融合方法的电子设备的方框图。
具体实施方式
[0041]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
[0042]在此使用的术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据融合方法,应用于数据融合系统,所述数据融合系统用于按照权重融合多个传感器采集的检测数据,其中,所述方法包括:为每个所述传感器采集的检测数据赋予初始的权重,得到融合数据;将所述数据融合系统作为智能体,所述融合数据作为所述智能体的动作,所述数据融合系统应用的场景作为环境,在所述环境下所述智能体的观测为状态进行强化学习;以最大化所述环境的奖励为学习目标,对所述权重进行优化。2.根据权利要求1所述的数据融合方法,其中,所述奖励包括当前收益和延时收益,所述以最大化所述环境的奖励为学习目标,对所述权重进行优化包括:获取在所述环境下处于当前状态和下一状态的所述目标属性I的费雪尔信息;利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息,确定执行所述动作的当前收益;利用执行所述动作的当前收益计算执行所述动作的奖励,对所述权重进行优化。3.根据权利要求2所述的数据融合方法,其中,所述利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息,确定执行所述动作的当前收益包括:在处于所述下一状态的目标属性I的费雪尔信息大于处于所述当前状态的目标属性I的费雪尔信息的情况下,执行所述动作的当前收益为处于所述下一状态的目标属性I的费雪尔信息。4.根据权利要求2或3所述的数据融合方法,其中,所述利用处于所述当前状态和所述下一状态的所述目标属性I的费雪尔信息,确定执行所述动作的当前收益还包括:在处于所述下一状态目标属性I的费雪尔信息不大于处于所述当前状态目标属性I的费雪尔信息的情况下,执行所述动作的当前收益为0。5.根据权利要求1所述的数据融合方法,其中,其中,a
t
为所述动作,s
t
为当前状态,s

为下一状态,r
t
为执行所述动作的当前收益,γ为折现因子,δ为学习率,Q(s
t
,a
t
)为在所述环境处于所述当前状态...

【专利技术属性】
技术研发人员:黄安付
申请(专利权)人:白杨时代北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1