System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于半监督的语义预测方法技术_技高网

一种基于半监督的语义预测方法技术

技术编号:39956401 阅读:5 留言:0更新日期:2024-01-08 23:42
本申请属于机器学习中的深度强化学习技术领域,特别涉及一种基于半监督的语义预测方法。包括:步骤一、获取原始数据D,原始数据D包括n局数据;步骤二、从原始数据D中随机选取m局数据,并对所选的m局数据进行标注,得到已标注的数据集Labeled_D;步骤三、基于数据集Labeled_D进行有监督模型训练,得到预训练模型M_Pretrain;步骤四、通过原始数据D中除去已标注的m局数据之外的剩余数据,对预训练模型M_Pretrain进行预测,并将预测的语义结果定义为伪标签Fake_Label,得到带有伪标签的数据集Fake_Labeled_D;步骤五、将数据集Labeled_D和数据集Fake_Labeled_D组合成数据集D_Final,并基于数据集D_Final进行有监督模型训练,得到语义预测模型M_Final。本申请能够在任意的复杂场景情况下实现对语义的预测。

【技术实现步骤摘要】

本申请属于机器学习中的深度强化学习,特别涉及一种基于半监督的语义预测方法


技术介绍

1、随着新型装备的快速装备运用,以及理论战法的创新使用,航空环境日趋复杂,发展智能态势评估系统,满足飞行员对航空态势评估的质量和可靠性的要求,已经成为共识。特别是在分布式航空中,智能态势评估系统收集和处理的数据呈现指数级增长,并且不同飞行员对态势的需求是不一致的,特别是受到他方干扰等影响,态势评估趋于复杂,对系统的要求也越来越高。现有的态势评估系统在计算能力、准确性、可靠性、可视化等方面难以满足现有发展需求。构建一个高效的智能态势评估系统,增强对航空复杂环境的态势感知能力已成为当前的研究热点。通过态势感知,可以获得对整个场景态势的准确把握,并根据态势评估结果进行态势运用,为提高飞机的智能化调整和控制水平提供支撑。其中,语义的预测作为一种为人提供未来航空分析与策略制定的辅助手段,一直是理论分析的研究热点之一。

2、然而,现有的语义预测与分析方法,主要是基于人为专家先验知识来进行建模,再基于建模来完成语义的分析。然而,随着近年来航空环境的越发复杂化,仅仅基于专家知识进行建模的难度越来越大,在极为复杂的战场形势下,预测模型难以做到面面俱到,极大地增加了算法工程师建模的难度,甚至难以完成高质量的建模。

3、因此,希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。


技术实现思路

1、本申请的目的是提供了一种基于半监督的语义预测方法,以解决现有技术存在的至少一个问题。>

2、本申请的技术方案是:

3、一种基于半监督的语义预测方法,包括:

4、步骤一、获取原始数据d,所述原始数据d包括n局数据;

5、步骤二、从所述原始数据d中随机选取m局数据,并对所选的m局数据进行标注,得到已标注的数据集labeled_d;

6、步骤三、基于数据集labeled_d进行有监督模型训练,得到预训练模型m_pretrain;

7、步骤四、通过原始数据d中除去已标注的m局数据之外的剩余数据,对所述预训练模型m_pretrain进行预测,并将预测的语义结果定义为伪标签fake_label,得到带有伪标签的数据集fake_labeled_d;

8、步骤五、将数据集labeled_d和数据集fake_labeled_d组合成数据集d_final,并基于数据集d_final进行有监督模型训练,得到语义预测模型m_final。

9、在本申请的至少一个实施例中,步骤一中,所述获取原始数据d,所述原始数据d包括n局数据,包括:

10、通过控制策略模型与仿真环境进行交互,获取原始数据d;

11、其中,原始数据d包括第i局数据di,i=1…n,所述第i局数据di包括第i个场景态势si和第i个动作控制指令ai。

12、在本申请的至少一个实施例中,所述通过控制策略模型与仿真环境进行交互,获取原始数据d,包括:

13、获取仿真环境的第一场景态势,将第一场景态势输入到控制策略模型中,输出第一动作控制指令;

14、将第一动作控制指令输入到仿真环境中,输出第二场景态势,并将第二场景态势输入到控制策略模型中,输出第二动作控制指令;

15、将第二动作控制指令输入到仿真环境中,输出第三场景态势,并将第三场景态势输入到控制策略模型中,输出第三动作控制指令;

16、……

17、依次类推,每次循环中输入到控制策略模型中的场景态势以及控制策略模型输出对应的动作控制指令联合组成一局数据,从而得到原始数据d。

18、在本申请的至少一个实施例中,步骤二中,所述从所述原始数据d中随机选取m局数据,并对所选的m局数据进行标注,得到已标注的数据集labeled_d,包括:

19、从所述原始数据d中随机选取m局数据;

20、获取规则模型,通过规则模型对所选的m局数据进行标注,其中,对于m局数据中的第j局数据dj进行标注包括:

21、f(sj)=labelj

22、其中,f为规则模型,labelj为第j个场景态势sj的语义标签;

23、得到已标注的数据集labeled_d。

24、在本申请的至少一个实施例中,所述语义标签包括平飞、急升、急降、左急转、右急转、进攻发弹、回避躲弹。

25、专利技术至少存在以下有益技术效果:

26、本申请的基于半监督的语义预测方法,通过半监督的方式训练得到语义预测模型,能够在任意的复杂场景情况下实现对语义的预测,解决对复杂情况的语义预测困难的问题,在预测比较粗略的飞行语义时,能够具有很强的泛化能力。

本文档来自技高网...

【技术保护点】

1.一种基于半监督的语义预测方法,其特征在于,包括:

2.根据权利要求1所述的基于半监督的语义预测方法,其特征在于,步骤一中,所述获取原始数据D,所述原始数据D包括n局数据,包括:

3.根据权利要求2所述的基于半监督的语义预测方法,其特征在于,所述通过控制策略模型与仿真环境进行交互,获取原始数据D,包括:

4.根据权利要求3所述的基于半监督的语义预测方法,其特征在于,步骤二中,所述从所述原始数据D中随机选取m局数据,并对所选的m局数据进行标注,得到已标注的数据集Labeled_D,包括:

5.根据权利要求4所述的基于半监督的语义预测方法,其特征在于,所述语义标签包括平飞、急升、急降、左急转、右急转、进攻发弹、回避躲弹。

【技术特征摘要】

1.一种基于半监督的语义预测方法,其特征在于,包括:

2.根据权利要求1所述的基于半监督的语义预测方法,其特征在于,步骤一中,所述获取原始数据d,所述原始数据d包括n局数据,包括:

3.根据权利要求2所述的基于半监督的语义预测方法,其特征在于,所述通过控制策略模型与仿真环境进行交互,获取原始数据d,包括:

...

【专利技术属性】
技术研发人员:徐芳芳费思邈管聪罗庆朴海音孙智孝姚宗信刘仲
申请(专利权)人:中国航空工业集团公司沈阳飞机设计研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1