一种基于多模态Q学习的无人机定位干扰源系统及方法技术方案

技术编号：22882797 阅读：35 留言：0更新日期：2019-12-21 06:53

一种基于多模态Q学习的无人机定位干扰源系统及方法，提出了一种基于模式识别和Q学习相结合的多模态Q学习干扰源查找定位算法，该算法包括两大核心功能单元：多模态识别单元及Q学习单元，通过多模态识别单元对无人机搭载的电扫描天线检测所得数据进行分析，确定当前环境模态，从而实时调整Q学习算法参数以及无人机飞行步长，实现对检测距离、定位精度、定位时间的优化。本发明专利技术将模式识别思想与传统Q学习方法相结合，实现学习算法能够随环境变化动态可调，从而能够在环境噪声未知，干扰源信息未知的情况下实现对干扰源的远距离、快速、高精度定位。

A system and method of UAV location interference source based on multimodal Q-learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态Q学习的无人机定位干扰源系统及方法
本专利技术属于机器学习和频谱监测
，具体涉及一种基于多模态Q学习的无人机定位干扰源系统及方法。
技术介绍
近年来，随着无线通信技术日益发展，干扰源对许多领域也产生了日趋严峻的影响，如干扰航空铁路通信，干扰广播信号，干扰重大赛事活动，严重危害社会安全，造成重大财产损失。然而，传统地面检测定位由于易受多径效应影响，定位精度低，速度慢。卫星定位则存在成本高，定位方式复杂且无法实现全天候定位的问题。而无人机平台则有成本低，灵活性强，具有一定载荷能力且飞行范围在低空的特性，可以降低多径效应影响。对于定位干扰源问题，在现实检测定位中，无人机所处环境复杂多变，例如噪声随机不固定，且干扰源发射信号功率随距离衰减。因此，一个关键的技术挑战是，如何让定位算法具有环境适应能力，且能够在对干扰源信息位置的情况下实现高精度，远距离，低耗时的干扰源定位。然而，现有大部分基于无人机平台的干扰源定位算法需要借助额外地面辅助设备或者需要提前了解环境、干扰源情况，而在现实定位检测中通常无法满足，而已有的无模型算法则多以天线接收功率作为无人机状态划分条件，在检测值超出预定值时，算法无法正常工作。同时，如果仅使用单一算法，对于复杂多变的环境，算法难以适应环境变化，易导致定位效率低下。因此，设计一种能够自适应环境，且高效、实际应用范围广的无人机定位干扰源方法就很有必要。
技术实现思路
本专利技术针对现有技术中的不足，提供一种基于多模态Q学习的无人机定位干扰源系统及方法...

【技术保护点】
1.一种基于多模态Q学习的无人机定位干扰源系统，其特征在于，包括：数据检测器、数据处理器、无人机平台和地面终端；所述数据检测器和数据处理器搭载在无人机平台上，数据检测器实时检测、获取环境数据，数据处理器根据数据检测器所得结果对环境数据进行处理分析，决定无人机的飞行方向和飞行步长，以及判断是否找到干扰源；所述无人机平台根据数据处理器给出的指令，执行飞行动作；所述地面终端接收实时检测数据、处理分析数据及无人机位置信息。/n

【技术特征摘要】
1.一种基于多模态Q学习的无人机定位干扰源系统，其特征在于，包括：数据检测器、数据处理器、无人机平台和地面终端；所述数据检测器和数据处理器搭载在无人机平台上，数据检测器实时检测、获取环境数据，数据处理器根据数据检测器所得结果对环境数据进行处理分析，决定无人机的飞行方向和飞行步长，以及判断是否找到干扰源；所述无人机平台根据数据处理器给出的指令，执行飞行动作；所述地面终端接收实时检测数据、处理分析数据及无人机位置信息。

2.如权利要求1所述的一种基于多模态Q学习的无人机定位干扰源系统，其特征在于：所述数据检测器包括GPS模块和电扫描天线。

3.如权利要求2所述的一种基于多模态Q学习的无人机定位干扰源系统，其特征在于：所述数据处理器包括多模态识别单元和Q学习单元，多模态识别单元包括对环境数据的感知以及基于模式识别思想的模态识别，Q学习单元根据多模态识别单元识别出的当前模态实现对Q学习算法的动态调整，确定无人机的飞行方向和飞行步长，并根据停止条件判断是否找到干扰源。

4.如权利要求3所述的一种基于多模态Q学习的无人机定位干扰源系统，其特征在于：所述多模态识别单元包括数据感知模块和模态识别模块，所述数据感知模块获取环境数据，对环境数据进行感知分析，所述模态识别模块通过模式识别的方法对感知的环境数据进行模态划分，划分方式如下：
f(d)＝{d→E}|{d＝D(d1,d2,d3…dn),E＝{E1,E2,E3…En}}
其中，d＝D(d1,d2,d3…dn)为无人机在当前状态下感知分析到的数据，{E1,E2,E3…En}为事先确定的模态，无人机当前具体模态E由模态识别函数f(d)确定是否达到某模态Ek的标准。

5.如权利要求4所述的一种基于多模态Q学习的无人机定位干扰源系统，其特征在于：所述Q学习单元包括回报函数模块、Q表更新模块和行为模块，所述回报函数模块采集用于模态识别判断的数据并根据当前所在模态及其对应的回报函数对数据进行处理，将处理后的数据作为Q学习回报值，回报函数动态可调，对于状态s与动作a，回报值r(s,a)表示为：
r(s,a)＝REi(a)
其中，REi(a)是根据当前环境调整即时回报函数所得出的回报值；
所述Q表更新模块根据当前模态、状态及Q函数...

【专利技术属性】
技术研发人员：吴光宇，黄洋，吴启晖，孙涵，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人