一种基于人工智能的障碍物检测方法技术

技术编号:27827974 阅读:13 留言:0更新日期:2021-03-30 11:19
本发明专利技术公开了一种基于人工智能的障碍物检测方法。该方法包括:根据光照度将采集的生活场景数据集划分为标准光照度的第二风格数据集和其他光照度的第一风格数据集;以设定的损失函数为目标训练循环对抗网络,该循环对抗网络包括第一生成器、第二生成器、第一鉴别器和第二鉴别器,其中,第一生成器用于转换第一风格数据集并传递至第一鉴别器,第二生成器用于转换第二风格数据集并传递至第二鉴别器,第一鉴别器和第二鉴别器用于判断接收到图像是否符合对应的目标风格;利用经训练的第一生成器处理待检测图像,并输出至目标检测网络进行障碍物检测。本发明专利技术解决了导盲技术面临的复杂光照情景下的目标检测鲁棒性差和准确度低的难题。难题。难题。

【技术实现步骤摘要】
一种基于人工智能的障碍物检测方法


[0001]本专利技术涉及自然图像处理
,更具体地,涉及一种基于人工智能的障碍物检测方法。

技术介绍

[0002]根据中国残联的统计,目前我国至少有500万盲人,并且随着人口老龄化加剧,盲人数量也在逐年增加。到2050年,世界盲人数量预计会达到7.03亿。“为盲人导盲”一直是热点研究问题,从传统的导盲杖,导盲犬,到如今的各种导盲机器人。传统的导盲设备多以超声波、红外等模块作为主要传感器,通过探测障碍物距离、方位实现简单的避障提醒,但能传递给盲人的信息有限;基于传统算法的机器视觉导盲方案,对于盲人生活场景图像信息庞大复杂的情况难以处理。当前,随着人工智能的兴起,机器视觉在导盲设备中的应用又重新回到了大众的视野中,深度学习、卷积神经网络的出现使传统的机器视觉面临的图像复杂难以处理的问题得到一定程度的解决。
[0003]近几年,基于深度学习的目标检测手段在自然图像处理领域已经取得了十分良好的效果,被广泛应用于各个领域,如无人驾驶应用场景等,而作为改善盲人生活质量的导盲领域,这一方法也有很大的应用价值与潜力。
[0004]在现有技术中,基于深度目标检测的导盲技术大多数将采集的图像上传服务器,然后用有监督或无监督的方法训练网络进行处理,再结合其他传感信息进行导盲。这类方法充分利用了深度学习处理复杂图像的优势,在一般的导盲情景下,有很不错的表现。实验表明,通过深度学习,导盲设备能对盲人生活场景中的常见物体,如垃圾桶,椅子,人等较为准确地识别。然而,现有方法通常都是在完善的数据集下训练的,所针对的图像需要明暗适度,清晰合理,或是专门应用黑夜的数据集,而对于盲人生活场景中可能出现的各种光照变化没有良好的鲁棒性。
[0005]总之,现有技术的缺陷主要体现在:传统无视觉方法通常应用超声、红外传感器,对障碍物的判断仅局限于方位距离,而且精度较低;传统机器视觉主要利用事先写好的算法,对图像中的目标进行特征识别,这种方法迁移能力不强,不具有智能性;基于深度学习的机器视觉方法通过数据集训练学习图像的特征,能够识别各种场景的图像,并进行目标检测,检测效果也十分不错,但是图像场景的明暗变化也会对其准确性造成影响,以及增加训练的难度。

技术实现思路

[0006]本专利技术的目的是克服上述现有技术的缺陷,提供一种基于人工智能的障碍物检测方法,通过引入循环生成对抗网络对图像预处理,设计了在复杂光照下具有鲁棒性的新颖的障碍物检测方案。
[0007]本专利技术提供一种基于人工智能的障碍物检测方法,该方法包括以下步骤:
[0008]根据光照度将采集的生活场景数据集划分为标准光照度的第二风格数据集和其
他光照度的第一风格数据集;
[0009]以设定的损失函数为目标训练循环对抗网络,该循环对抗网络包括第一生成器、第二生成器、第一鉴别器和第二鉴别器,其中,第一生成器用于转换第一风格数据集并传递至第一鉴别器,第二生成器用于转换第二风格数据集并传递至第二鉴别器,第一鉴别器和第二鉴别器用于判断接收到图像是否符合对应的目标风格;
[0010]利用经训练的第一生成器处理待检测图像,并输出至目标检测网络进行障碍物检测。
[0011]与现有技术相比,本专利技术的优点在于,针对视障人群生活场景图像的光照度复杂多变的特点,设计基于人工智能的多照度目标检测技术,通过循环对抗网络对图像预处理,解决了导盲技术面临的复杂光照情景下的目标检测鲁棒性差和准确度低的难题,实现多照度情景下的准确障碍物检测。
[0012]通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。
附图说明
[0013]被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。
[0014]图1是根据本专利技术一个实施例的基于人工智能的障碍物检测方法的系统框架图;
[0015]图2是根据本专利技术一个实施例的基于人工智能的障碍物检测方法的流程图。
具体实施方式
[0016]现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。
[0017]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。
[0018]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0019]在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
[0020]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0021]参见图1所示,本专利技术提供的基于人工智能的障碍物检测的总体系统框架包括图像获取模块、图像预处理模块和目标检测模块。
[0022]图像获取模块用于采集真实生活场景的图像,例如,针对导盲障碍物检测的情景是视障人士的常见生活场景,可通过摄像头模组采集真实的场景图像,得到待检测的不同光照度下的图像。在实际应用中,摄像头模组可制作成导盲眼镜,通过使用者佩戴在眼睛前模拟眼睛看物体,实现图像采集。
[0023]图像预处理模块用于对不同光照度的图像进行处理,实现对图像的光照度度归一
化,以提高后续的目标检测精确性,并且提高针对不同光照度图像的鲁棒性。
[0024]图像预处理模块基于循环对抗网络(CycleGAN)实现,包括两个生成器,标记为G
A
和G
B
,两个鉴别器,标记为D
A
、D
B
,在训练过程中,循环对抗网络利用不同风格的两个数据集进行对抗式训练,以能够应用于不同光照度的图像处理。
[0025]具体地,对包含各种光照度的盲人生活场景数据集进行分类,选出部分自定义的标准光照度的图像,将其归为B风格数据集,而将其他各种光照度的图像归为A风格数据集。
[0026]生成器G
A
、G
B
用于将输入的数据集转换成不同风格。例如,生成器由编码器、转换器和解码器构成。对于生成器G
A
,以A风格数据集作为输入,编码器利用卷积神经网络从输入图像中提取特征,转换器通过组合图像的不相近特征,将图像在A风格数据集中的特征向量转换为B风格数据集中的特征向量。解码器利用反卷积层完成从特征向量中还原出低级特征的工作,最后得到生成图像。类似地,生成器G
B
以B风格数据集作为输入,以将B风格数据集中的特征向量转换为A风格数据集中的特征向量。
[0027]鉴别器D
A
、D
B
用于判断来自于相应生成器的输入图像是否符合目标风格。鉴别器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的障碍物检测方法,包括以下步骤:根据光照度将采集的生活场景数据集划分为标准光照度的第二风格数据集和其他光照度的第一风格数据集;以设定的损失函数为目标训练循环对抗网络,该循环对抗网络包括第一生成器、第二生成器、第一鉴别器和第二鉴别器,其中,第一生成器用于转换第一风格数据集并传递至第一鉴别器,第二生成器用于转换第二风格数据集并传递至第二鉴别器,第一鉴别器和第二鉴别器用于判断接收到图像是否符合对应的目标风格;利用经训练的第一生成器处理待检测图像,并输出至目标检测网络进行障碍物检测。2.根据权利要求1所述的方法,其中,根据以下步骤确定第一风格数据集和第二风格数据集:通过摄像头模组采集真实的场景图像,得到不同光照度下的图像;对包含各种光照度的生活场景数据集进行分类,选出部分自定义的标准光照度的图像,将其归为第二风格数据集,并将其他各种光照度的图像归为第一风格数据集。3.根据权利要求1所述的方法,其中,第一生成器和第二生成器包括编码器、转换器和解码器,编码器利用卷积神经网络从输入图像中提取特征;转换器用于通过组合图像的不相近特征,将输入的风格数据集中的特征向量进行转换;解码器利用反卷积层从特征向量中还原出低...

【专利技术属性】
技术研发人员:秦文健张旺曾光何佳慧
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1