基于座舱图像实现声音音色自动调整的方法及系统技术方案

技术编号:35352699 阅读:18 留言:0更新日期:2022-10-26 12:23
本发明专利技术提供了一种基于座舱图像实现声音音色自动调整的方法及系统,方法包括:步骤1:基于车辆座舱内部的图像采集设备对座舱内的驾乘人员进行图像采集;步骤2:将所采集的图像传输到车载电脑进行图像分析,确定车辆座舱内部的人员区域分布;步骤3:当车载电脑接收到人员唤醒语音交互时,判断声音所来自区域,并基于所采集的图像对声音所来自区域的人员进行人员识别,调取人员信息;步骤4:对调取的人员信息进行信息分析,确定与对应人员进行声音交互反馈的匹配音色,以所述匹配音色输出声音交互反馈。通过图像采集及分析,确定人员区域分布以及人员信息,进而实现交互的音色匹配以及感情输出,提高交互的体验感。提高交互的体验感。提高交互的体验感。

【技术实现步骤摘要】
基于座舱图像实现声音音色自动调整的方法及系统


[0001]本专利技术涉及声音音色调整
,特别涉及一种基于座舱图像实现声音音色自动调整的方法及系统。

技术介绍

[0002]常见的智能语音交互助手都是按照默认方式与用户进行交互,或者是用户手动切换到自己喜欢的角色与用户进行交互,且在交互过程较为一板一眼,且无法动态调节声音情感,相对比较机械化,导致趣味性不足,不能很好的满足用户的体验效果。
[0003]因此,本专利技术提出一种基于座舱图像实现声音音色自动调整的方法及系统。

技术实现思路

[0004]本专利技术提供一种基于座舱图像实现声音音色自动调整的方法及系统,用以通过图像采集及分析,确定人员区域分布以及人员信息,进而实现交互的音色匹配以及输出,满足人员需求,提高交互的体验感。
[0005]本专利技术提供一种基于座舱图像实现声音音色自动调整的方法,包括:
[0006]步骤1:基于车辆座舱内部的图像采集设备对座舱内的驾乘人员进行图像采集;
[0007]步骤2:将所采集的图像传输到车载电脑进行图像分析,确定所述车辆座舱内部的人员区域分布;
[0008]步骤3:当车载电脑接收到人员唤醒语音交互时,判断声音所来自区域,并基于所采集的图像对声音所来自区域的人员进行人员识别,调取人员信息;
[0009]步骤4:对调取的人员信息进行信息分析,确定与对应人员进行声音交互反馈的匹配音色,以所述匹配音色输出声音交互反馈。
[0010]优选的,所述人员信息包括:性别、年龄、情绪以及与确定在所述车辆座舱内部的人员区域分布。
[0011]优选的,对调取的人员信息进行信息分析,确定与对应人员进行声音交互反馈的匹配音色,以所述匹配音色输出声音交互反馈,包括:
[0012]基于默认音色策略,并根据所述人员信息中的性别、年龄以及与确定在所述车辆座舱内部的人员区域分布,确定与对应人员进行声音交互反馈的匹配音色;
[0013]基于默认情绪策略,获取与所述人员信息中的情绪所匹配的感情附加音色,并基于所述匹配音色以及感情附加音色,将所述声音交互反馈进行输出。
[0014]优选的,还包括:
[0015]采用用户自定义方式,对所述默认音色策略或默认情绪策略进行修改。
[0016]优选的,所述图像采集设备包括相机在内。
[0017]优选的,所述默认音色策略为:
[0018]当年龄属于儿童范围时,对应女性温柔声音;
[0019]当年龄属于成年范围,且性别为女性时,对应男性声音;
[0020]当年龄属于成年范围,且性别为男性时,对应女性声音。
[0021]优选的,所述默认情绪策略为:
[0022]当情绪为开心时,采用开心的情绪对应的音色作为感情附加音色;
[0023]当情绪为难过、伤心、愤怒时,采用安抚关怀的情绪对应的音色作为感情附加音色。
[0024]本专利技术提供一种基于座舱图像实现声音音色自动调整的系统,包括:
[0025]图像采集设备,用于基于对座舱内的驾乘人员进行图像采集;
[0026]车载电脑,用于将所采集的图像传输到车载电脑进行图像分析,确定所述车辆座舱内部的人员区域分布;
[0027]所述车载电脑,还用于当车载电脑接收到人员唤醒语音交互时,判断声音所来自区域,并基于所采集的图像对声音所来自区域的人员进行人员识别,调取人员信息;
[0028]所述车载电脑,还用于对调取的人员信息进行信息分析,确定与对应人员进行声音交互反馈的匹配音色,以所述匹配音色输出声音交互反馈。
[0029]本专利技术提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行任一项所述方法的步骤。
[0030]本专利技术提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行任一项所述方法的步骤。
[0031]与现有技术相比,本申请的有益效果如下:
[0032]通过图像采集及分析,确定人员区域分布以及人员信息,进而实现交互的音色匹配以及输出,提高交互的体验感。
[0033]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、以及附图中所特别指出的结构来实现和获得。
[0034]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0035]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0036]图1为本专利技术实施例中一种基于座舱图像实现声音音色自动调整的方法;
[0037]图2为本专利技术实施例中一种基于座舱图像实现声音音色自动调整的系统的结构图。
具体实施方式
[0038]下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0039]本专利技术提供一种基于座舱图像实现声音音色自动调整的方法,在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具
有任何限制含义。
[0040]针对本专利技术一种基于座舱图像实现声音音色自动调整的方法的应用场景包括终端设备101、服务器102、和数据存储系统103。其中,终端设备101、服务器102以及数据存储系统103之间均可通过有线或无线的通信网络连接。终端设备101包括但不限于桌面计算机、移动电话、移动电脑、平板电脑、媒体播放器、智能可穿戴设备视、个人数字助理或其它能够实现上述功能的电子设备等。服务器102和数据存储系统103均可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0041]需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
[0042]在一个实施例中,本专利技术提供一种基于座舱图像实现声音音色自动调整的方法,如图1所示,包括:
[0043]步骤1:基于车辆座舱内部的图像采集设备对座舱内的驾乘人员进行图像采集;
[0044]步骤2:将所采集的图像传输到车载电脑进行图像分析,确定所述车辆座舱内部的人员区域分布;
[0045]步骤3:当车载电脑接收到人员唤醒语音交互时,判断声音所来自区域,并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于座舱图像实现声音音色自动调整的方法,其特征在于,包括:步骤1:基于车辆座舱内部的图像采集设备对座舱内的驾乘人员进行图像采集;步骤2:将所采集的图像传输到车载电脑进行图像分析,确定所述车辆座舱内部的人员区域分布;步骤3:当车载电脑接收到人员唤醒语音交互时,判断声音所来自区域,并基于所采集的图像对声音所来自区域的人员进行人员识别,调取人员信息;步骤4:对调取的人员信息进行信息分析,确定与对应人员进行声音交互反馈的匹配音色,以所述匹配音色输出声音交互反馈。2.如权利要求1所述的基于座舱图像实现声音音色自动调整的方法,其特征在于,所述人员信息包括:性别、年龄、情绪以及与确定在所述车辆座舱内部的人员区域分布。3.如权利要求1所述的基于座舱图像实现声音音色自动调整的方法,其特征在于,对调取的人员信息进行信息分析,确定与对应人员进行声音交互反馈的匹配音色,以所述匹配音色输出声音交互反馈,包括:基于默认音色策略,并根据所述人员信息中的性别、年龄以及与确定在所述车辆座舱内部的人员区域分布,确定与对应人员进行声音交互反馈的匹配音色;基于默认情绪策略,获取与所述人员信息中的情绪所匹配的感情附加音色,并基于所述匹配音色以及感情附加音色,将所述声音交互反馈进行输出。4.如权利要求3所述的基于座舱图像实现声音音色自动调整的方法,其特征在于,还包括:采用用户自定义方式,对所述默认音色策略或默认情绪策略进行修改。5.如权利要求1所述的基于座舱图像实现声音音色自动调整的方法,其特征在于,所述图像采集设备...

【专利技术属性】
技术研发人员:由帅
申请(专利权)人:珠海市魅族科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1