一种语音播报方法、装置和车辆制造方法及图纸

技术编号:36462899 阅读:12 留言:0更新日期:2023-01-25 23:02
本发明专利技术公开了一种语音播报方法、装置和车辆,其中方法包括获取车辆的语音播报需求指令,得到对应的待播报文本;根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态;根据所述情绪状态,确定用于表征语音的声学特征,所述声学特征至少包括频段范围;基于所述频段范围,控制对应的所述振动传感器工作,以播报所述待播报文本。本发明专利技术实施例提供的语音播报方法、装置和车辆,通过在座椅靠背上设置若干振动传感器,对用户的情绪状态进行智能分析,控制对应位置的振动传感器工作,优化了音频的表现形式,解决了现有的车辆语音播报单一的技术问题,提高了用户的用车体验。提高了用户的用车体验。提高了用户的用车体验。

【技术实现步骤摘要】
一种语音播报方法、装置和车辆


[0001]本专利技术涉及车辆控制
,尤其是涉及一种语音播报方法、装置和车辆。

技术介绍

[0002]随着社会的进步和人们生活水平的逐步提高,车辆作为一种便捷的代步工具逐渐受到市场的认可与消费者的青睐。
[0003]当前汽车上的语音播报普遍采用的是系统默认风格的发音人播报,音频的表现形式单一,无法根据用户的需求进行智能切换,用户在听了长时间音频后通常会感到枯燥,导致用户体验较差,用车体验降低。

技术实现思路

[0004]本专利技术提供一种语音播报方法、装置和车辆,以解决现有的车辆语音播报单一的技术问题,通过在座椅靠背上设置若干振动传感器,对用户的情绪状态进行智能分析,控制对应位置的振动传感器工作,优化了音频的表现形式,提高了用户的用车体验。
[0005]为了解决上述技术问题,本专利技术实施例提供了一种语音播报方法,适用于座椅靠背上设有若干振动传感器的车辆中,包括:
[0006]获取车辆的语音播报需求指令,得到对应的待播报文本;
[0007]根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态;
[0008]根据所述情绪状态,确定用于表征语音的声学特征,其中,所述声学特征至少包括频段范围;
[0009]基于所述频段范围,控制对应的所述振动传感器工作,以播报所述待播报文本。
[0010]作为其中一种优选方案,在所述获取车辆的语音播报需求指令,得到对应的待播报文本前,所述方法还包括
[0011]基于用户发布的语音指令,生成对应的语音播报需求指令;或,
[0012]基于识别到的车辆控制信号,生成对应的语音播报需求指令;或,
[0013]基于当前车辆的导航位置坐标,生成对应的语音播报需求指令;或,
[0014]基于当前路况,生成对应的语音播报需求指令。
[0015]作为其中一种优选方案,所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态,具体包括:
[0016]控制车载摄像头获取用户的人脸图像;
[0017]对所述人脸图像进行卷积神经网络分析,基于所述人脸图像中的人脸特征点的变化轨迹,确定对应的所述情绪状态。
[0018]作为其中一种优选方案,所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态,具体还包括:
[0019]对所述待播报文本进行文字分段截取;
[0020]将各个截取段落输入至预设的敏感词库中,根据文字的匹配度,确定对应的所述情绪状态。
[0021]作为其中一种优选方案,所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态,具体还包括:
[0022]对所述位置坐标进行分析,得到当前车辆的场景,其中,所述场景至少包括拥堵路段场景和通畅路段场景;
[0023]根据当前车辆的场景,确定对应的所述情绪状态。
[0024]作为其中一种优选方案,所述声学特征还包括语速特征、韵律特征和停顿特征。
[0025]作为其中一种优选方案,所述情绪状态至少包括高兴状态、悲伤状态、害怕状态、愤怒状态和无感情状态;
[0026]所述愤怒状态对应的所述频段范围为20

8000Hz;
[0027]所述无感情状态对应的所述频段范围为8000

10000Hz;
[0028]所述害怕状态对应的所述频段范围为10000

12000Hz;
[0029]所述悲伤状态对应的所述频段范围为12000

15000Hz;
[0030]所述高兴状态对应的所述频段范围为15000

20000Hz。
[0031]作为其中一种优选方案,所述基于所述频段范围,控制对应的所述振动传感器工作,以播报所述待播报文本,具体包括:
[0032]若所述频段范围为20

8000Hz,则控制设置于座椅靠背中心位置的第一振动传感器工作,以播报所述待播报文本;
[0033]若所述频段范围为8000

10000Hz,则分别控制设置于座椅靠背中心位置的第一振动传感器、设置于座椅靠背顶部位置的第二振动传感器和设置于座椅靠背底部位置的第三振动传感器工作,以播报所述待播报文本;
[0034]若所述频段范围为10000

12000Hz,则分别控制设置于座椅靠背中心位置的第一振动传感器、设置于座椅靠背左侧位置的第四振动传感器和设置于座椅靠背右侧位置的第五振动传感器工作,以播报所述待播报文本;
[0035]若所述频段范围为12000

15000Hz,则分别控制设置于座椅靠背顶部位置的第二振动传感器、设置于座椅靠背底部位置的第三振动传感器、设置于座椅靠背左侧位置的第四振动传感器和设置于座椅靠背右侧位置的第五振动传感器工作,以播报所述待播报文本;
[0036]若所述频段范围为15000

20000Hz,则分别控制设置于座椅靠背中心位置的第一振动传感器、设置于座椅靠背顶部位置的第二振动传感器、设置于座椅靠背底部位置的第三振动传感器、设置于座椅靠背左侧位置的第四振动传感器和设置于座椅靠背右侧位置的第五振动传感器工作,以播报所述待播报文本。
[0037]本专利技术另一实施例提供了一种语音播报装置,适用于座椅靠背上设有若干振动传感器的车辆中,包括车载T

Box,所述车载T

Box被配置为:
[0038]获取车辆的语音播报需求指令,得到对应的待播报文本;
[0039]根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态;
[0040]根据所述情绪状态,确定用于表征语音的声学特征,其中,所述声学特征包括频段
范围;
[0041]基于所述频段范围,控制对应的所述振动传感器工作,以播报所述待播报文本。
[0042]本专利技术再一实施例提供了一种车辆,所述车辆的座椅靠背上设有若干振动传感器;
[0043]所述车辆被配置为实现如上所述的语音播报方法,或所述车辆包括如上所述的语音播报装置。
[0044]相比于现有技术,本专利技术实施例的有益效果在于以下所述中的至少一点:
[0045](1)对车辆中的用户情绪状态进行智能分析,通过当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,从脸部特征、文本特征和环境特征三个维度准确推测用户的情绪状态,从而能够得到用户的情绪,进而通过对应的高兴、温柔、平静、悲伤等情感播报风格,为用户提供相同情感或互补情感的播报,引起用户情感共鸣或安慰用户,实现智能化的语音播报;
[0046](2)对语音的传播进行改进,通过类似骨传导本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音播报方法,适用于座椅靠背上设有若干振动传感器的车辆中,其特征在于,包括:获取车辆的语音播报需求指令,得到对应的待播报文本;根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态;根据所述情绪状态,确定用于表征语音的声学特征,其中,所述声学特征至少包括频段范围;基于所述频段范围,控制对应的所述振动传感器工作,以播报所述待播报文本。2.如权利要求1所述的语音播报方法,其特征在于,在所述获取车辆的语音播报需求指令,得到对应的待播报文本前,所述方法还包括:基于用户发布的语音指令,生成对应的语音播报需求指令;或,基于识别到的车辆控制信号,生成对应的语音播报需求指令;或,基于当前车辆的导航位置坐标,生成对应的语音播报需求指令;或,基于当前路况,生成对应的语音播报需求指令。3.如权利要求1所述的语音播报方法,其特征在于,所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态,具体包括:控制车载摄像头获取用户的人脸图像;对所述人脸图像进行卷积神经网络分析,基于所述人脸图像中的人脸特征点的变化轨迹,确定对应的所述情绪状态。4.如权利要求1所述的语音播报方法,其特征在于,所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态,具体还包括:对所述待播报文本进行文字分段截取;将各个截取段落输入至预设的敏感词库中,根据文字的匹配度,确定对应的所述情绪状态。5.如权利要求1所述的语音播报方法,其特征在于,所述根据当前用户的人脸图像、所述待播报文本的文本内容和当前车辆的位置坐标,确定用户的情绪状态,具体还包括:对所述位置坐标进行分析,得到当前车辆的场景,其中,所述场景至少包括拥堵路段场景和通畅路段场景;根据当前车辆的场景,确定对应的所述情绪状态。6.如权利要求1所述的语音播报方法,其特征在于,所述声学特征还包括语速特征、韵律特征和停顿特征。7.如权利要求1所述的语音播报方法,其特征在于,所述情绪状态至少包括高兴状态、悲伤状态、害怕状态、愤怒状态和无感情状态;所述愤怒状态对应的所述频段范围为20

8000Hz;所述无感情状态对应的所述频段范围为8000

10000Hz;所述害怕状态对应的所述频段范围为10000

12000Hz;所述悲伤状态对应的所述频段范围为12000
...

【专利技术属性】
技术研发人员:李兆全许为康武子平汪华锋张盼盼邓晨
申请(专利权)人:星河智联汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1