一种根据人脸特征点计算的动态音量调节方法技术

技术编号:32857117 阅读:64 留言:0更新日期:2022-03-30 19:29
本发明专利技术公开了一种根据人脸特征点计算的动态音量调节方法,包括以下步骤:S1、通过用户人像录入模块录入用户人脸,并存储在用户数据库中,作为后期行人跟踪和人脸识别的基础数据;S2、通过用户跟踪模块对用户进行实时的行人跟踪;S3、通过人脸框检测模块获取人脸图像的位置和大小。本发明专利技术中,综合利用成熟的人脸识别、人脸关键点检测和行人跟踪技术,由音箱内部系统对用户的人脸关键点实时检测,然后根据关键点信息对播放音量做出智能调节,结合用户已录入的个人信息如性别年龄做辅助,最终进行音量调节,解放用户双手和对音箱的关注度。解放用户双手和对音箱的关注度。解放用户双手和对音箱的关注度。

【技术实现步骤摘要】
一种根据人脸特征点计算的动态音量调节方法


[0001]本专利技术涉及智能语音
,尤其涉及一种根据人脸特征点计算的动态音量调节方法。

技术介绍

[0002]近年来随着人工智能技术的飞速发展,尤其是语音识别、自然语言处理和语音文本三项智能语音重点核心技术的发展,智能语音可以通过声音采集、语音识别、自然语言理解、语音合成等关键环节,实现人机对话、人机交互、智能判断决策等一系列动作,智能语音的应用领域也在不断拓展,如智能家居、智能车载系统、智能机器人、AI教育、智能客服等,智能语音的核心是人机交互,已经成为国内外科技企业重点关注的应用领域。
[0003]在人机交互中的音量调节一般经历三个步骤:(1)人的语音信号被智能设备转换成文字;(2)这些文字的真实语义被机器所理解,比如增加音量指令等;(3)理解后音箱会根据指令做出反应也会将输出结果会自动合成为语音返回给用户,这三步流程分别对应的是语音识别、自然语言处理和语音合成技术,虽然,利用人机语音交互的智能音箱已经有很多应用实例,其中比较优秀的智能音箱也已经能够满足用户基本需求的语音交互能力,完本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种根据人脸特征点计算的动态音量调节方法,其特征在于,包括以下步骤:S1、通过用户人像录入模块录入用户人脸,并存储在用户数据库中,作为后期行人跟踪和人脸识别的基础数据;S2、通过用户跟踪模块对用户进行实时的行人跟踪;S3、通过人脸框检测模块获取人脸图像的位置和大小,并给出用户选择“是否识别为指定人脸?”,用户选择“是否识别为指定人脸?”为“是”时,人脸框检测模块对数据流内的人脸进行检测后,返回全部不同的人脸区域做行人跟踪;S4、在人脸框检测模块输出的全部人脸区域中,对用户人脸进行跟踪,利用人脸识别模块对用户数据库中该用户的注册人脸进行比对,判断是否为已注册的用户,若是,则进入人脸关键点检测流程,若否,则进入新用户注册环节;S5、对于人脸检测模块检测到实时数据流中的用户人脸进行裁剪,裁剪后的人脸部分图像输入人脸关键点检测模块,通过人脸关键点检测模块定位人脸面部的关键区域信息,并输出人脸部分图像中人脸的关键点坐标及旋转角度;S6、音量调节模块通过获得人脸的关键点坐标及旋转角度,估算用户与音箱的距离范围,音量调节模块的音量调节范围设置为八个等级,对应八个不同的距离范围,当用户的实时距离在对应的等级范围内不变时,音量保持不变,当用户的实时距离在对应的等级范围内发生变化时,音量自动调节到对应距离范围对应的音量。2.根据权利要求1所述的一种根据人脸特征点计算的动态音量调节方法,其特征在于,在通过用户人像录入模块对用户人脸进行录入时,用户跟踪模块跟踪数据流中人脸部分最大的目标,并将注册用户的人脸保存在用户数据库内,完成新用户的注册;在用户跟踪模块不对用户进行行人跟踪调节音量使用时,在步骤S3中,若用户选择“是否指定...

【专利技术属性】
技术研发人员:陈再蝶朱晓秋刘明锋樊伟东
申请(专利权)人:浙江康旭科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1