一种公共场所数字人防误唤醒方法、相关装置和存储介质制造方法及图纸

技术编号:31716767 阅读:9 留言:0更新日期:2022-01-01 11:23
本发明专利技术提供一种公共场所数字人防误唤醒方法、相关装置和存储介质,该方法,包括:实时采集音频信息和活体人脸信息;基于音频信息判断是否依次采集到初步唤醒信息和深度唤醒信息,以及,判断是否检测到活体人脸信息;若依次采集到初步唤醒信息和深度唤醒信息且检测到活体人脸信息,控制数字人唤醒;需要分别满足上述多个条件之后,才控制数字人唤醒,另外,该深度唤醒信息为在采集到初步唤醒信息后输出的唤醒询问信息,其对应的唤醒确定信息;也就是说,在获取到初步唤醒信息之后,还需要与用户进行一个问答的过程,以确认用户唤醒数字人的需求;并不是由用户单方面的音频或人脸图像进行唤醒,降低了误唤醒率,降低数字人的耗能。降低数字人的耗能。降低数字人的耗能。

【技术实现步骤摘要】
一种公共场所数字人防误唤醒方法、相关装置和存储介质


[0001]本专利技术属于人工智能
,更具体的说,尤其涉及一种公共场所数字人防误唤醒方法、相关装置和存储介质。

技术介绍

[0002]随着科学技术的不断进步和数字人技术的不断发展,数字人已逐渐走入千家万户,市场上也出现了不少数字人,给人们的生活带来便利和乐趣,其中,交互机器人作为智能机器人的一种,能够和人们互动,给人们的生活提供了便利。
[0003]随着社会生产力的发展和生活水平的提高,人们将越来越多的时间用于休闲和娱乐,从而极大的促进了服务业的发展。近年来,公共场所,比如机场和商城,人口流动剧增。
[0004]目前,数字人在公共场所只采用红外人体监测误唤醒概率非常高,只采用关键信息唤醒,因为场所内人员交流信息和广播信息到处都是,误唤醒概率也非常高。也即,数字人长时间处于唤醒状态,误唤醒率较大,其耗能较大。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种公共场所数字人防误唤醒方法、相关装置和存储介质,用于降低误唤醒率,降低数字人的耗能。
[0006]本申请第一方面公开了一种公共场所数字人防误唤醒方法,包括:
[0007]实时采集音频信息和活体人脸信息;
[0008]基于所述音频信息判断是否依次采集到初步唤醒信息和深度唤醒信息,以及,判断是否检测到所述活体人脸信息;其中,所述深度唤醒信息为在采集到所述初步唤醒信息后输出的唤醒询问信息,其对应的唤醒确定信息;
[0009]若依次采集到所述初步唤醒信息和所述深度唤醒信息且检测到所述活体人脸信息,控制所述数字人唤醒。
[0010]可选的,在上述公共场所数字人防误唤醒方法中,基于所述音频信息判断是否依次采集到初步唤醒信息和深度唤醒信息,包括:
[0011]基于所述音频信息判断是否采集到预设的唤醒关键字信息;所述唤醒关键字信息为所述初步唤醒信息;
[0012]若是,则启动交互应答模式、输出唤醒询问信息;
[0013]基于所述音频信息判断是否采集到所述唤醒询问信息对应的唤醒确定信息。
[0014]可选的,在上述公共场所数字人防误唤醒方法中,启动交互应答模式、输出唤醒询问信息,包括:
[0015]启动所述交互应答模式;
[0016]在启动所述交互应答模式的预设时长后,输出唤醒询问信息。
[0017]可选的,在上述公共场所数字人防误唤醒方法中,在启动所述交互应答模式的预设时长后,输出唤醒询问信息,包括:
[0018]若在启动所述交互应答模式的预设时长内采集到用户的咨询信息,则输出基于所述咨询信息的唤醒询问信息。
[0019]可选的,在上述公共场所数字人防误唤醒方法中,在启动所述交互应答模式的预设时长后,输出唤醒询问信息,包括:
[0020]若在启动所述交互应答模式的预设时长内未采集到用户的咨询信息,则输出预设的唤醒询问信息。
[0021]可选的,在上述公共场所数字人防误唤醒方法中,控制所述数字人唤醒,包括:
[0022]激活网络通信模式;并开始拾音发送到服务器,进行数字人服务。
[0023]可选的,在上述公共场所数字人防误唤醒方法中,判断是否检测到所述活体人脸信息,包括:
[0024]基于实时采集活体人脸信息时采集到的人脸图像信息,判断所述人脸图像信息是否为用户的正面人脸图像信息;
[0025]若是,则判定为检测到所述活体人脸信息;若否,则判定为未检测到所述活体人脸信息。
[0026]本申请第二方面公开了一种公共场所数字人防误唤醒装置,包括:
[0027]采集模块,用于实时采集音频信息和活体人脸信息;
[0028]判断模块,用于基于所述音频信息判断是否依次采集到初步唤醒信息和深度唤醒信息,以及,判断是否检测到所述活体人脸信息;所述深度唤醒信息为在采集到所述初步唤醒信息后输出的唤醒询问信息对应的唤醒确定信息;
[0029]唤醒模块,用于若依次采集到所述初步唤醒信息和所述深度唤醒信息且检测到所述活体人脸信息,控制所述数字人唤醒。
[0030]可选的,在上述公共场所数字人防误唤醒装置中,所述判断模块,包括:
[0031]第一判断单元,用于基于所述音频信息判断是否采集到预设的唤醒关键字信息;所述唤醒关键字信息为所述初步唤醒信息;
[0032]交互应答模块,用于若所述判断单元的判断结果为是,则启动交互应答模式、输出唤醒询问信息;
[0033]所述第一判断单元还用于基于所述音频信息判断是否采集到所述唤醒询问信息对应的唤醒确定信息。
[0034]可选的,在上述公共场所数字人防误唤醒装置中,交互应答模块用于启动交互应答模式、输出唤醒询问信息时,具体用于:
[0035]启动所述交互应答模式;
[0036]在启动所述交互应答模式的预设时长后,输出唤醒询问信息。
[0037]可选的,在上述公共场所数字人防误唤醒装置中,交互应答模块用于在启动所述交互应答模式的预设时长后,输出唤醒询问信息时,具体用于:
[0038]若在启动所述交互应答模式的预设时长内采集到用户的咨询信息,则输出基于所述咨询信息的唤醒询问信息。
[0039]可选的,在上述公共场所数字人防误唤醒装置中,交互应答模块在启动所述交互应答模式的预设时长后,输出唤醒询问信息时,具体用于:
[0040]若在启动所述交互应答模式的预设时长内未采集到用户的咨询信息,则输出预设
的唤醒询问信息。
[0041]可选的,在上述公共场所数字人防误唤醒装置中,唤醒模块用于控制所述数字人唤醒时,具体用于:
[0042]激活网络通信模式;并开始拾音发送到服务器,进行数字人服务。
[0043]可选的,在上述公共场所数字人防误唤醒装置中,所述判断模块还包括:
[0044]第二判断单元,用于基于实时采集活体人脸信息时采集到的人脸图像信息,判断所述人脸图像信息是否为用户的正面人脸图像信息;
[0045]若是,则判定为检测到所述活体人脸信息;若否,则判定为未检测到所述活体人脸信息。
[0046]本申请第三方面公开了一种电子设备,包括:
[0047]一个或多个处理器;
[0048]存储装置,其上存储有一个或多个程序;
[0049]当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如本申请第一方面任一项所述的公共场所数字人防误唤醒方法。
[0050]本申请第四方面公开了一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本申请第一方面任一项所述的公共场所数字人防误唤醒方法。
[0051]从上述技术方案可知,本专利技术提供的一种公共场所数字人防误唤醒方法,包括:包括:实时采集音频信息和活体人脸信息;基于音频信息判断是否依次采集到初步唤醒信息和深度唤醒信息,以及,判断是否检测到活体人脸信息;若依次采集到初步唤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种公共场所数字人防误唤醒方法,其特征在于,包括:实时采集音频信息和活体人脸信息;基于所述音频信息判断是否依次采集到初步唤醒信息和深度唤醒信息,以及,判断是否检测到所述活体人脸信息;其中,所述深度唤醒信息为在采集到所述初步唤醒信息后输出的唤醒询问信息,其对应的唤醒确定信息;若依次采集到所述初步唤醒信息和所述深度唤醒信息且检测到所述活体人脸信息,控制所述数字人唤醒。2.根据权利要求1所述的公共场所数字人防误唤醒方法,其特征在于,基于所述音频信息判断是否依次采集到初步唤醒信息和深度唤醒信息,包括:基于所述音频信息判断是否采集到预设的唤醒关键字信息;所述唤醒关键字信息为所述初步唤醒信息;若是,则启动交互应答模式、输出唤醒询问信息;基于所述音频信息判断是否采集到所述唤醒询问信息对应的唤醒确定信息。3.根据权利要求2所述的公共场所数字人防误唤醒方法,其特征在于,启动交互应答模式、输出唤醒询问信息,包括:启动所述交互应答模式;在启动所述交互应答模式的预设时长后,输出唤醒询问信息。4.根据权利要求3所述的公共场所数字人防误唤醒方法,其特征在于,在启动所述交互应答模式的预设时长后,输出唤醒询问信息,包括:若在启动所述交互应答模式的预设时长内采集到用户的咨询信息,则输出基于所述咨询信息的唤醒询问信息。5.根据权利要求3所述的公共场所数字人防误唤醒方法,其特征在于,在启动所述交互应答模式的预设时长后,输出唤醒询问信息,包括:若在启动所述交互应答模式的预设时长内未采集到用户的咨询信息,则输出预设的唤醒询问信息。6.根据权利要求1

【专利技术属性】
技术研发人员:王雨辰刘致远刘云峰
申请(专利权)人:深圳追一科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1