一种数字机器人语音交流控制方法及系统技术方案

技术编号:40596803 阅读:27 留言:0更新日期:2024-03-12 21:59
本发明专利技术公开了一种数字机器人语音交流控制方法及系统,通过构建人脸识别模型和自然语言生成模型,依据人脸识别模型对人脸图像进行识别,得到人脸特征,并依据自然语言生成模型对人脸特征进行识别,得到相匹配的语言文本,最后再通过文本转语音技术将语言文本转换成语音进行输出,能够有效根据不同情景调整相对应的语言输出,从而使得语音交流适应性和自然感更加强,同时,通过采用计算机视觉技术获取人脸图像,能够提高获取人脸图像的清晰度,从而提高人脸识别的精准度和速度,进一步提高根据不同情景调整相对应语言输出的精准度和速度。

【技术实现步骤摘要】

本专利技术涉及数字机器人,尤其涉及一种数字机器人语音交流控制方法及系统


技术介绍

1、随着计算机技术的发展,各种类型的数字机器人被广泛地应用于人们生活的各个方面,例如,数字机器人通过语音来与别人进行打招呼或者交流,然而,现有的数字机器人语音交流控制方式一般都是通过预设的语音模板进行交流,导致缺乏适应性和自然感,尤其在面对不熟悉的人或者是没有预设应答模板的情况下,其回应往往会显得生硬、机械,同时,还不能根据不同情境调整语言输出,影响交流体验。


技术实现思路

1、有鉴于此,本专利技术提出一种数字机器人语音交流控制方法及系统,可以解决现有技术所存在的缺乏适应性和自然感、无法根据不同情境调整语言输出的缺陷。

2、本专利技术的技术方案是这样实现的:

3、一种数字机器人语音交流控制方法,具体包括:

4、构建人脸识别模型和自然语言生成模型;

5、基于计算机视觉技术获取人脸图像;

6、将人脸图像输入人脸识别模型中进行识别,得到人脸特征;

7、将人脸特征本文档来自技高网...

【技术保护点】

1.一种数字机器人语音交流控制方法,其特征在于,具体包括:

2.根据权利要求1所述的一种数字机器人语音交流控制方法,其特征在于,所述构建人脸识别模型,具体包括:

3.根据权利要求2所述的一种数字机器人语音交流控制方法,其特征在于,所述将训练集输入FaceNet模型中,并依据三元损失训练策略进行训练,得到初始的人脸识别模型,具体包括:

4.根据权利要求3所述的一种数字机器人语音交流控制方法,其特征在于,所述基于人脸特征进行人脸图像选择,选择出锚点样本、正样本和负样本,具体包括:

5.根据权利要求4所述的一种数字机器人语音交流控制方法,其特征在...

【技术特征摘要】

1.一种数字机器人语音交流控制方法,其特征在于,具体包括:

2.根据权利要求1所述的一种数字机器人语音交流控制方法,其特征在于,所述构建人脸识别模型,具体包括:

3.根据权利要求2所述的一种数字机器人语音交流控制方法,其特征在于,所述将训练集输入facenet模型中,并依据三元损失训练策略进行训练,得到初始的人脸识别模型,具体包括:

4.根据权利要求3所述的一种数字机器人语音交流控制方法,其特征在于,所述基于人脸特征进行人脸图像选择,选择出锚点样本、正样本和负样本,具体包括:

5.根据权利要求4所述的一种数字机器人语音交流控制方法,其特征在于,所述构建自然语言生成模型,...

【专利技术属性】
技术研发人员:庄勤泓廖红俊刘建友余展鹏胡世威刘崇雷黄震林加浩
申请(专利权)人:广州凯迪云信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1