基于声纹和人脸识别的机器人交互方法技术

技术编号：14005606 阅读：107 留言：0更新日期：2016-11-16 23:35

本发明专利技术公开了一种基于声纹和人脸识别的机器人交互方法，其包括人脸识别部分和声纹识别部分；人脸识别部分是基于人的脸部特征，对输入的人脸图像或者视频流判断其是否存在人脸，来自用户集内哪位用户；声纹识别部分是通过一段语音信号来判断这段语音来自用户集内的哪位用户。本发明专利技术通过人脸识别技术、表情检测技术和声纹技术实现基于说话人身份和情绪的智能问答，能很好的与提问者进行交流。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种交互方法，特别是涉及一种基于声纹和人脸识别的机器人交互方法。
技术介绍
现有机器人问答系统的回答一般不考虑到提问者的身份，也不考虑提问者的表情和语气，做一个通用的回答，这种问答系统的智能化程度较低，不能很好的与提问者进行交流。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于声纹和人脸识别的机器人交互方法，其通过人脸识别技术、表情检测技术和声纹技术实现基于说话人身份和情绪的智能问答，能很好的与提问者进行交流。本专利技术是通过下述技术方案来解决上述技术问题的：一种基于声纹和人脸识别的机器人交互方法，其特征在于，其包括人脸识别部分和声纹识别部分；人脸识别部分是基于人的脸部特征，对输入的人脸图像或者视频流判断其是否存在人脸，存在人脸则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息，并依据这些信息，进一步提取每个人脸中所蕴涵的身份特征，并将其与已知的人脸进行对比，从而识别每个人脸的身份和表情，来自用户集内哪位用户；声纹识别部分是通过一段语音信号来判断这段语音来自用户集内的哪位用户，首先通过大量说话人的语料，进行系统模型空间训练，生成系统所需要的空间参数；然后对于需要识别的说话人进行注册，通过注册说话人声纹生成部分，生成用户集内每个注册说话人的声纹；最后，在实际应用中，对需要识别的说话人语音生成声纹，与用户集内每个注册说话人的声纹进行对比，得出是用户集内哪个说话人。优选地，所述人脸识别部分采用的是基于人工神经网络模式识别的方法，通过采集的样本图像，抽取相关特征，学习产生分类器。优选地，所述人脸识别部分具体包括以下三个步骤：步骤一，...
基于声纹和人脸识别的机器人交互方法

【技术保护点】
一种基于声纹和人脸识别的机器人交互方法，其特征在于，所述基于声纹和人脸识别的机器人交互方法包括人脸识别部分和声纹识别部分；人脸识别部分是基于人的脸部特征，对输入的人脸图像或者视频流判断其是否存在人脸，存在人脸则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息，并依据这些信息，进一步提取每个人脸中所蕴涵的身份特征，并将其与已知的人脸进行对比，从而识别每个人脸的身份和表情，来自用户集内哪位用户；声纹识别部分是通过一段语音信号来判断这段语音来自用户集内的哪位用户，首先通过大量说话人的语料，进行系统模型空间训练，生成系统所需要的空间参数；然后对于需要识别的说话人进行注册，通过注册说话人声纹生成部分，生成用户集内每个注册说话人的声纹；最后，在实际应用中，对需要识别的说话人语音生成声纹，与用户集内每个注册说话人的声纹进行对比，得出是用户集内哪个说话人。

【技术特征摘要】
1.一种基于声纹和人脸识别的机器人交互方法，其特征在于，所述基于声纹和人脸识别的机器人交互方法包括人脸识别部分和声纹识别部分；人脸识别部分是基于人的脸部特征，对输入的人脸图像或者视频流判断其是否存在人脸，存在人脸则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息，并依据这些信息，进一步提取每个人脸中所蕴涵的身份特征，并将其与已知的人脸进行对比，从而识别每个人脸的身份和表情，来自用户集内哪位用户；声纹识别部分是通过一段语音信号来判断这段语音来自用户集内的哪位用户，首先通过大量说话人的语料，进行系统模型空间训练，生成系统所需要的空间参数；然后对于需要识别的说话人进行注册，通过注册说话人声纹生成部分，生成用户集内每个注册说话人的声纹；最后，在实际应用中，对需要识别的说话人语音生成声纹，与用户集内每个注册说话人的声纹进行对比，得出是用户集内哪个说话人。2.如权利要求1所述的基于声纹和人脸识别的机器人交互方法，其特征在于，所述人脸识别部分采用的是基于人工神经网络模式识别的方法，通过采集的样本图像，抽取相关特征，学习产生分类器。3.如权利要求1所述的基于声纹和人脸识别的机器人交互方法，其特征在于，所述人脸识别部分具体包括以下三个步骤：步骤一，首先建立人脸的面像档案；即用摄像机采集单位人员的人脸的面像文件或取他们的照片形成面像文件，并将这些面像文件生成面纹编码贮存起来；步骤二，获取当前的人体面像；即用摄像机捕捉的当前出入人员的面像，或取照片输入，并将当前的面像文件生成面纹编码；步骤三，用当前的面纹编码与档案库存的比对；上述的面纹编码方式是根据人脸脸部的本质特征和开头来工作的。4.如权利要求1所述的基于声纹和人脸识别的机器人交互方法，其特征在于，所述脸部特征利用主分量分析进行降维和提取特征。5.如权利要求1所述的基于声纹和人脸识别的机器人交互方法，其特征在于，所述脸部特征对人脸的表情关键点进行抽取和识别，根据不同表情的典型关键点的相对位置进行比对，进而判别出人脸的表情种类。6.如权利要求5所述的基于声纹和人脸识别的机器人交互方法，其特征在于，所述人脸的表情关键点采用以下步骤进行识别：一，图像获取：通过图像捕捉工具获取静态图像或动态图像序列；二，图...

【专利技术属性】
技术研发人员：吴义坚，赖伟，张峰，
申请(专利权)人：上海元趣信息技术有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人