一种应用于远程信息服务的人机交互识别系统技术方案

技术编号：7021433 阅读：232 留言：0更新日期：2012-04-11 18:40

本发明专利技术属于计算机领域，特别是一种应用于远程信息服务的人机交互识别系统，其特征在于，提供网络信息服务的服务系统或其客户端至少具有一个人机交互识别装置；所述的人机交互识别装置包括：听觉采集模块，用于采集用户的语音信号；视觉采集模块，用于采集用户的人脸图像；第一预处理模块、人脸特征提取模块、人脸识别模块；第二预处理模块、语音特征提取模块、语音识别模块；第三预处理模块、人脸表情特征提取模块、人脸表情识别模块；第四预处理模块、语言情感特征提取模块、语言情感识别模块；显性识别融合模块，用于将人脸识别模块和语音识别模块的识别结果进行融合处理，形成综合了人脸特征和语音特征的识别结果；隐性识别融合模块，用于将人脸表情识别模块和语言情感识别模块的识别结果进行融合处理，形成综合了人脸表情特征和语音情感特征的识别结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机领域，特别是以人脸、脸部表情、语音、语音情感作为指令输入手段的人机交互识别系统。
技术介绍
目前，人机交互的方法包括触摸屏操作、鼠标操作、语音控制等。目前，随着智能控制技术的发展，一种综合人脸、脸部表情、语音、语音情感等因素的人机交互手段将更能给用户一种便捷、人性化的操作体验。如中国专利申请200810169232. 4(人机交互方法及系统)公开了一种人机交互方法及系统，将人机交互的过程划分成不同的对话状态，每个对话状态分别对应一个处理过程；该方法包括根据用户输入的即时上下文信息，获得反映所述用户需求的特征信息；至少根据所述特征信息和领域知识，确定当前与所述用户需求匹配的对话状态；调用并执行与所述确定的对话状态对应的处理过程，并将所述处理过程的处理结果返回给用户。该专利技术，以匹配用户需求，实现个性化的、拟人体验的人机交互过程，从而提高用户体验性，但没有考虑并综合人脸、脸部表情、语音、语音情感等因素；中国专利申请200910061752.8(—种人机交互平台)提供了一种人机交互平台，该平台包括绘图引擎，用于显示图形、文字；语音引擎，用于合成语音，进行播报；图像识别引擎，用于识别用户输入图形的样式，触发不同的功能；跨平台模块，用于实现跨平台功能；人机交互模块，用于显示人机界面；人机交互模块通过接口，经绘图引擎连接跨平台模块；图像识别引擎、语音引擎通过接口相连，并且分别通过接口连接跨平台模块；上述各模块均安装在人机交互硬件设备上，跨平台模块还与操作系统相交互。该专利技术综合了图形、文字、语音因素，但没就如何处理人脸、脸部表情、语音、语音情...

【技术保护点】
１．一种应用于远程信息服务的人机交互识别系统，其特征在于，提供网络信息服务的服务系统或其客户端至少具有一个人机交互识别装置；所述的人机交互识别装置包括：听觉采集模块，用于采集用户的语音信号；视觉采集模块，用于采集用户的人脸图像；第一预处理模块，用于对视觉采集模块采集的图像进行预处理；人脸特征提取模块，用于通过对第一预处理模块的图像进行分析，实现对人脸整体或特征部位的识别、定位；人脸识别模块，用于根据人脸特征提取模块获得参数进行识别，输出人脸识别的结果；第二预处理模块，用于对听觉采集模块的语音信号进行预处理；语音特征提取模块，用于分析并获得语音参数；语音识别模块，用于根据语音特征提取模块获得的参数进行识别并获得该用户语音对应的请求或指令；第三预处理模块，用于对视觉采集模块采集的图像进行预处理，形成人脸表情图像序列；人脸表情特征提取模块，用于对第三预处理模块输入的图像序列进行分析处理，获得人脸表情参数；人脸表情识别模块，用于人脸表情参数进行处理、识别进而获得人脸表情的识别结果；第四预处理模块，用于对听觉采集模块的语音信号进行与语言情感相关的预处理；语言情感特征提取模块，用于从第四预处理模块...

【技术特征摘要】

【专利技术属性】
技术研发人员：卢忠云，黄家祺，卢林发，叶灿才，
申请(专利权)人：广东爱科数字科技有限公司，
类型：发明
国别省市：81

全部详细技术资料下载我是这个专利的主人