一种云计算一体机及语音交互系统技术方案

技术编号:30556173 阅读:16 留言:0更新日期:2021-10-30 13:37
本发明专利技术属于语音交互技术领域,公开了一种云计算一体机及语音交互系统,且所述语音交互系统包括:语音采集模块,用于采集目标用户的语音资料;语音解析模块,用于从所述语音资料中识别语音信息,并将所述语音信息解析为第一文本;视频采集模块,用于采集目标用户的脸部图像资料;视频解析模块,用于从所述脸部图像资料中提取唇部特征,根据所述唇部特征识别唇语信息,并将所述唇语信息解析为第二文本;判断模块,用于判断所述第一文本与第二文本的相似度;主控模块,所述主控模块在所述第一文本与第二文本的相似度超过阈值时获取第二文本,并根据所述第二文本的文本信息执行控制;综上基于双重验证有效提高了语音交互的准确性。基于双重验证有效提高了语音交互的准确性。基于双重验证有效提高了语音交互的准确性。

【技术实现步骤摘要】
一种云计算一体机及语音交互系统


[0001]本专利技术属于语音交互
,具体涉及一种云计算一体机及语音交互系统。

技术介绍

[0002]云计算一体机是指融合了计算、储存、虚拟化和管理的一体化设备,这类设备在进行维护和基础控制时,通常采用手动操作。随着语音技术的不断发展,各种语音交互控制设备层出不穷,在金融、家居、制造、建筑、医疗等多种领域都有广泛应用,为人们的日常生产和生活带来了极大便利。
[0003]综上,可将语音交互技术与云计算一体机相结合,以提供更为方便操作的一体化设备,但是现有的语音交互中其识别准确性较差,因此极易出现控制失误的现象。

技术实现思路

[0004]鉴于此,为解决上述
技术介绍
中所提出的额问题,本专利技术的目的在于提供一种云计算一体机及语音交互系统。
[0005]为实现上述目的,本专利技术提供如下技术方案:
[0006]一种语音交互系统,包括:
[0007]语音采集模块,用于采集目标用户的语音资料;
[0008]语音解析模块,用于从所述语音资料中识别语音信息,并将所述语音信息解析为第一文本;
[0009]视频采集模块,用于采集目标用户的脸部图像资料;
[0010]视频解析模块,用于从所述脸部图像资料中提取唇部特征,根据所述唇部特征识别唇语信息,并将所述唇语信息解析为第二文本;
[0011]判断模块,用于判断所述第一文本与第二文本的相似度;
[0012]主控模块,所述主控模块在所述第一文本与第二文本的相似度超过阈值时获取第二文本,并根据所述第二文本的文本信息执行控制。
[0013]优选的,所述语音交互系统还包括:与所述视频采集模块连接的摄像头,且所述摄像头用于拍摄当前环境中的预设区域的图像。
[0014]优选的,所述语音采集模块在开始采集到目标用户的语音资料时,向所述视频采集模块发送启动通知;所述视频采集模块在接收到启动通知时,进入资料采集工作状态。
[0015]优选的,所述视频采集模块未采集到目标用户的脸部图像资料时,向所述语音采集模块发送休眠通知;所述语音采集模块在接收到休眠通知时,进入休眠准备状态。
[0016]优选的,所述语音采集模块在未采集到目标用户的语音资料时,向所述视频采集模块发送休眠通知,并继续执行语音资料采集;所述视频采集模块在接收到休眠通知时,进入休眠准备状态。
[0017]优选的,所述语音交互系统还包括:提取模块,用于从所述脸部图像资料和所述语音资料中提取部分资料,并将所述部分资料对应传输至视频解析模块和语音解析模块进行
识别解析。
[0018]优选的,所述提取模块根据相同时间起点、相同时间终点对所述脸部图像资料和所述语音资料进行提取。
[0019]优选的,所述语音交互系统还包括登录模块和标记模块;所述登录模块用于接收登录指令,并根据所述登录指令唤醒标记模块;所述标记模块对所述登录指令的声纹进行目标标记,并将当前声纹登录的用户确定为目标用户。
[0020]优选的,所述语音交互系统还包括:语音播放模块,用于播放所述主控模块的控制反馈信息。
[0021]一种云计算一体机,包括上述所公开的语音交互系统。
[0022]本专利技术与现有技术相比,具有以下有益效果:
[0023]在本专利技术中,基于语音识别和唇动识别进行双重验证,由此有效保证语音交互指令识别的准确,避免误识别并提高用户体验。具体,在双重验证时还提供片段对比验证的方式,由此能更进一步提升验证的准确性。
[0024]另外,在本专利技术中,语音采集模块与视频采集模块的响应限定,使得整体云计算一体机及语音交互系统只有在采集到语音资料后,才进行脸部图像资料的采集,由此还有效保证语音资料的完整,并可有效降低功耗。
附图说明
[0025]图1为本专利技术实施例一中语音交互系统的结构框图;
[0026]图2为本专利技术实施例三中云计算一体机的结构示意图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]实施例一:
[0029]结合图1所示,本实施例中提供了一种语音交互系统,包括:
[0030]语音采集模块10,用于采集目标用户的语音资料;
[0031]语音解析模块20,用于从语音资料中识别语音信息,并将语音信息解析为第一文本;
[0032]视频采集模块30,用于采集目标用户的脸部图像资料;
[0033]视频解析模块40,用于从脸部图像资料中提取唇部特征,根据唇部特征识别唇语信息,并将唇语信息解析为第二文本;
[0034]判断模块50,用于判断第一文本与第二文本的相似度;
[0035]主控模块60,主控模块60在第一文本与第二文本的相似度超过阈值时获取第二文本,并根据第二文本的文本信息执行控制;
[0036]与视频采集模块30连接的摄像头70,且摄像头70用于拍摄当前环境中的预设区域的图像;
[0037]提取模块80,用于从脸部图像资料和语音资料中提取部分资料,并将部分资料对应传输至视频解析模块40和语音解析模块20进行识别解析;
[0038]登录模块90,用于接收登录指令,并根据登录指令唤醒标记模块100;
[0039]标记模块100,对登录指令的声纹进行目标标记,并将当前声纹登录的用户确定为目标用户;
[0040]语音播放模块110,用于播放主控模块60的控制反馈信息。
[0041]具体关于上述语音交互系统,包括如下实施方式:
[0042]其一:
[0043]通过登录模块90进行登录,通过标记模块100进行标记;
[0044]在语音采集模块10开始采集到目标用户的语音资料时,向视频采集模块30发送启动通知;视频采集模块30在接收到启动通知时,进入资料采集工作状态。
[0045]在语音采集模块10在未采集到目标用户的语音资料时,向视频采集模块30发送休眠通知,并继续执行语音资料采集;视频采集模块30在接收到休眠通知时,进入休眠准备状态。
[0046]综上,获得目标用户的一段语音资料和一段脸部图像资料;
[0047]语音解析模块20和视频解析模块40分别进行上述语音资料和脸部图像资料的完整解析,由此得到完整的第一文本和第二文本;
[0048]判断模块50进行上述完整的第一文本和第二文本之间的对比,并在相似度超过90%时,主控模块60根据第二文本的文本信息执行控制。
[0049]其二:
[0050]通过登录模块90进行登录,通过标记模块100进行标记;
[0051]在语音采集模块10开始采集到目标用户的语音资料时,向视频采集模块30发送启动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互系统,其特征在于,包括:语音采集模块,用于采集目标用户的语音资料;语音解析模块,用于从所述语音资料中识别语音信息,并将所述语音信息解析为第一文本;视频采集模块,用于采集目标用户的脸部图像资料;视频解析模块,用于从所述脸部图像资料中提取唇部特征,根据所述唇部特征识别唇语信息,并将所述唇语信息解析为第二文本;判断模块,用于判断所述第一文本与第二文本的相似度;主控模块,所述主控模块在所述第一文本与第二文本的相似度超过阈值时获取第二文本,并根据所述第二文本的文本信息执行控制。2.根据权利要求1所述的一种语音交互系统,其特征在于,还包括:与所述视频采集模块连接的摄像头,且所述摄像头用于拍摄当前环境中的预设区域的图像。3.根据权利要求2所述的一种语音交互系统,其特征在于:所述语音采集模块在开始采集到目标用户的语音资料时,向所述视频采集模块发送启动通知;所述视频采集模块在接收到启动通知时,进入资料采集工作状态。4.根据权利要求3所述的一种语音交互系统,其特征在于:所述视频采集模块未采集到目标用户的脸部图像资料时,向所述语音采集模块发送休眠通知;所述语音采集模块在接收到休眠通知时...

【专利技术属性】
技术研发人员:生桂勇唐明军王超刘方王平泉陆延
申请(专利权)人:扬州工业职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1