基于人工智能的识别系统技术方案

技术编号:32909204 阅读:28 留言:0更新日期:2022-04-07 11:59
本发明专利技术涉及人工智能技术领域,尤其是基于人工智能的识别系统,针对现有技术中与聋哑人沟通不方便的问题,现提出如下方案,其包括服务器终端、语音智能识别模组和手势动作识别模组,所述服务器终端中构建有手语编码表与文本编码表,所述语音智能识别模组包括:语音录入模块、语音预处理模块、语音翻译模块、文本编码模块和识别显示模块。本发明专利技术布局合理,不仅能够将语音转换成手势动作,方便正常人向聋哑人表达话语的含义,还能够将手势多组转换成语音,方便聋哑人向正常人表达手势动作含义,有效的方便了聋哑人与正常人之间沟通,易于推广使用。使用。使用。

【技术实现步骤摘要】
基于人工智能的识别系统


[0001]本专利技术涉及人工智能领域,尤其涉及基于人工智能的识别系统。

技术介绍

[0002]人工智能(简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着人工智能技术的不断发展,人工智能技术愈加成熟,人工智能应用到实际生产环境中,为人们的生活提供了极大的便利。
[0003]随着社会的不断发展,社会对于残障人士也越来越关心,对于聋哑人来说,他们既不能发出声音也不能听到外界的声音,只能使用手语与外界交流,但是社会上使用手语的人较少,导致聋哑人与正常人之间沟通较为不便,尤其在办理一些业务时,聋哑人与工作人员之间的沟通障碍,往往会使得他们在办理业务时,困难重重,为此,本方案提出了基于人工智能的识别系统。

技术实现思路

[0004]本专利技术提出的基于人工智能的识别系统,解决了现有技术中与聋哑人沟通不方便的问题。
[0005]为了实现上述目的,本专利技术采用了如下技术方案:
[0006]基于人工智能的识别系统,包括服务器终端、语音智能识别模组和手势动作识别模组,所述服务器终端中构建有手语编码表与文本编码表,所述语音智能识别模组包括:语音录入模块、语音预处理模块、语音翻译模块、文本编码模块和识别显示模块,所述语音通过语音录入模块录入,经语音预处理模块提高语音信号,语音信号由语音翻译模块译成文本,文本经过文本编码模块编码编码成文字编码,文本编码经识别显示模块参照手语编码表译成手语动作,并通过显示器实时播放,所述手势动作识别模组包括:动作录入模块、动作截取模块、动作翻译模块、文本组合模块和播放模块,所述手语动作通过录入模块录入,经过动作截取模块对录入的手语动作进行截取,得到手势动作图片,手势动作图片经过动作翻译模块参照手语编码表得到手语编码,文本组合模块参照文本编码表将手语编码转换成文字,并对文字进行组合得到通顺的语句文本,通过播放模块对语句文本播放。
[0007]优选的,所述语音预处理模块具体操作为:对语音录入模块中得到的原始语音进行归一化处理,然后采用梅尔频率倒谱系数(MFCC)获取语音的声谱特征图。
[0008]优选的,所述语音翻译模块中构建有CTC损失函数。
[0009]优选的,所述动作录入模块包括到多个高清摄像头,动作截取模块对高清摄像头摄录的视频逐帧分析,并截取多个具有动作意义的动作图片。
[0010]优选的,所述手语编码表中的手语编码与文本编码表中文本编码一一对应。
[0011]基于人工智能的识别系统的识别方法,包括语音智能识别和手势动作识别;
[0012]所述语音智能识别包括以下步骤:
[0013]A1、语音录入:对语音进行端点检测,找到语音录入的起始点与结束点,得到原始
语音;
[0014]A2、语音预处理:对A1中得到的原始语音进行预处理,得到清晰的语音信号;
[0015]A3、语音翻译:对A2中得到的语音信号翻译成语句通顺的句段,并截取句段中的关键字段;
[0016]A4、文字编码:A3中截取到的关键字段与文本编码表对比,组成文字编码;
[0017]A5、识别显示:参照手语编码表,按照A4中得到的文字编码组成手语动作、并通过显示器实时3D演示播放;
[0018]手势动作识别,所述手势动作识别包括以下步骤:
[0019]B1、动作录入:对手势动作进行录入,找到手势录入的起始点与结束点,得到手势动作视频;
[0020]B2、动作截取:将B1中得到的手势动作进行截取,得到多个动作图片;
[0021]B3、动作翻译:B3中的动作图片与手语编码表对比,得到手语编码;
[0022]B4、文本组合:参照文本编码表将B3中的手语编码转换成文字,并对文字进行组合得到通顺的语句文本;
[0023]B5、语音播放:B4中得到的语句文本转换成电信号,经过扬声器播放。
[0024]优选的,所述A2中语音预处理具体操作为:对A1中得到的原始语音进行归一化处理,以降低噪音的影响,然后采用梅尔频率倒谱系数(MFCC)获取语音的声谱特征图。
[0025]优选的,所述A3中语音翻译过程中,采用CTC损失函数对声谱特征图进行翻译。
[0026]优选的,所述文本组合将B3中得到的手语编码参考文本手语编码表得到输出文本,然后把输出的文本输入到语言模型,通过语言模型来计算一个句子出现的概率,最终选出概率最大的句子,然后输出比较通顺的文字,再采用拼写纠错模型来对错别字和同音字进行纠错改正,最终得到通顺且语义逻辑连贯的文本。
[0027]本专利技术的有益效果:
[0028]1、通过语音智能识别模组、服务器终端、手势多组识别模组等相互配合,实现将语音转换成手势动作,并通过显示器演示播放,或者对聋哑人的手势动作进行识别转换成语音,通过扬声器播报,有效的方便了聋哑人与社会上他人之间的沟通。
[0029]2、通过对语音进行预处理之后,提高语音的清晰度,并经过CTC函数对语音进行翻译,有效的保证了语音能够被准确识别。
[0030]3、通过高清摄像头、动作截取模块、文本组合模块等相互配合,实现对手势动作进行捕捉,并截取有意义的动作图片,得到手语动作的含义文本,并对文本内容进行组合,得到顺畅的语句文本
[0031]本专利技术布局合理,不仅能够将语音转换成手势动作,方便正常人向聋哑人表达话语的含义,还能够将手势多组转换成语音,方便聋哑人向正常人表达手势动作含义,有效的方便了聋哑人与正常人之间沟通,易于推广使用。
附图说明
[0032]图1为本专利技术的系统架构示意图。
[0033]图2为本专利技术的语音智能识别模组架构示意图。
[0034]图3为本专利技术的手势多组识别模组架构示意图。
具体实施方式
[0035]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0036]参照图1

3,基于人工智能的识别系统,包括服务器终端、语音智能识别模组和手势动作识别模组,服务器终端中构建有手语编码表与文本编码表,手语编码表中的手语编码与文本编码表中文本编码一一对应。
[0037]语音智能识别模组包括:语音录入模块、语音预处理模块、语音翻译模块、文本编码模块和识别显示模块,语音通过语音录入模块录入,得到原始的语音文件,语音预处理模块对录入的原始语音进行归一化处理,然后采用梅尔频率倒谱系数(MFCC)获取语音的声谱特征图,语音翻译模块中构建有CTC损失函数,将声谱特征图翻译成文本文件,并截取文本关键词,文本关键词经过文本编码模块编码编码成文字编码,文本编码经识别显示模块参照手语编码表译成手语动作,并通过显示器实时3D演示播放。
[0038]手势动作识别模组包括:动作录入模块、动作截取模块、动作翻译模块、文本组合模块和播放模块,动作录入模块包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于人工智能的识别系统,包括服务器终端、语音智能识别模组和手势动作识别模组,其特征在于,所述服务器终端中构建有手语编码表与文本编码表,所述语音智能识别模组包括:语音录入模块、语音预处理模块、语音翻译模块、文本编码模块和识别显示模块,所述语音通过语音录入模块录入,经语音预处理模块提高语音信号,语音信号由语音翻译模块译成文本,文本经过文本编码模块编码编码成文字编码,文本编码经识别显示模块参照手语编码表译成手语动作,并通过显示器实时播放,所述手势动作识别模组包括:动作录入模块、动作截取模块、动作翻译模块、文本组合模块和播放模块,所述手语动作通过录入模块录入,经过动作截取模块对录入的手语动作进行截取,得到手势动作图片,手势动作图片经过动作翻译模块参照手语编码表得到手语编码,文本组合模块参照文本编码表将手语编码转换成文字,并对文字进行组合得到通顺的语句文本,通过播放模块对语句文本播放。2.根据权利要求1所述的基于人工智能的识别系统,其特征在于,所述语音预处理模块具体操作为:对语音录入模块中得到的原始语音进行归一化处理,然后采用梅尔频率倒谱系数(MFCC)获取语音的声谱特征图。3.根据权利要求1所述的基于人工智能的识别系统,其特征在于,所述语音翻译模块中构建有CTC损失函数。4.根据权利要求1所述的基于人工智能的识别系统,其特征在于,所述动作录入模块包括到多个高清摄像头,动作截取模块对高清摄像头摄录的视频逐帧分析,并截取多个具有动作意义的动作图片。5.根据权利要求1所述的基于人工智能的识别系统,其特征在于,所述手语编码表中的手语编码与文本编码表中文本编码一一对应。6.根据权利要求1

5任一项所述的基于人工智能的识别系统的识别方法,其特征在于,包括语音智能识别和手势动作识别;所述语音智能识别包括以下步骤...

【专利技术属性】
技术研发人员:罗健文罗妙梅
申请(专利权)人:深圳市尚影视界科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1