基于AI语音识别的可视化表现系统和方法技术方案

技术编号:26381135 阅读:23 留言:0更新日期:2020-11-19 23:49
基于AI语音识别的可视化表现系统和方法,涉及语音控制技术领域,包括:采集模块、语音唤醒模块、语音识别模块、主机模块和显示模块,采集模块采集外界发出的声音并过滤,语音唤醒模块对声音数据进行分析,在出现唤醒词时唤醒语音识别模块,语音识别模块对采集模块输出的声音数据进行分析,得到对应的控制信号,主机模块对控制信号进行分析播放与控制信号对应的影音视频,将视频信号输出到显示模块进行显示,解决了现有语音控制技术中存在的语音识别出错率高,发生误操作的问题,同时解决了目前的影音视频装置只能通过机械的按键或通过感应器来进行触发播放,使用起来不方便,降低了观看体验的问题。

【技术实现步骤摘要】
基于AI语音识别的可视化表现系统和方法
本专利技术涉及语音控制
,具体涉及基于AI语音识别的可视化表现系统和方法。
技术介绍
语音控制技术越来越多的进入到我们的生活,但是由于是在采集声音的时候会有很多其他背景噪声,导致语音识别出错率极高,甚至经常发生误操作的情况,目前语音识别控制技术不能准确地对用户发出的语音进行识别,同时目前的一些影音视频装置在进行视频播放的时候只能通过机械的按键或通过感应器来进行触发播放,使用起来不方便,降低了观看体验。
技术实现思路
本专利技术实施例提供了基于AI语音识别的可视化表现系统和方法,通过设置采集模块采集外界发出的声音,同时对声音进行过滤,将其中噪声部分去除,得到单独的人声部分的声音数据,去除噪音的影响,降低语音识别出错率,语音唤醒模块对声音数据进行分析,在出现唤醒词时唤醒语音识别模块,语音识别模块对采集模块输出的声音数据进行分析,得到对应的控制信号,主机模块对控制信号进行分析播放与控制信号对应的影音视频,将视频信号输出到显示模块进行显示,解决了现有语音控制技术中存在的采集声音的时候会有很多其他背景噪声,导致语音识别出错率极高,甚至经常发生误操作的问题,同时解决了目前的一些影音视频装置在进行视频播放的时候只能通过机械的按键或通过感应器来进行触发播放,使用起来不方便,降低了观看体验的问题。基于AI语音识别的可视化表现系统,包括:采集模块、语音唤醒模块、语音识别模块、主机模块和显示模块;采集模块,用于采集发出各种的声音,并进行处理得到声音数据,将采集得到的声音数据发送到所述语音唤醒模块;其中,所述采集模块包括声音采集单元、过滤单元、过滤数据存储单元和输出端,所述声音采集单元用于采集发出的各种声音得到声音数据,并将采集的声音数据发送到所述过滤单元,所述过滤数据存储单元用于存储声音过滤数据,所述过滤单元用于接收所述声音采集单元发送的声音数据,并与所述过滤数据存储单元中存储的声音过滤数据进行比对,将相同的部分消除,将不相同的部分声音数据通过所述输出端发送到所述语音唤醒模块和所述语音识别模块;语音唤醒模块,用于接所述采集模块发送的声音数据并进行分析,在分析到出现唤醒词时,将触发信号发送到所述主机模块;其中,语音唤醒模块包括接收端、唤醒词存储单元、语音分析单元和信号触发单元,所述接收端用于接收所述采集模块发送的声音数据,将声音数据发送到所述语音分析单元,所述唤醒词存储单元用于存储预设的唤醒词,所述语音分析单元用于接收所述接收端发送的声音数据,还用于读取存储单元存储预设的唤醒词并与接收端发送的声音数据进行对比,在声音数据中出现与唤醒词相同的词后,所述信号触发单元发送唤醒信号到所述语音识别模块;语音识别模块,用于接收所述采集模块发送的语音数据,接收所述语音唤醒模块发送的唤醒信号,还用于在唤醒信号后对语音数据进行分析得到控制信号,将控制信号发送到主机模块;其中,所述语音识别模块包括语音数据库、语音识别单元和信号输出端口,所述语音数据库用于存储语音比对数据,所述语音识别单元用于根据语音数据库存储的语音比对数据对采集模块发送的语音数据进行识别,将语音转化成控制信号,所述信号输出端口用于将控制信号发送到所述主机模块;主机模块,用于接收所述语音识别模块发送的控制信号,并对接收到的控制信号进行分析,读取对应的影音视频数据并播放,将影音视频信号传输到所述显示模块;其中,主机模块包括信号接收端口、信号分析单元、影音数据存储单元、视频播放单元和视频信号输出端口,接收端口用于采集所述语音识别模块发送的控制信号,将控制信号发送到所述信号分析单元,所述信号分析单元用于对控制信号进行分析将分析结果数据发送到所述视频播放单元,所述影音数据存储单元用于存储影音视频数据,所述视频播放单元用于接收所述分析单元发送的分析结果数据,并根据分析结果数据播放所述影音数据存储单元中对应的影音视频数据产生影音视频信号,所述视频信号输出端口用于将影音视频信号传输到所述显示模块;显示模块,用于接收所述主机模块发送的影音视频信号并进行播放。进一步的,所述声音采集单元为麦克风或拾音器中任一种。进一步的,所述过滤数据存储单元存储的声音过滤数据为各种噪声的波形数据,该各种噪声的波形数据用于与所述声音采集单元采集发的声音数据进行对比去除与人声混合在一起的噪声。进一步的,所述唤醒词存储单元存储预设的唤醒词由用户进行预设,该唤醒词为预设的波形数据。进一步的,所述语音数据库存储的语音比对数据包括语音波形数据和控制信号数据,用于与所述采集模块发送的语音数据的特征进行比对得到对应的指令数据。第二方面,本专利技术实施例提供基于AI语音识别的可视化表现的方法,包括以下步骤:S1,语音采集,声音采集单元采集发出的各种声音得到声音数据,并将采集的声音数据发送到过滤单元,过滤数据存储单元存储声音过滤数据,过滤单元接收声音采集单元发送的声音数据与过滤数据存储单元中存储的声音过滤数据进行比对,将相同的部分消除,将不相同的部分声音数据通过输出端发送到接收端和语音识别单元;S2,语音唤醒,接收端接收输出端发送的声音数据,将声音数据发送到语音分析单元,唤醒词存储单元存储预设的唤醒词,语音分析单元接收端发送的声音数据,同时读取存储单元存储预设的唤醒词并与接收端发送的声音数据进行对比,在声音数据中出现与唤醒词相同的词后,信号触发单元发送唤醒信号到语音识别模块;S3,语音分析,语音数据库存储语音比对数据,语音识别单元接收到信号触发单元发送唤醒信号被唤醒,根据语音数据库存储的语音比对数据对输出端发送的语音数据进行识别,将语音转化成控制信号,信号输出端口将控制信号发送到接收端口;S4,视频播放,接收端口采集信号输出端发送的控制信号,将控制信号发送到信号分析单元,信号分析单元对控制信号进行分析将分析结果数据发送到视频播放单元,影音数据存储单元存储影音视频数据,视频播放单元接收分析单元发送的分析结果数据,并根据分析结果数据播放影音数据存储单元中对应的影音视频数据产生影音视频信号,视频信号输出端口将影音视频信号传输到显示模块进行播放。本专利技术实施例提供的上述技术方案的有益效果至少包括:1、通过设置采集模块采集外界发出的声音,同时对声音进行过滤,将其中噪声部分去除,得到单独的人声部分的声音数据,去除噪音的影响,降低语音识别出错率,通过语音唤醒模块对采集模块发送的声音数据进行分析,在出现唤醒词时唤醒语音识别模块,解决了现有语音控制技术中存在的采集声音的时候会有很多其他背景噪声,导致语音识别出错率极高,甚至经常发生误操作的问题。2、通过语音唤醒模块对采集模块发送的声音数据进行分析,在出现唤醒词时唤醒语音识别模块,语音识别模块对采集模块输出的声音数据进行分析,得到对应的控制信号,主机模块对控制信号进行分析播放与控制信号对应的影音视频,将视频信号输出到显示模块进行显示,解决了同时目前的一些影音视频装置在进行视频播放的时候只能通过机械的按键或通过感应器来进行触发播放本文档来自技高网...

【技术保护点】
1.基于AI语音识别的可视化表现系统,其特征在于,包括:采集模块、语音唤醒模块、语音识别模块、主机模块和显示模块;/n采集模块,用于采集发出各种的声音,并进行处理得到声音数据,将采集得到的声音数据发送到所述语音唤醒模块;/n其中,所述采集模块包括声音采集单元、过滤单元、过滤数据存储单元和输出端,所述声音采集单元用于采集发出的各种声音得到声音数据,并将采集的声音数据发送到所述过滤单元,所述过滤数据存储单元用于存储声音过滤数据,所述过滤单元用于接收所述声音采集单元发送的声音数据,并与所述过滤数据存储单元中存储的声音过滤数据进行比对,将相同的部分消除,将不相同的部分声音数据通过所述输出端发送到所述语音唤醒模块和所述语音识别模块;/n语音唤醒模块,用于接所述采集模块发送的声音数据并进行分析,在分析到出现唤醒词时,将触发信号发送到所述主机模块;/n其中,语音唤醒模块包括接收端、唤醒词存储单元、语音分析单元和信号触发单元,所述接收端用于接收所述采集模块发送的声音数据,将声音数据发送到所述语音分析单元,所述唤醒词存储单元用于存储预设的唤醒词,所述语音分析单元用于接收所述接收端发送的声音数据,还用于读取存储单元存储预设的唤醒词并与接收端发送的声音数据进行对比,在声音数据中出现与唤醒词相同的词后,所述信号触发单元发送唤醒信号到所述语音识别模块;/n语音识别模块,用于接收所述采集模块发送的语音数据,接收所述语音唤醒模块发送的唤醒信号,还用于在唤醒信号后对语音数据进行分析得到控制信号,将控制信号发送到主机模块;/n其中,所述语音识别模块包括语音数据库、语音识别单元和信号输出端口,所述语音数据库用于存储语音比对数据,所述语音识别单元用于根据语音数据库存储的语音比对数据对采集模块发送的语音数据进行识别,将语音转化成控制信号,所述信号输出端口用于将控制信号发送到所述主机模块;/n主机模块,用于接收所述语音识别模块发送的控制信号,并对接收到的控制信号进行分析,读取对应的影音视频数据并播放,将影音视频信号传输到所述显示模块;/n其中,主机模块包括信号接收端口、信号分析单元、影音数据存储单元、视频播放单元和视频信号输出端口,信号接收端口用于采集所述语音识别模块发送的控制信号,将控制信号发送到所述信号分析单元,所述信号分析单元用于对控制信号进行分析将分析结果数据发送到所述视频播放单元,所述影音数据存储单元用于存储影音视频数据,所述视频播放单元用于接收所述信号分析单元发送的分析结果数据,并根据分析结果数据播放所述影音数据存储单元中对应的影音视频数据产生影音视频信号,所述视频信号输出端口用于将影音视频信号传输到所述显示模块;/n显示模块,用于接收所述主机模块发送的影音视频信号并进行播放。/n...

【技术特征摘要】
1.基于AI语音识别的可视化表现系统,其特征在于,包括:采集模块、语音唤醒模块、语音识别模块、主机模块和显示模块;
采集模块,用于采集发出各种的声音,并进行处理得到声音数据,将采集得到的声音数据发送到所述语音唤醒模块;
其中,所述采集模块包括声音采集单元、过滤单元、过滤数据存储单元和输出端,所述声音采集单元用于采集发出的各种声音得到声音数据,并将采集的声音数据发送到所述过滤单元,所述过滤数据存储单元用于存储声音过滤数据,所述过滤单元用于接收所述声音采集单元发送的声音数据,并与所述过滤数据存储单元中存储的声音过滤数据进行比对,将相同的部分消除,将不相同的部分声音数据通过所述输出端发送到所述语音唤醒模块和所述语音识别模块;
语音唤醒模块,用于接所述采集模块发送的声音数据并进行分析,在分析到出现唤醒词时,将触发信号发送到所述主机模块;
其中,语音唤醒模块包括接收端、唤醒词存储单元、语音分析单元和信号触发单元,所述接收端用于接收所述采集模块发送的声音数据,将声音数据发送到所述语音分析单元,所述唤醒词存储单元用于存储预设的唤醒词,所述语音分析单元用于接收所述接收端发送的声音数据,还用于读取存储单元存储预设的唤醒词并与接收端发送的声音数据进行对比,在声音数据中出现与唤醒词相同的词后,所述信号触发单元发送唤醒信号到所述语音识别模块;
语音识别模块,用于接收所述采集模块发送的语音数据,接收所述语音唤醒模块发送的唤醒信号,还用于在唤醒信号后对语音数据进行分析得到控制信号,将控制信号发送到主机模块;
其中,所述语音识别模块包括语音数据库、语音识别单元和信号输出端口,所述语音数据库用于存储语音比对数据,所述语音识别单元用于根据语音数据库存储的语音比对数据对采集模块发送的语音数据进行识别,将语音转化成控制信号,所述信号输出端口用于将控制信号发送到所述主机模块;
主机模块,用于接收所述语音识别模块发送的控制信号,并对接收到的控制信号进行分析,读取对应的影音视频数据并播放,将影音视频信号传输到所述显示模块;
其中,主机模块包括信号接收端口、信号分析单元、影音数据存储单元、视频播放单元和视频信号输出端口,信号接收端口用于采集所述语音识别模块发送的控制信号,将控制信号发送到所述信号分析单元,所述信号分析单元用于对控制信号进行分析将分析结果数据发送到所述视频播放单元,所述影音数据存储单元用于存储影音视频数据,所述视频播放单元用于接收所述信号分析单元发送的分析结果数据,并根据分析结果数据播放所述影音数据存储单元中对应的影音视频数据产生影音视频信号,所述视频信号输出端口用于将...

【专利技术属性】
技术研发人员:周安斌汤祯科宋健健尚绪峰
申请(专利权)人:山东金东数字创意股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1