语音识别方法及基于语音识别的视频会议系统技术方案

技术编号:21895675 阅读:35 留言:0更新日期:2019-08-17 16:00
本发明专利技术涉及语音识别领域,尤其涉及语音识别方法及基于语音识别的视频会议系统,该方法包括以下步骤:通过小波去噪阈值函数将语音信号样本进行去噪处理;对去噪处理后的语音信号样本进行预处理;对预处理之后的语音信号样本进行特征提取,并训练得到模型;通过训练得到的模型对待识别的语音信号进行语音匹配,并输出识别后的文字。本发明专利技术建立的小波去噪阈值函数,既能够较多的保留有用信号,又可以在平滑性方面处理较好,因此能够起到更好的去噪效果,进一步提高语音识别的准确度。

Speech Recognition Method and Video Conference System Based on Speech Recognition

【技术实现步骤摘要】
语音识别方法及基于语音识别的视频会议系统
本专利技术涉及语音识别领域,尤其涉及语音识别方法及基于语音识别的视频会议系统。
技术介绍
智能语音技术主要研究人机之间语言信息处理的问题,可分为语音识别和语音合成两大类人机语音通信问题,语音识别则是机器对人的语言进行识别,并将语音转换为文字;而语音合成是将计算机自己产生的或外部输入的文字信息转变为语言说出来。本课题研究探索智能语音技术与多媒体识别分析技术的结合,并实现与应急会商、视频会议业务的深度融合,将智能语音技术应用到故障应急会商处理、公司日常会议服务活动中,提高公司沟通效率和支撑服务水平,存进公司智能化水平的发展。语音识别主要的技术流程分为去噪技术、预处理技术、特征提取技术、模型匹配技术、语言模型训练技术和自然语言处理技术等几个部分。语音识别系统已经在理想的环境下获得了不错的成绩,但是存在于应用环境中的各种干扰信号,导致系统的识别能力大幅度下降。由此可见,去噪技术已经成为语音识别系统能否在生活中完美应用的关键,同时也是语音识别领域要攻克的热点问题。传统的小波去噪阈值函数有硬阈值函数和软阈值函数两种,其中前者函数公式为:式中ωj,k、λ分别为估计小波系数、原始信号小波分解系数、阈值。硬阈值函数将各尺度上含噪信号的小波分解系数ωj,k同阈值λ比较,小于λ的点直接置零,大于λ的点不变,在阈值λ处函数是间断的,这种不连续性将导致重构后的信号被引入振荡噪声,即伪吉布斯现象,从而影响去噪效果。为了消除函数不连续性对去噪的影响,Donoho和Johnstone[8]根据函数的光滑性理论和噪声统计性质,提出了软阈值函数消噪公式:软阈值函数的主要思想是将各尺度上含噪信号的小波分解系数ωj,k与阈值λ进行比较,小于λ的点置零,大于λ的点则变为该点系数与阈值的差值。软阈值函数在阈值λ处是连续的,故避免了伪吉布斯现象造成的振荡噪声。但由于在系数处理时,大于λ的系数ωj,k统一减去了λ,这导致处理后的估计小波系数和ωj,k之间总是存在恒定偏差λ,这会使重构后的信号丢失掉某些特征,对去噪效果造成影响。综上所述,硬阈值函数能够较多的保留有用信号的特征,但在平滑性方面处理的不够理想;软阈值函数在平滑性方面较硬阈值函数处理的好,但信号的某些重要特征会被丢失。
技术实现思路
为解决上述问题,本专利技术提出语音识别方法及基于语音识别的视频会议系统,以达到更好的语音去噪效果,进一步提高语音识别的准确度。一方面,本专利技术提出语音识别方法,包括以下步骤:通过小波去噪阈值函数将语音信号样本进行去噪处理,所述小波去噪阈值函数为:其中,j为小波分解的层数,为估计小波系数,ωj,k为原始信号小波分解系数,λ为阈值;对去噪处理后的语音信号样本进行预处理;对预处理之后的语音信号样本进行特征提取,并训练得到模型;通过训练得到的模型对待识别的语音信号进行语音匹配,并输出识别后的文字。优选的,所述预处理包括以下步骤:预滤波处理,用于使语音信号样本带宽限制在设定范围内预加重处理,用于对高频段的语音信号样本通过预加重来提升高频;加窗处理,用于将语音信号样本进行分帧处理;端点检测处理,用于确定语音信号样本的开始点和终止点。优选的,通过深度学习算法对提取的特征进行训练得到模型。本专利技术建立的小波去噪阈值函数,既能够较多的保留有用信号,又可以在平滑性方面处理较好,因此能够起到更好的去噪效果,进一步提高语音识别的准确度。另一方面,本专利技术还提出基于语音识别的视频会议系统,包括:MCU多点控制器、与MCU多点控制器连接的网关、以及与网关连接的多个终端,所述终端包括显示模块,所述终端还包括:语音识别模块,用于将接收的语音信号转换为文字,并在显示模块上实时显示,所述语音识别模块包括:去噪处理模块:通过小波去噪阈值函数将语音信号样本进行去噪处理,所述小波去噪阈值函数为:其中,j为小波分解的层数,为估计小波系数,ωj,k为原始信号小波分解系数,λ为阈值;预处理模块:对去噪处理后的语音信号样本进行预处理;特征提取模块:对预处理之后的语音信号样本进行特征提取;训练模块:对特征提取后的语音信号样本训练得到模型;匹配模块:通过训练得到的模型对待识别的语音信号进行语音匹配,并输出识别后的文字。优选的,所述预处理包括以下步骤:预滤波处理,用于使语音信号样本带宽限制在设定范围内预加重处理,用于对高频段的语音信号样本通过预加重来提升高频;加窗处理,用于将语音信号样本进行分帧处理;端点检测处理,用于确定语音信号样本的开始点和终止点。优选的,通过深度学习算法对提取的特征进行训练得到模型。本专利技术通过语音识别模块在显示模块上实时显示对应的文字,使得会议参加人员不仅仅能够观看到视频流,还可以观看到视频流中的实时文字显示,方便会议参加人员对会议内容的理解,提高了沟通的效率。附图说明下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1是本专利技术实施例一的流程示意图;图2是本专利技术实施例一中blocks信号的波形图;图3是本专利技术实施例一中染噪blocks信号的波形图;图4是本专利技术实施例一中硬阈值函数去噪的波形图;图5是本专利技术实施例一中软阈值函数去噪的波形图;图6是本专利技术实施例一中改进阈值函数去噪的波形图;图7是本专利技术实施例二的结构示意图;图8是本专利技术实施例二中语音识别模块的结构示意图。具体实施方式以下结合附图,对本专利技术的技术方案作进一步的描述,但本专利技术并不限于这些实施例。实施例一本实施例的主要构想是结合现有技术中硬阈值函数能够较多的保留有用信号的特征,但在平滑性方面处理的不够理想;软阈值函数在平滑性方面较硬阈值函数处理的好,但信号的某些重要特征会被丢失的特点,建立小波去噪阈值函数,既能够较多的保留有用信号,又可以在平滑性方面处理较好。基于上述构想,本实施例提出一种语音识别方法,如图1所示,包括以下步骤:S1:通过小波去噪阈值函数将语音信号样本进行去噪处理;S2:对去噪处理后的语音信号样本进行预处理;S3:对预处理之后的语音信号样本进行特征提取,并训练得到模型;S4:通过训练得到的模型对待识别的语音信号进行语音匹配,并输出识别后的文字。去噪的目的是提高语音识别的准确率,尽量保留说话人说话频率区间内的有用信号,衰减其他频率段的信号。语音信号的有用信号信息主要集中在中低频率段,经小波分解后,噪声信号的系数幅值会随着尺度j的增大而逐渐减小,有用信号的系数幅值会随着度增大而增大。该特性表明,一般的阈值选取规则都会使阈值λ随着分解尺度的增大而减小,但阈值函数本身并没有针对语音信号的该特征做出有针对性的调整。而现有的阈值函数在各分解尺度上阈值函数的表达式都是固定的。因此,如果令阈值函数随着分解尺度的变化而做出一定调整,即在较高尺度上,令阈值函数能够更接近于硬阈值函数,这样处理后的小波估计系数就能够更加接近真实系数ωj,k,去噪效果将会得到进一步改善。基于以上设想,结合语音信号特有的频率特性,在阈值函数中引入了分解尺度j来对其进行调整:其中,j为小波分解的层数,为估计小波系数,ωj,k为原始信号小波分解系数,λ为阈值。当j=1时,该函数等价于软阈值函数,当j→∞时,有此时上式等价于硬阈值函数。随着j的增大,在信号的中低频段,该阈值函数逐渐向硬阈值函数逼近,使更接近ωj,k,语音信号的有本文档来自技高网
...

【技术保护点】
1.语音识别方法,其特征在于,包括以下步骤:通过小波去噪阈值函数将语音信号样本进行去噪处理,所述小波去噪阈值函数为:

【技术特征摘要】
1.语音识别方法,其特征在于,包括以下步骤:通过小波去噪阈值函数将语音信号样本进行去噪处理,所述小波去噪阈值函数为:其中,j为小波分解的层数,为估计小波系数,ωj,k为原始信号小波分解系数,λ为阈值;对去噪处理后的语音信号样本进行预处理;对预处理之后的语音信号样本进行特征提取,并训练得到模型;通过训练得到的模型对待识别的语音信号进行语音匹配,并输出识别后的文字。2.根据权利要求1所述的语音识别方法,其特征在于,所述预处理包括以下步骤:预滤波处理,用于使语音信号样本带宽限制在设定范围内预加重处理,用于对高频段的语音信号样本通过预加重来提升高频;加窗处理,用于将语音信号样本进行分帧处理;端点检测处理,用于确定语音信号样本的开始点和终止点。3.根据权利要求1所述的语音识别方法,其特征在于,通过深度学习算法对提取的特征进行训练得到模型。4.基于语音识别的视频会议系统,包括:MCU多点控制器、与MCU多点控制器连接的网关、以及与网关连接的多个终端,所述终端包括显示模块,其特征在于,所述终端还包括...

【专利技术属性】
技术研发人员:杨鸿珍王云烨卢晓帆章毅吴建伟方晴程范超史俊潇段玉帅由其林吴立刚徐海青陈是同徐唯耀浦正国梁翀张天奇余江斌韩涛
申请(专利权)人:国网浙江省电力有限公司信息通信分公司安徽继远软件有限公司国网信息通信产业集团有限公司国家电网有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1