一种微弱语音增强方法、语音识别方法及计算机可读存储介质技术

技术编号:24941900 阅读:29 留言:0更新日期:2020-07-17 21:48
本发明专利技术涉及人计算机技术领域,提供了一种微弱语音增强方法,所述方法包含步骤:获取待处理语音中的非静音片段;将所述非静音片段转换为频域;对所述非静音片段的频域进行基频检测,得到可能为人说话的基频,作为计算基频;分别基于所述计算基频进行计算,得到与所述计算基频对应的各待确认谐波;检测各所述待确认谐波是否包含在所述非静音片段的频域中;若包含,则确认所述待确认谐波对应的所述计算基频为标准基频;若不包含,则确定所述待确认谐波对应的所述计算基频为非标准基频;基于不同的预设方法,分别对所述标准基频和所述非标准基频进行处理,以实现对所述标准基频对应的语音数据进行增强。

【技术实现步骤摘要】
一种微弱语音增强方法、语音识别方法及计算机可读存储介质
本专利技术涉及计算机信息
,尤其涉及一种微弱语音增强方法、语音识别方法及计算机可读存储介质。
技术介绍
语音识别技术,也被称为自动语音识别AutomaticSpeechRecognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,随之而来的则是海量数据的产生。其中,语音数据受到了人们越来越多的重视。语音识别是一门交叉学科。近二十年来。语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。应用需求的不断增加,对语音识别的准确性也提出了更高的要求,例如,在远场语音的识别应用中,如何对目的语音信号进行增强,以提升语音识别准确本文档来自技高网...

【技术保护点】
1.一种微弱语音增强方法,其特征在于,所述方法包含步骤:/n获取待处理语音中的非静音片段;/n将所述非静音片段转换为频域;/n对所述非静音片段的频域进行基频检测,得到可能为人说话的基频,作为计算基频;/n分别基于所述计算基频进行计算,得到与所述计算基频对应的各待确认谐波;/n检测各所述待确认谐波是否包含在所述非静音片段的频域中;/n若包含,则确认所述待确认谐波对应的所述计算基频为标准基频;/n若不包含,则确定所述待确认谐波对应的所述计算基频为非标准基频;/n基于不同的预设方法,分别对所述标准基频和所述非标准基频进行处理,以实现对所述标准基频对应的语音数据进行增强。/n

【技术特征摘要】
1.一种微弱语音增强方法,其特征在于,所述方法包含步骤:
获取待处理语音中的非静音片段;
将所述非静音片段转换为频域;
对所述非静音片段的频域进行基频检测,得到可能为人说话的基频,作为计算基频;
分别基于所述计算基频进行计算,得到与所述计算基频对应的各待确认谐波;
检测各所述待确认谐波是否包含在所述非静音片段的频域中;
若包含,则确认所述待确认谐波对应的所述计算基频为标准基频;
若不包含,则确定所述待确认谐波对应的所述计算基频为非标准基频;
基于不同的预设方法,分别对所述标准基频和所述非标准基频进行处理,以实现对所述标准基频对应的语音数据进行增强。


2.如权利要求1所述的方法,其特征在于,所述获取待处理语音中的非静音片段具体包含:
基于语音活动检测技术对所述待处理语音中的非静音片段进行识别。


3.如权利要求1所述的方法,其特征在于,所述将所述非静音片段转换为频域具体包含:
依次对各所述非静音片段进行分帧、加窗、快速傅里叶变换,从而转换为频域。


4.如权利要求1所述的方法,其特征在于,对所述标准基频进行处理的所述预设方法包含:
获取所述标准基频范围中出现的所有共振峰;
确定前三个所述共振峰为所述标准基频对应的说话人的共振峰标准;
基于所述共振峰标...

【专利技术属性】
技术研发人员:张广学肖龙源蔡振华李稀敏刘晓葳
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1