语音识别模型的构建方法、系统、终端及可读存储介质技术方案

技术编号:23151330 阅读:46 留言:0更新日期:2020-01-18 14:19
本发明专利技术公开了一种语音识别模型的构建方法、系统、终端及可读存储介质,方法包括:采集终端周围环境的声音数据;若声音数据中包含有人声音特征时,则将声音数据分离为人声音特征和非人声音特征;将人声音特征的信号值调整放大和将非人声音特征的信号值调整缩小;经调整后的人声音特征和非人声音特征进行重新合并,以获得目标声音数据。这样,经调整后的人声音特征和非人声音特征作为样本声音数据进行训练,以更新语音识别模型,从而生成能够应对自然环境噪声的语音识别模型,使得该语音识别模型的构建更贴合自然环境,进而提高语音识别模型的准确性。

Construction method, system, terminal and readable storage medium of speech recognition model

【技术实现步骤摘要】
语音识别模型的构建方法、系统、终端及可读存储介质
本专利技术涉及语音识别
,尤其涉及一种语音识别模型的构建方法、系统、终端及可读存储介质。
技术介绍
语音识别以语音为研究对象,通过语音信号处理和模型识别让机器自动识别和理解人的语言,把语音信号转化为相应的文本或命令。传统的语音识别模型为了提高语音识别的准确性,会通过大量的无噪声的样本声音数据进行训练以构建该语音识别模型。然后,在实际的生活情况中,自然环境中有各种各样的噪音。例如,鸟声、空调声等噪音。终端在采集用户的声音数据时,会将周围环境的噪音一并采集,这样,终端将带有噪音的声音数据输入至上述语音识别模型,会导致语音识别模型不准确。
技术实现思路
本专利技术的主要目的在于提供一种语音识别模型的构建方法、系统、终端及可读存储介质,旨在解决现有技术中的语音识别模型的识别不准确的技术问题。为实现上述目的,本专利技术提供一种语音识别模型的构建方法,所述语音识别模型的构建方法包括:所述语音识别模型的构建方法包括:采集终端周围环境的声音数据;本文档来自技高网...

【技术保护点】
1.一种语音识别模型的构建方法,其特征在于,所述语音识别模型的构建方法包括:/n采集终端周围环境的声音数据;/n若所述声音数据中包含有人声音特征时,则将所述声音数据分离为所述人声音特征和非人声音特征;/n将所述人声音特征的信号值调整放大和将所述非人声音特征的信号值调整缩小;/n经调整后的所述人声音特征和所述非人声音特征进行重新合并,以获得目标声音数据;/n将所述目标声音数据作为样本声音数据,以训练构建语音识别模型。/n

【技术特征摘要】
1.一种语音识别模型的构建方法,其特征在于,所述语音识别模型的构建方法包括:
采集终端周围环境的声音数据;
若所述声音数据中包含有人声音特征时,则将所述声音数据分离为所述人声音特征和非人声音特征;
将所述人声音特征的信号值调整放大和将所述非人声音特征的信号值调整缩小;
经调整后的所述人声音特征和所述非人声音特征进行重新合并,以获得目标声音数据;
将所述目标声音数据作为样本声音数据,以训练构建语音识别模型。


2.如权利要求1所述的语音识别模型的构建方法,其特征在于,所述将所述人声音特征的信号值调整放大和将所述非人声音特征的信号值调整缩小的步骤,包括:
获取所述人声音特征,并按第一预设百分比将所述人声音特征的信号值调整放大;
获取所述非人声音特征,并按第二预设百分比将所述人声音特征的信号值调整缩小,其中所述第一预设百分比大于所述第二预设百分比。


3.如权利要求1所述的语音识别模型的构建方法,其特征在于,所述若所述声音数据中包含有人声音特征时的步骤之后,包括:
判断人声音特征的能量值是否大于或等于预设能量阀值;
若所述人声音特征的能量值大于或等于所述预设能量阀值时,则将所述声音数据分离为所述人声音特征和所述非人声音特征。


4.如权利要求1所述的语音识别模型的构建方法,其特征在于,所述若所述声音数据中包含有人声音特征时,则将所述声音数据分离为所述人声音特征和非人声音特征的步骤,包括:
判断所述声音数据中是否包含有所述人声音特征;
若所述声音数据中包含有所述人声音特征时,则从所述声音数据中剪切出人声音特征的部分;将未被剪切的部分作为所述非人声音特征,以获得分离后的所述人声音特征和所述非人声音特征。


5.如权利要求4所述的语音识别模型的构建方法,其特征在于,所述判断所述声音数据中是否包含有所述人声音特征的步骤,包括:
检测所述声音数据中是否包含...

【专利技术属性】
技术研发人员:陈昊亮许敏强杨世清
申请(专利权)人:广州国音智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1