自适应英语语音的生成方法技术

技术编号:26480611 阅读:19 留言:0更新日期:2020-11-25 19:26
本发明专利技术公开了一种自适应英语语音的生成方法,所述方法包括:接收触发的英语语音生成指令,基于所述英语语音生成指令,采集目标语音信号;对采集的所述目标语音信号进行信号分析和处理,得到对应的待保留信号;针对得到的所述待保留信号,参照英语语音对应的标准语音信号,对所述待保留信号进行缺陷识别;根据缺陷识别结果,将包含所述目标语音信号的语音数据输入对应的英语语音输出模型中,获取语音输出结果,得到生成的英语语音;实现了根据缺陷结果进行语音输入的目的,提高了英语语音输出的精准性和智能性,同时,也提高了英语语音的输出效率。

【技术实现步骤摘要】
自适应英语语音的生成方法
本专利技术涉及语音处理
,特别涉及一种自适应英语语音的生成方法。
技术介绍
随着人工智能的不断发展进步,智能语音服务也越来越多地应用到人们的日常工作和生活中,同时,为适应不同的应用场景、满足不同的需求,使用英语作为输出语言的人工智能的需求也越来越多。目前,现有技术中使用的英语语音输出的方式,基本上都是直接将语音信号输入对应的语音输出模型中,并获取语音输出结果,从而直接输出英语语音。这种处理方式没有对输入的语音信号进行缺陷分析和识别,使得输出的英语语音不够准确。
技术实现思路
本专利技术提供一种自适应英语语音的生成方法,旨在分析输入的语音信号并进行缺陷识别,从而根据识别结果输入至对应的语音输出模型中,提高英语语音输出的精准性。本专利技术提供了一种自适应英语语音的生成方法,所述方法包括:接收触发的英语语音生成指令,基于所述英语语音生成指令,采集目标语音信号;对采集的所述目标语音信号进行信号分析和处理,得到对应的待保留信号;针对得到的所述待保留信号,参照英语语音对应的标准语音信号,对所述待保留信号进行缺陷识别;根据缺陷识别结果,将包含所述目标语音信号的语音数据输入对应的英语语音输出模型中,获取语音输出结果,得到生成的英语语音。进一步地,所述对采集的所述目标语音信号进行信号分析和处理,得到对应的待保留信号,包括:对采集的所述目标语音信号进行信号帧节拆分,得到拆分后的m帧语音信号;将拆分后得到的m帧语音信号进行信号转换,得到对应的电信号;对信号转换后得到的所述电信号进行滤波处理,得到对应的待提取信号;从所述待提取信号中提取出所述电信号的特征信息,同时将所述待提取信号中的其他杂余信息进行过滤,形成所述待保留信号。进一步地,所述针对得到的所述待保留信号,参照英语语音对应的标准语音信号,对所述待保留信号进行缺陷识别,包括:针对得到的所述待保留信号,对所述待保留信号进行信号预处理,并基于对所述待保留信号的预处理结果,提取所述待保留信号中与语音韵律相关的n个特征参数;根据提取出的所述n个特征参数,计算所述待保留信号中每一帧信号的分值;根据计算得到的所述待保留信号中每一帧信号的分值,对所述待保留信号进行缺陷识别。进一步地,所述与语音韵律相关的n个特征参数包括:音调、音准和音律。进一步地,所述根据提取出的所述n个特征参数,计算所述待保留信号中每一帧信号的分值,包括:根据提取出的所述n个特征参数,利用公式(1),计算所述待保留信号中每一帧信号分别对应的第一分数值S1,则有:公式(1)中,βi表示所述待保留信号中每一帧信号的第i个特征参数的实际特征值,为预设值,其取值范围为[0,1];χi表示所述待保留信号中每一帧信号的第i个特征参数的权重值,为预设值,其取值范围为[0,1];βi′表示所述待保留信号中每一帧信号的第i个特征参数的标准特征值,为预设值,其取值范围为[0,1]。进一步地,所述根据计算得到的所述待保留信号中每一帧信号的分值,对所述待保留信号进行缺陷识别,包括:根据计算得到的所述待保留信号中每一帧信号的所述第一分数值,计算所述待保留信号映射的所述目标语音信号的第二分数值;判断所述第一分数值和第二分数值是否均满足预设英语分数标准值;若所述第一分数值和第二分数值均满足预设英语分数标准值,则识别出所述待保留信号不存在缺陷;若所述第一分数值和第二分数值没有同时满足预设英语分数标准值,则识别出所述待保留信号存在缺陷。进一步地,所述根据计算得到的所述待保留信号中每一帧信号的所述第一分数值,计算所述待保留信号映射的所述目标语音信号的第二分数值,包括:根据所述第一分数值S1,找出所述第一分数值S1中的最大值Smax,针对所述目标语音信号中包含的m帧信号,利用公式(2),计算所述目标语音信号的第二分数值S2,则有:公式(2)中,Smax表示所有第一分数值S1中对应的最大分数值;λ表示所述最大分数值Smax对应的待保留信号在所述目标语音信号中的占比值,A3表示所述待保留信号中包含的信号帧。进一步地,所述根据缺陷识别结果,将包含所述目标语音信号的语音数据输入对应的英语语音输出模型中,包括:在识别出所述待保留信号不存在缺陷时,将所述待保留信号映射的目标语音信号输入至所述英语语音输出模型中;在识别出所述待保留信号存在缺陷时,根据缺陷识别结果,将缺陷识别结果信息与所述目标语音信号一起输入至所述英语语音输出模型中。进一步地,所述在识别出所述待保留信号存在缺陷时,根据缺陷识别结果,将缺陷识别结果信息与所述目标语音信号一起输入至所述英语语音输出模型中,包括:在识别出所述待保留信号存在缺陷时,调用预先存储的缺陷数据库;基于所述缺陷数据库,对所述目标语音信号进行缺陷识别,得到与所述目标语音信号相匹配的缺陷识别结果信息;将所述缺陷识别结果信息与所述目标语音信号一起输入至所述英语语音输出模型中。进一步地,所述接收触发的英语语音生成指令,基于所述英语语音生成指令,采集目标语音信号,包括:接收触发的英语语音生成指令,对触发的所述英语语音生成指令进行鉴权,并在鉴权通过时,根据所述英语语音生成指令,采集对应的目标语音信号;其中,所述英语语音生成指令的触发方式包括:用户触发对应的英语语音生成指令的手动触发方式,以及系统自动触发的触发方式;其中,当系统检测到满足英语语音生成指令的触发条件时,由系统自动触发所述英语语音生成指令。本专利技术自适应英语语音的生成方法,通过接收触发的英语语音生成指令,基于所述英语语音生成指令,采集目标语音信号;对采集的所述目标语音信号进行信号分析和处理,得到对应的待保留信号;针对得到的所述待保留信号,参照英语语音对应的标准语音信号,对所述待保留信号进行缺陷识别;根据缺陷识别结果,将包含所述目标语音信号的语音数据输入对应的英语语音输出模型中,获取语音输出结果,得到生成的英语语音;实现了根据缺陷结果进行语音输入的目的,提高了英语语音输出的精准性和智能性,同时,也提高了英语语音的输出效率。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所指出的内容来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1是本专利技术自适应英语语音的生成方法的一种实施方式的工作流程示意图。图2是本专利技术自适应英语语音的生成方法中,对目标语音信号进行处理得到待保留信号的一种实施例方式的工作流程示意图。图3是本专利技术自适应英语语音的生成方本文档来自技高网...

【技术保护点】
1.一种自适应英语语音的生成方法,其特征在于,所述方法包括:/n接收触发的英语语音生成指令,基于所述英语语音生成指令,采集目标语音信号;/n对采集的所述目标语音信号进行信号分析和处理,得到对应的待保留信号;/n针对得到的所述待保留信号,参照英语语音对应的标准语音信号,对所述待保留信号进行缺陷识别;/n根据缺陷识别结果,将包含所述目标语音信号的语音数据输入对应的英语语音输出模型中,获取语音输出结果,得到生成的英语语音。/n

【技术特征摘要】
1.一种自适应英语语音的生成方法,其特征在于,所述方法包括:
接收触发的英语语音生成指令,基于所述英语语音生成指令,采集目标语音信号;
对采集的所述目标语音信号进行信号分析和处理,得到对应的待保留信号;
针对得到的所述待保留信号,参照英语语音对应的标准语音信号,对所述待保留信号进行缺陷识别;
根据缺陷识别结果,将包含所述目标语音信号的语音数据输入对应的英语语音输出模型中,获取语音输出结果,得到生成的英语语音。


2.如权利要求1所述的自适应英语语音的生成方法,其特征在于,所述对采集的所述目标语音信号进行信号分析和处理,得到对应的待保留信号,包括:
对采集的所述目标语音信号进行信号帧节拆分,得到拆分后的m帧语音信号;
将拆分后得到的m帧语音信号进行信号转换,得到对应的电信号;
对信号转换后得到的所述电信号进行滤波处理,得到对应的待提取信号;
从所述待提取信号中提取出所述电信号的特征信息,同时将所述待提取信号中的其他杂余信息进行过滤,形成所述待保留信号。


3.如权利要求1所述的自适应英语语音的生成方法,其特征在于,所述针对得到的所述待保留信号,参照英语语音对应的标准语音信号,对所述待保留信号进行缺陷识别,包括:
针对得到的所述待保留信号,对所述待保留信号进行信号预处理,并基于对所述待保留信号的预处理结果,提取所述待保留信号中与语音韵律相关的n个特征参数;
根据提取出的所述n个特征参数,计算所述待保留信号中每一帧信号的分值;
根据计算得到的所述待保留信号中每一帧信号的分值,对所述待保留信号进行缺陷识别。


4.如权利要求3所述的自适应英语语音的生成方法,其特征在于,所述与语音韵律相关的n个特征参数包括:音调、音准和音律。


5.如权利要求3所述的自适应英语语音的生成方法,其特征在于,所述根据提取出的所述n个特征参数,计算所述待保留信号中每一帧信号的分值,包括:
根据提取出的所述n个特征参数,利用公式(1),计算所述待保留信号中每一帧信号分别对应的第一分数值S1,则有:



公式(1)中,βi表示所述待保留信号中每一帧信号的第i个特征参数的实际特征值,为预设值,其取值范围为[0,1];χi表示所述待保留信号中每一帧信号的第i个特征参数的权重值,为预设值,其取值范围为[0,1];βi′表示所述待保留信号中每一帧信号的第i个特征参数的标准特征值,为预设值,其取值范围为[0,1]。


6.如权利要求5所述的自适应英语语音的生成方法,其特征在于,所述根据计算得到的所述待保留信号中每一帧信号的分值,对所述待保留信号进行缺陷识别,包括:
根据计算得到的所...

【专利技术属性】
技术研发人员:崔炜
申请(专利权)人:上海松鼠课堂人工智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1