语音处理方法、装置及智能设备制造方法及图纸

技术编号:21955251 阅读:15 留言:0更新日期:2019-08-24 19:06
本发明专利技术实施例公开了一种语音处理方法、装置及智能设备,其中方法包括:在获取到用户语音信息之后,获取其所包括的音色参数和语音内容,并查找与所述语音信息所包括的语音内容相匹配的第一校验语音,获取所述第一校验语音的音色参数。进一步的,基于所述用户语音信息中的音色参数和所述第一校验语音中的音色参数确定参考音色频率,并根据所述参考音色频率生成与用户语音信息所包括的语音内容相匹配的第二校验语音。采用本发明专利技术实施例,可根据用户的音色参数生成校验语音,以便于用户较直观地进行口语练习。

Speech Processing Method, Device and Intelligent Equipment

【技术实现步骤摘要】
语音处理方法、装置及智能设备
本专利技术涉及语音处理
,尤其涉及一种语音处理方法、装置及智能设备。
技术介绍
在当今时代,随着经济全球化的发展和我们国外开放政策的贯彻,国际间的交流日趋增加,这样带动了用户学习外语的热情。为了能够熟练与外国人进行交谈,必须要提高外语口语水平。现在进行口语练习常见的方法是由专业人员比如教师针对一段外语内容录制口语朗读范本,然后用户对该段外语内容进行朗读练习,将用户的朗读练习与朗读范本比较,针对两者的不同生成可视化的对比曲线以供用户从曲线中找出差异并进行练习。实践发现这种方式对外语学习用户的外语学习的帮助并不高。因此,如何为用户提供更为直观的语音范本成为研究的热点问题。
技术实现思路
本专利技术实施例提供一种语音处理方法、装置及智能设备,可根据用户的音色参数生成校验语音,以便于用户较直观地进行口语练习。一方面,本专利技术实施例提供了一种语音处理方法,包括:获取用户语音信息,并获取所述用户语音信息中的音色参数;查找与所述用户语音信息所包括的语音内容匹配的第一校验语音,并获取所述第一校验语音的音色参数;基于所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定参考音色频率;基于所述参考音色频率生成与所述用户语音信息所包括的所述语音内容匹配的第二校验语音。另一方面,本专利技术实施例还提供了一种语音处理装置,包括:获取单元,用于获取用户语音信息,并获取所述用户语音信息中的音色参数;处理单元,用于查找与所述用户语音信息所包括的语音内容匹配的第一校验语音;所述获取单元,还用于获取所述第一校验语音的音色参数;所述处理单元,还用于基于所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定参考音色频率;所述处理单元,还用于基于所述参考音色频率生成与所述用户语音信息所包括的所述语音内容匹配的第二校验语音。又一方面,本专利技术实施例提供了一种智能设备,包括:处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述语音处理方法。相应地,本专利技术实施例还提供了一种计算机存储介质,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行上述语音处理方法。本专利技术实施例中在获取到用户语音信息及其对应的第一校验语音之后,可根据用户语音信息中的音色参数和第一校验语音中的音色参数确定参考音色频率,进一步的,基于该参考音色频率生成与用户语音信息相匹配的第二校验语音,实现了生成近似用户音色的校验语音,以便于用户较准确地纠正错误发音,提高用户口语练习的效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种语音处理系统的架构图;图2是本专利技术实施例提供的一种语音处理方法的流程示意图;图3是本专利技术实施例提供的一种纠正提示信息的示意图;图4是本专利技术实施例提供的一种语音处理装置的结构示意图;图5是本专利技术实施例提供的一种智能设备的结构示意图。具体实施方式在对外语口语练习的研究中发现,随着互联网的发展,口语练习已经从线下的面对面教学模式转变为线上口语练习模式。线下的面对面教学是指用户在指定时间到达指定地点跟随专业人员进行口语练习,这样的练习模式学习时间由口语专业人员根据自身的教学时间以及大部分口语练习者的时间来制定,用户不能自由选择学习口语的时间。线上口语练习模式下,用户可以通过智能设备比如手机,登录到口语练习网站或者下载口语练习视频等方式随时进行口语练习,在该种练习模式下,用户可以根据自己的时间安排口语练习时间。在一个实施例中,线上口语练习模式的方式可以是智能设备在用户界面上向用户展示一段外语口语的语音内容,当采集到用户针对该段语音内容的语音信息时,智能设备查找与该段语音内容相匹配的校验语音(也可称为标准语音),将校验语音与用户的语音信息进行对比,输出对比结果(比如对比结果可以是hello中字母e发音错误,正确发音为)以便于用户根据对比结果纠正发音。在其他实施例中,智能设备在查找到与语音内容相匹配的校验语音之后,还可以不断地播放该校验语音,以便于用户根据校验语音来纠正发音。在上述的两个实施例中,如果校验语音的音色与用户音色相近更利于用户直观的学习和对比标准音发音。下面将详细介绍本专利技术实施例是如何生成近似用户音色的第二校验语音,以便于用户根据与用户音色相同的标准音练习口语。参考图1,为本专利技术实施例提供的一种语音处理系统,图1所示的语音处理系统中可包括语音采集模块101、校验语音查询模块102、相似度评分模块103以及音色调整模块104。在一个实施例中,针对某个口语练习任务,所述语音采集模块101用于采集用户语音信息,所述语音采集模块101可以通过声音传感器比如麦克风采集用户语音信息。所述用户语音信息包括语音内容,当检测到语音采集模块101采集到用户语音信息之后,所述校验语音查询模块102查询与所述用户语音信息的语音内容匹配的第一校验语音。可选的,语音处理系统中可预先存储有第一校验语音集合,所述第一校验语音集合中包括至少一个第一校验语音,所述第一校验语音集合中每个第一校验语音中都包括语音内容,所述校验语音查询模块102查询与所述用户语音信息的语音内容匹配的第一校验语音的方式可以是:获取用户语音信息中所包括的语音内容;根据所述用户语音信息中所包括的语音内容从第一校验语音集合中查找目标第一校验语音,所述目标第一校验语音中所包括的语音内容与所述用户语音信息中所包括的所述语音内容相匹配;将所述目标第一校验语音作为与用户语音信息所包括的语音内容匹配的第一校验语音。在一个实施例中,获取到用户语音信息和第一校验语音之后,所述相似度评分模块103根据第一校验语音对用户语音信息进行相似度评分,以确定用户发音与第一校验语音发音之间的差异。如果相似度评分低于相似度阈值,表明用户发音准确度较低,音色调整模块104需要对第一校验语音进行音色调整,以使得用户根据与自己音色相同的校验语音练习口语;如果相似度评分高于相似度阈值,表明用户发音准确度较高,音色调整模块104可以不对第一校验语音进行音色调整。在一个实施例中,音色调整模块104对第一校验语音进行音色调整的方式可以是将第一校验语音的音色调整为用户的音色,调整了音色后的第一检验语音作为第二校验语音。在一个实施例中,图1所示的语音处理系统还可以包括语音播放模块105,所述语音播放模块105用于播放第一校验语音或第二校验语音以使得用户根据第一校验语音或者第二校验语音练习发音。综上所述,在图1所示的语音处理系统中,针对某个口语练习任务,首先通过语音采集模块101采集用户语音信息,校验语音查询模块102查找与用户语音信息对应的第一校验语音,进一步的,相似度评分模块103根据所述第一校验语音对用户语音信息进行相似度评分,得到相似度评分结果。在所述相似度评分结果低于相似度阈值时,音色调整模块104调整第一校验语音的音色,得到第二校验语音,最后语音播放模块105可播放第二校验语音以使得用本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:获取用户语音信息,并获取所述用户语音信息中的音色参数;查找与所述用户语音信息所包括的语音内容匹配的第一校验语音,并获取所述第一校验语音的音色参数;基于所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定参考音色频率;基于所述参考音色频率生成与所述用户语音信息所包括的所述语音内容匹配的第二校验语音。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:获取用户语音信息,并获取所述用户语音信息中的音色参数;查找与所述用户语音信息所包括的语音内容匹配的第一校验语音,并获取所述第一校验语音的音色参数;基于所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定参考音色频率;基于所述参考音色频率生成与所述用户语音信息所包括的所述语音内容匹配的第二校验语音。2.如权利要求1所述的方法,其特征在于,所述音色参数包括基音参数和泛音参数,所述参考音色频率包括参考基音频率和参考泛音频率。3.如权利要求1所述的方法,其特征在于,所述基于所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定参考音色频率之前,所述方法还包括:基于所述第一校验语音对所述用户语音信息进行相似度评分,得到相似度评分结果;若所述相似度评分结果满足音色调整条件,则触发执行所述基于所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定参考音色频率的步骤。4.如权利要求1-3任一项所述的方法,其特征在于,所述基于所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定参考音色频率,包括:确定所述第一校验语音的音色频率;根据所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定转换系数和修正参数;根据所述第一校验语音的音色频率、所述转换系数、所述修正参数以及音色频率转换规则,确定所述参考音色频率。5.如权利要求4所述的方法,其特征在于,所述用户语音信息中的音色参数包括根据所述用户语音信息中的目标时间段的音色频率确定的第一均值和第一方差,所述第一校验语音的音色参数包括根据所述第一校验语音的所述目标时间段的音色频率确定的第二均值和第二方差;所述根据所述用户语音信息中的音色参数和所述第一校验语音的音色参数确定转换系数和修正参数,包括:基于所述第一方差、所述第二方差和预设转换系数确定规则,确定所述转换系数;基于所述第一均值、所述第二均值和预设修正参数确定规则,确定所述修正参数。6.如权利要求1所述的方法,其特征在于,所述查找与所述用户语音信息所包括的语音内容匹配的第一校验语音,包括:获取所述用户语音信息中所包括的所述语音内容;根据所述用户语音信息中所包括的所述语音内容从第一校验语音集合中查找目标第一校验语音,所述目标第一校验语音中所包括的语音内容与所述用户语音信息中...

【专利技术属性】
技术研发人员:潘伟洲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1