一种基于口语音调标记的语音自适应方法及系统技术方案

技术编号:36457540 阅读:12 留言:0更新日期:2023-01-25 22:55
本发明专利技术涉及一种基于口语音调标记的语音自适应方法及系统,通过分析基于采集的用户语音所得第一音调序列与基于预设标记的第二音调序列之间差异,动态化调整输出语音,在现有大类方言选择基础上,通过记录并自由标记用户口语音调针对性匹配调整交互语音输出,最终形成与用户口语习惯相一致的语音交互体验,能够极大的拓展语音交互类产品的应用范围,尤其适用于老年人语音交互产品的开发使用。用于老年人语音交互产品的开发使用。用于老年人语音交互产品的开发使用。

【技术实现步骤摘要】
一种基于口语音调标记的语音自适应方法及系统


[0001]本专利技术涉及适老产品开发及语音数据处理
,尤其涉及一种基于口语音调标记的语音自适应方法及系统。

技术介绍

[0002]随着智能科技不断进步,语音交互技术逐渐应用于各种生活场景,老年人也越来越多使用到语音交互技术,包括智能音箱、智能语音客服、智能语音问诊、语音交互训练游戏、陪伴机器人等。一方面智能语言交互技术可以辅助老年人生活,替代按键、打字等输入方式,还通过与老年人的强逻辑性语音交互帮助老年人保持思维活性、提升认知与沟通能力。但另一方面由于老年人普遍存在方言重、语速慢、音量低、吐字不清等问题,尤其是我国多地域的不同方言更是成为目前语音交互技术发展的技术难题。
[0003]现有语音交互技术必须面对的一大技术问题是如何支持各地域老年人的不同方言习惯,并针对性提高语音交互识别效率。虽然现有技术多有采用预设多种不同主要地方方言供用户选择的方式,在一定程度上扩展了产品的适用人群和范围,但仍然需要老年人调整自身语言习惯对产品进行适应,且对于小众方言难以完全开发适配。

技术实现思路

[0004]为解决现有技术的不足,本专利技术提出一种基于口语音调标记的语音自适应方法及系统,在现有大类方言选择基础上,通过记录并自由标记用户口语音调针对性匹配调整交互语音输出,最终形成与用户口语习惯相一致的语音交互体验,能够极大的拓展语音交互类产品的应用范围,尤其适用于老年人语音交互产品的开发使用。
[0005]为实现以上目的,本专利技术所采用的技术方案包括
[0006]一种基于口语音调标记的语音自适应方法,其特征在于,包括:
[0007]S1、根据基础方言类型选择,载入预设音调标记;
[0008]S2、获取用户语音,识别用户语音信息和对应的第一音调序列;
[0009]S3、使用预设音调标记处理用户语音信息,获得第二音调序列;
[0010]S4、判断第一音调序列与第二音调序列之间的差异度是否大于预设阈值,当判断第一音调序列与第二音调序列之间的差异度不大于预设阈值时,将预设音调标记登记为输出音调标记;
[0011]S5、当判断第一音调序列与第二音调序列之间的差异度大于预设阈值时,使用预设调整系数将第二音调序列向第一音调序列调整,直至调整后所得第三音调序列与第一音调序列之间的差异度不大于预设阈值;
[0012]S6、基于第三音调序列修改预设音调标记,获得输出音调标记;
[0013]S7、使用输出音调标记调整语音输出内容。
[0014]进一步地,所述方法还包括:
[0015]S8、向用户反馈语音输出内容,获取用户复述的语音输出内容,识别对应的第四音
调序列;
[0016]S9、使用第四音调序列替换第一音调序列,重复执行步骤S4至S7。
[0017]进一步地,所述差异度的计算方法包括:
[0018]使用第二音调序列与第一音调序列相减,获得差异值;
[0019]使用差异值除以第一音调序列,获得差异度。
[0020]进一步地,所述预设调整系数大于0且小于等于1。
[0021]进一步地,所述使用预设调整系数将第二音调序列向第一音调序列调整包括:
[0022]使用预设调整系数与差异度相乘,获得调整目标系数;
[0023]使用调整目标系数调整第二音调序列。
[0024]本专利技术还涉及一种基于口语音调标记的语音自适应系统,其特征在于,包括:
[0025]语音识别模块,用于识别用户语音信息和对应的第一音调序列;
[0026]音调标记处理模块,用于使用预设音调标记处理用户语音信息,获得第二音调序列;
[0027]音调序列判断模块,用于判断第一音调序列与第二音调序列之间的差异度是否大于预设阈值;
[0028]音调序列调整模块,用于使用预设调整系数将第二音调序列向第一音调序列调整,获得第三音调序列;
[0029]音调标记管理模块,用于基于第三音调序列修改预设音调标记,获得输出音调标记;
[0030]语音输出模块,用于使用输出音调标记调整语音输出内容。
[0031]本专利技术还涉及一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0032]本专利技术还涉及一种电子设备,其特征在于,包括处理器和存储器;
[0033]所述存储器,用于存储预设音调标记、预设阈值和预设调整系数;
[0034]所述处理器,用于通过调用预设音调标记、预设阈值和预设调整系数,执行上述的方法。
[0035]本专利技术还涉及一种计算机程序产品,包括计算机程序和/或指令,其特征在于,该计算机程序和/或指令被处理器执行时实现上述方法的步骤。
[0036]本专利技术的有益效果为:
[0037]采用本专利技术所述基于口语音调标记的语音自适应方法及系统,在现有大类方言选择基础上,通过记录并自由标记用户口语音调针对性匹配调整交互语音输出,最终形成与用户口语习惯相一致的语音交互体验,能够极大的拓展语音交互类产品的应用范围,尤其适用于老年人语音交互产品的开发使用。
附图说明
[0038]图1为本专利技术基于口语音调标记的语音自适应方法流程示意图。
[0039]图2为本专利技术基于口语音调标记的语音自适应系统结构示意图。
具体实施方式
[0040]为了更清楚的理解本专利技术的内容,将结合附图和实施例详细说明。
[0041]本专利技术第一方面涉及一种步骤流程如图1所示的基于口语音调标记的语音自适应方法,包括:
[0042]S1、根据基础方言类型选择,载入预设音调标记。
[0043]其中,基础方言类型可以优选为除普通话之外的广泛使用方言类型,例如广东话、福建话、东北话等。用户可以根据自身口语习惯,选择地域、用词想接近的基础方言类型作为口语音调标记基础。
[0044]预设音调标记涵盖了对应基础方言类型常规的特殊口音音调,例如句首加重、句尾加重、句中转音,以及对于特殊词汇的特殊音调标记等。
[0045]S2、获取用户语音,识别用户语音信息和对应的第一音调序列。
[0046]其中,用户语音信息优选采用适合的语义识别方式处理。对于特殊方言,可能存在用户语音信息识别不准确的情况,可以酌情增加用户确认信息步骤,以保证后续音调标注能够准确匹配用户语音内容。
[0047]对应的第一音调序列优选为用户语音的模拟输入直接匹配用户语音信息的标注集合,以准确完整体现用户口语音调习惯。
[0048]S3、使用预设音调标记处理用户语音信息,获得第二音调序列。
[0049]在确定正确获取用户语音信息的基础上,通过使用预设音调标记完全独立的对用户语音信息进行处理,形成当前设定状态下预计将会输出的第二音调序列。第二音调序列的生成使完全不参考用户口音音调习惯的,仅根据系统预设值对用户语音内容进行针对性处理。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于口语音调标记的语音自适应方法,其特征在于,包括:S1、根据基础方言类型选择,载入预设音调标记;S2、获取用户语音,识别用户语音信息和对应的第一音调序列;S3、使用预设音调标记处理用户语音信息,获得第二音调序列;S4、判断第一音调序列与第二音调序列之间的差异度是否大于预设阈值,当判断第一音调序列与第二音调序列之间的差异度不大于预设阈值时,将预设音调标记登记为输出音调标记;S5、当判断第一音调序列与第二音调序列之间的差异度大于预设阈值时,使用预设调整系数将第二音调序列向第一音调序列调整,直至调整后所得第三音调序列与第一音调序列之间的差异度不大于预设阈值;S6、基于第三音调序列修改预设音调标记,获得输出音调标记;S7、使用输出音调标记调整语音输出内容。2.如权利要求1所述的方法,其特征在于,所述方法还包括:S8、向用户反馈语音输出内容,获取用户复述的语音输出内容,识别对应的第四音调序列;S9、使用第四音调序列替换第一音调序列,重复执行步骤S4至S7。3.如权利要求1所述的方法,其特征在于,所述差异度的计算方法包括:使用第二音调序列与第一音调序列相减,获得差异值;使用差异值除以第一音调序列,获得差异度。4.如权利要求3所述的方法,其特征在于,所述预设调整系数大于0且小于等于1。5.如权利要求4所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:韩涵陈文庚旭姜磊李鹏李鸿生周白冰王钰琬冯书娇鲁卫华李百合张鹏吕非非尚志嵬张彦
申请(专利权)人:中国电子工程设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1