一种基于口语音调标记的语音自适应方法及系统技术方案

技术编号：36457540 阅读：12 留言：0更新日期：2023-01-25 22:55

本发明专利技术涉及一种基于口语音调标记的语音自适应方法及系统，通过分析基于采集的用户语音所得第一音调序列与基于预设标记的第二音调序列之间差异，动态化调整输出语音，在现有大类方言选择基础上，通过记录并自由标记用户口语音调针对性匹配调整交互语音输出，最终形成与用户口语习惯相一致的语音交互体验，能够极大的拓展语音交互类产品的应用范围，尤其适用于老年人语音交互产品的开发使用。用于老年人语音交互产品的开发使用。用于老年人语音交互产品的开发使用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于口语音调标记的语音自适应方法及系统

[0001]本专利技术涉及适老产品开发及语音数据处理
，尤其涉及一种基于口语音调标记的语音自适应方法及系统。

技术介绍

[0002]随着智能科技不断进步，语音交互技术逐渐应用于各种生活场景，老年人也越来越多使用到语音交互技术，包括智能音箱、智能语音客服、智能语音问诊、语音交互训练游戏、陪伴机器人等。一方面智能语言交互技术可以辅助老年人生活，替代按键、打字等输入方式，还通过与老年人的强逻辑性语音交互帮助老年人保持思维活性、提升认知与沟通能力。但另一方面由于老年人普遍存在方言重、语速慢、音量低、吐字不清等问题，尤其是我国多地域的不同方言更是成为目前语音交互技术发展的技术难题。
[0003]现有语音交互技术必须面对的一大技术问题是如何支持各地域老年人的不同方言习惯，并针对性提高语音交互识别效率。虽然现有技术多有采用预设多种不同主要地方方言供用户选择的方式，在一定程度上扩展了产品的适用人群和范围，但仍然需要老年人调整自身语言习惯对产品进行适应，且对于小众方言难以完全开发适配。

技术实现思路

[0004]为解决现有技术的不足，本专利技术提出一种基于口语音调标记的语音自适应方法及系统，在现有大类方言选择基础上，通过记录并自由标记用户口语音调针对性匹配调整交互语音输出，最终形成与用户口语习惯相一致的语音交互体验，能够极大的拓展语音交互类产品的应用范围，尤其适用于老年人语音交互产品的开发使用。
[0005]为实现以上目的，本专利技术所采用的技术方案包括...

【技术保护点】

【技术特征摘要】
1.一种基于口语音调标记的语音自适应方法，其特征在于，包括：S1、根据基础方言类型选择，载入预设音调标记；S2、获取用户语音，识别用户语音信息和对应的第一音调序列；S3、使用预设音调标记处理用户语音信息，获得第二音调序列；S4、判断第一音调序列与第二音调序列之间的差异度是否大于预设阈值，当判断第一音调序列与第二音调序列之间的差异度不大于预设阈值时，将预设音调标记登记为输出音调标记；S5、当判断第一音调序列与第二音调序列之间的差异度大于预设阈值时，使用预设调整系数将第二音调序列向第一音调序列调整，直至调整后所得第三音调序列与第一音调序列之间的差异度不大于预设阈值；S6、基于第三音调序列修改预设音调标记，获得输出音调标记；S7、使用输出音调标记调整语音输出内容。2.如权利要求1所述的方法，其特征在于，所述方法还包括：S8、向用户反馈语音输出内容，获取用户复述的语音输出内容，识别对应的第四音调序列；S9、使用第四音调序列替换第一音调序列，重复执行步骤S4至S7。3.如权利要求1所述的方法，其特征在于，所述差异度的计算方法包括：使用第二音调序列与第一音调序列相减，获得差异值；使用差异值除以第一音调序列，获得差异度。4.如权利要求3所述的方法，其特征在于，所述预设调整系数大于0且小于等于1。5.如权利要求4所述的方法，其特征在于，所...

【专利技术属性】
技术研发人员：韩涵，陈文，庚旭，姜磊，李鹏，李鸿生，周白冰，王钰琬，冯书娇，鲁卫华，李百合，张鹏，吕非非，尚志嵬，张彦，
申请(专利权)人：中国电子工程设计院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人