一种标准发音的生成方法及系统技术方案

技术编号：39036357 阅读：9 留言：0更新日期：2023-10-10 11:49

本申请公开了一种标准发音的生成方法及系统，涉及音频生成的领域，尤其是涉及一种标准发音的生成方法及系统，其包括获取用户说话的语音内容信息、声音特征以及语音情绪信息；建立语言词典以及语言对应网；将获取的用户的语音内容信息进行断句和词语拆解，获取标准发音语句后进行输出；对获取的用户的声音特征进行分析，获取声音的响度特征、音调特征以及音色特征；对获取的用户的语音情绪信息进行分析获取用户的情绪标签，判断获取用户的言语情绪，判断获取用户的语气情绪；获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。本申请具有生成准确用户特征及情绪的标准发音，以提高不同区域间人员之间语言交流及情感交流的效率的效果。情感交流的效率的效果。情感交流的效率的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种标准发音的生成方法及系统

[0001]本申请涉及音频生成的领域，尤其是涉及一种标准发音的生成方法及系统。

技术介绍

[0002]随着人口流动性的增大，不论是本地人走出自己的家乡，进入到其他地区进行工作和生活，还是游客去其他地方进行出游，都面临着不同地区的人员有着不同的语言的发音，不同区域之间的人进行交流时难以听懂对方的语言。
[0003]相关技术中，在解决不同地区人员交流的问题时，多使用方言转文字的方式作为不同地区人员交流时的沟通桥梁，但是这种交流方式效率低下，且无法体现用户的声音特征及情绪特征，使用户之间的语言交流缺乏情感交流。
[0004]因此，如何生成具有准确用户特征及情绪的标准发音，以提高不同区域间人员之间语言交流及情感交流的效率成为了亟待解决的问题。

技术实现思路

[0005]为了生成具有准确用户特征及情绪的标准发音，以提高不同区域人员之间语言交流及情感交流的效率，本申请提供了一种标准发音的生成方法及系统。
[0006]第一方面，本申请提供了一种标准发音的生成方法，采用如下技术方案：
[0007]获取用户说话的语音内容信息、声音特征以及语音情绪信息；
[0008]建立语言词典以及语言对应网，获取各个方言的词语内容及其含义，并将其与标准发音的词语建立对应关系；
[0009]将获取的用户的语音内容信息进行断句，并将断句后的语音内容信息进行词语拆解，理解每个方言词语的内容含义，并基于所述语言词典找到对应的标准发音的词语，对获取的标准发音的词语进行...

【技术保护点】

【技术特征摘要】
1.一种标准发音的生成方法，其特征在于，包括以下步骤：获取用户说话的语音内容信息、声音特征以及语音情绪信息；建立语言词典以及语言对应网，获取各个方言的词语内容及其含义，并将其与标准发音的词语建立对应关系；将获取的用户的语音内容信息进行断句，并将断句后的语音内容信息进行词语拆解，理解每个方言词语的内容含义，并基于所述语言词典找到对应的标准发音的词语，对获取的标准发音的词语进行排列，获取标准发音语句，对其进行语法修饰后进行输出；对获取的用户的声音特征进行分析，获取用户说话时的声音的响度特征、音调特征以及音色特征，并基于该特征对获取的标准发音语句进行特征调整，使标准发音语句符合用户的声音特征；对获取的用户的语音情绪信息进行分析获取用户的情绪标签，根据方言词语的语音信息，判断获取用户的言语情绪，获取用户语音信息中的语气词的种类以及各种类语气词的使用频率，判断获取用户的语气情绪，根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征；基于用户的声音特征、情绪特征，对标准发音语句进行修饰调整，获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。2.根据权利要求1所述的一种标准发音的生成方法，其特征在于，所述建立语言词典以及语言对应网，获取各个方言的词语内容及其含义，并将其与标准发音的词语建立对应关系的步骤，包括：建立语言词典，获取各个地区的方言词语内容及含义，并输入至语言词典中；所述语言词典中的词条解释包含每个词语的使用场景，以及在不同场景中同一词语的含义；建立语言对应网，根据获取的语言词典中每个词语的内容及含义，与标准发音词语建立对应关系。3.根据权利要求1所述的一种标准发音的生成方法，其特征在于，所述将获取的用户的语音内容信息进行断句，并将断句后的语音内容信息进行词语拆解，理解每个方言词语的内容含义，并基于所述语言词典找到对应的标准发音的词语，对获取的标准发音的词语进行排列，获取标准发音语句，对其进行语法修饰后进行输出的步骤，包括：获取用户使用的方言的语法标准以及标准发音的语法标准；基于语言词典，将获取的用户的语音内容进行断句，获取方言语句，并进行词语拆解，分析判断每个方言词语的内容含义；基于语言对应网以及方言词语的内容含义，查询每个方言词语对应的标准发音的词语，并对获取到的标准发音的词语进行组句，获取标准发音的初始语句；基于方言的语法标准，对方言语句进行语法分析，判断方言语句的语法结构，获取方言语句的方言语法特征；根据方言语法特征，与标准发音的语法标准进行对比，获取语法调整策略，并根据语法调整策略对获取的标准发音的初始语句进行语法调整，获取标准发音语句，并进行输出。4.根据权利要求1所述的一种标准发音的生成方法，其特征在于，所述对获取的用户的声音特征进行分析，获取用户说话时的声音的响度特征、音调特征以及音色特征，并基于该
特征对获取的标准发音语句进行特征调整，使标准发音语句符合用户的声音特征的步骤，包括：获取用户的声音特征，分析用户说话时声音的平均响度以及在使用不同词语时每个词语的响度，获取用户声音的响度特征；根据用户的声音特征，分析用户说话时声音的平均音调高度以及在使用不同词语时每个词语的音调，获取用户声音的音调特征；根据用户的声音特征，分析用户在说话时声音的音色质感，获取用户声音的音色特征；根据获取的用户声音的响度特征、音调特征以及音色特征，对获取的标准发音语句进行特征修饰，获取符合用户声音特征的标准发音语句。5.根据权利要求1所述的一种标准发音的生成方法，其特征在于，所述对获取的用户的语音情绪信息进行分析获取用户的情绪标签，根据方言词语的语音信息，判断获取用户的言语情绪，获取用户语音信息中的语气词的种类以及各种类语气词的使用频率，判断获取用户的语气情绪，根据情绪标签、言语情绪以及语气情绪判断获取用户的情绪特征的步骤，包括：对获取的用户的语音情绪信息进行分析，判断获取用户当前基本的情绪标签；对获取的方言词语的语音信息进行判...

【专利技术属性】
技术研发人员：刘斌，
申请(专利权)人：齐鲁师范学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人