一种导航语音数据生成方法及系统、智能终端和存储介质技术方案

技术编号：33884804 阅读：49 留言：0更新日期：2022-06-22 17:17

本发明专利技术提供了一种导航语音数据生成方法及系统、智能终端和存储介质。该方法包括：获取当前的导航场景需求，根据导航场景需求生成待输入语音内容；根据待输入语音内容向用户显示语音输入界面，语音输入界显示有待输入语音内容，以使得用户能够根据待输入语音内容输入待训练语音；根据待训练语音对语音训练模型进行语音训练，获取待训练语音的训练语音包，训练语音包括经过训练的语音训练模型的参数信息；获取导航待播放内容，导航待播放内容包括待播放文本，修改训练语音包中至少部分参数信息，根据修改后的训练语音包和待播放文本生成目标播放数据，以提升生成目标播放数据的生成效率。本发明专利技术可以有效降低用户的工作量，提升用户使用积极性。户使用积极性。户使用积极性。

全部详细技术资料下载

【技术实现步骤摘要】
一种导航语音数据生成方法及系统、智能终端和存储介质

[0001]本专利技术涉及人工智能领域，具体涉及一种导航语音数据生成方法及系统、智能终端和存储介质。

技术介绍

[0002]语音播报导航信息已经广泛应用于导航程序中，为了进一步提升用户的使用体验，很多导航程序不仅提供了多个名人的语音包，还可以通过现场录制用户声音，形成用户的个人语音包，用个人语音包替换系统的导航语音包，实现地图导航语音的个性化播报。
[0003]但是各个导航程序需要用户输入导航语句各不相同，若用户想要在多个导航程序设置个人语音包就需要分别针对各个导航程序执行语音录入的工作，这大大增加了用户的工作量，影响用户使用的积极性。特别是，部分用户想将自己离世的亲朋好友作为导航程序的个人语音包，作为思念，但是较大的工作量输入往往会阻碍用户使用此功能。

技术实现思路

[0004]本专利技术要解决的技术问题在于各个导航程序需要用户输入导航语句各不相同，若用户想要在多个导航程序设置个人语音包，则工作量较大，影响用户使用的积极性，针对现有技术的上述缺陷，...

【技术保护点】

【技术特征摘要】
1.一种导航语音数据生成方法，其特征在于，包括如下步骤：获取当前的导航场景需求，根据所述导航场景需求生成待输入语音内容，所述待输入语音内容包括单词、单字、句子中的一种或多种；根据所述待输入语音内容向用户显示语音输入界面，所述语音输入界显示有所述待输入语音内容，以使得用户能够根据所述待输入语音内容输入待训练语音；根据所述待训练语音对语音训练模型进行语音训练，获取所述待训练语音的训练语音包，所述训练语音包括所述经过训练的所述语音训练模型的参数信息；获取导航待播放内容，所述导航待播放内容包括待播放文本，修改所述训练语音包中至少部分参数信息，根据修改后的所述训练语音包和所述待播放文本生成目标播放数据，以提升生成所述目标播放数据的生成效率。2.根据权利要求1所述的导航语音数据生成方法，其特征在于，所述根据所述导航场景需求生成待输入语音内容的步骤，包括：根据所述导航场景需求获取所述导航场景需求的必要词汇和必要语句，所述必要词汇和所述必要语句重复率低于用户预设标准值。3.根据权利要求2所述的导航语音数据生成方法，其特征在于，所述根据所述待输入语音内容向用户显示语音输入界面的步骤之后，包括：获取所述待输入语音内容的待输入数据量以及用户输入的所述待训练语音的输入数据量，根据所述输入数据量和所述待输入数据量生成输入进度显示信息，向用户显示所述输入进度显示信息。4.根据权利要求1所述的导航语音数据生成方法，其特征在于，所述根据所述训练语音包和所述待播放文本生成目标播放数据的步骤，包括：判断所述待播放文本是否存在所述待输入语音内容中未包括的未包括文本；若所述待播放文本存在所述待输入语音内容中未包括的未包括文本，从所述待输入语音内容中选取与所述未包括文本对应的文本内容，获取所述待训练语音中与所述文本内容对应的文本语音，对所述文本语音进行拆分、重组、拼接、音调转换、振幅变换、发音时长伸缩变换、间隙时长伸缩变换、语速调节中的至少一个操作，获取与所述未包括文本对应的补充语音。5.根据权利要求4所述的导航语音数据生成方法，其特征在于，所述根据所述待输入语音内容向...

【专利技术属性】
技术研发人员：郭璟鹏，
申请(专利权)人：郭璟鹏，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人