AI语音数据的分析处理方法及系统技术方案

技术编号:34522449 阅读:44 留言:0更新日期:2022-08-13 21:12
本申请提供一种AI语音数据的分析处理方法系统,该方法包括:数据中心接收终端发送的待合成的第一文本信息,将该第一文本信息通过n种语音合成模型合成得到n个语音数据;数据中心将n个语音数据的每条语音数据分别通过m个语音识别模型识别得到n*m个文本识别结果,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果;数据中心将第一文本识别结果对应的第一语音数据作为第一文本信息对应的合成语音,将该合成语音发送至终端播放。本申请提供的技术方案具有用户体验度高的优点。体验度高的优点。体验度高的优点。

【技术实现步骤摘要】
AI语音数据的分析处理方法及系统


[0001]本专利技术涉及电子设备领域,具体涉及一种AI语音数据的分析处理方法及系统。

技术介绍

[0002]语音数据通常指的就是通过语音来记录的数据以及通过语音来传输的数据,也正是我们常说的声音文件,例如MP3文件等等。随着AI(人工智能)行业的发展,语音数据的处理数量越来越大,例如,小说阅读网站,儿童故事讲课网站,随着AI技术的发展,现有的小说阅读网站均由AI语音合成方式来提供语音数据,但是此种方式的准确率较低,影响用户的体验度。

技术实现思路

[0003]本专利技术实施例提供了一种AI语音数据的分析处理方法及系统,可以提高语音的准确率,提高用户体验度的优点。
[0004]第一方面,本专利技术实施例提供一种AI语音数据的分析处理方法,所述方法包括如下步骤:
[0005]数据中心接收终端发送的待合成的第一文本信息,将该第一文本信息通过n种语音合成模型合成得到n个语音数据;
[0006]数据中心将n个语音数据的每条语音数据分别通过m个语音识别模型识别得到n*m个文本识别结果,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果;
[0007]数据中心将第一文本识别结果对应的第一语音数据作为第一文本信息对应的合成语音,将该合成语音发送至终端播放。
[0008]第二方面,提供一种AI语音数据的分析处理系统,所述系统包括:
[0009]接收单元,用于接收终端发送的待合成的第一文本信息;
[0010]处理单元,用于将该第一文本信息通过n种语音合成模型合成得到n个语音数据;将n个语音数据的每条语音数据分别通过m个语音识别模型识别得到n*m个文本识别结果,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果;将第一文本识别结果对应的第一语音数据作为第一文本信息对应的合成语音,将该合成语音发送至终端播放。
[0011]第三方面,提供一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行第一方面提供的方法。
[0012]实施本专利技术实施例,具有如下有益效果:
[0013]可以看出,本申请提供的技术方案,本申请提供的技术方案数据中心接收终端发送的待合成的第一文本信息,将该第一文本信息通过n种语音合成模型合成得到n个语音数据;数据中心将n个语音数据的每条语音数据分别通过m个语音识别模型识别得到n*m个文本识别结果,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文
access to unlicensed spectrum,LTE

U)、免授权频谱上的NR系统(NR

based access tounlicensed spectrum,NR

U)、通用移动通信系统(Universal Mobile Telecommunication System,UMTS)、下一代通信系统或其他通信系统等。
[0024]小说是一种传统的阅读材料,随着电子产品的兴起,例如手机、平板电脑、阅读器等等设备的兴起,小说电子化,无纸化也成为一种趋势,用户已经完全适应从书本到电子书本的转变,随着AI语音数据处理能力的加强,有声读物也越来越多,有些用户在一些特定的场景下,例如开车、坐车时会采用有声读物的方式来实现对小说的阅读,对于小说的有声文件来说,由于小说的数据量大,依靠人工翻读是不切实际的,因此通过AI语音合成方式来实现对小说阅读成为大家的选择,但是现有的AI语音合成后就将对应的有声小说播放,这样可能导致语音播放的准确率低,由于没有增加响应的校验的方式,导致小说的阅读准确率低。
[0025]对于小说阅读,由于小说的文字部分是固定的,仅仅是语音部分可能出现错误,因此可以将文字部分作为样本来进行校对,进而从多种AI合成模型中选择准确率最高的语音数据进行播放,进而提高小说阅读的准确率。
[0026]参阅图2,图2提供了一种AI语音数据的分析处理方法,该方法如图2所示,该方法可以在终端与数据中心完成,该终端与数据中心可以通过网络设备连接,该连接方式可以为无线连接方式,该无线方式具体可以为上述无线通信系统提供的连接方式,本申请实施例并不限制上述连接的具体形式。上述方法如图2所示,具体可以包括:
[0027]步骤S201、数据中心接收终端发送的待合成的第一文本信息,将该第一文本信息通过n种语音合成模型合成得到n个语音数据;
[0028]上述n为大于等于2的整数,上述语音合成模型可以为现有的语音合成模型,例如,科大讯飞的语音合成模型、百度语音合成模型等等。
[0029]步骤S202、数据中心将n个语音数据的每条语音数据分别通过m个语音识别模型识别得到n*m个文本识别结果,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果;
[0030]上述m为大于等于2的整数,可以为n相等,也可以与n不同,上述语音识别模型可以为多种,例如小爱同学、siri、天猫精灵等等。
[0031]步骤S203、数据中心将第一文本识别结果对应的第一语音数据作为第一文本信息对应的合成语音,将该合成语音发送至终端播放。
[0032]本申请提供的技术方案数据中心接收终端发送的待合成的第一文本信息,将该第一文本信息通过n种语音合成模型合成得到n个语音数据;数据中心将n个语音数据的每条语音数据分别通过m个语音识别模型识别得到n*m个文本识别结果,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果;数据中心将第一文本识别结果对应的第一语音数据作为第一文本信息对应的合成语音,将该合成语音发送至终端播放。这样在播放语音数据之前,可以通过多种合成方式来选择最优的合成方式的语音数据作为播放的语音数据,进而提高语音播放的准确度,提高用户体验度。
[0033]示意的,上述方法在接收到第一文本信息之后,还可以包括:
[0034]数据中心将第一文本信息执行分段处理得到多个分段,将每个分段作为一个文本信息执行语音合成操作以及语音识别操作,查找每个分段的相似度最高的文本识别结果,
将所有分段的相似度最高的文本识别结果对应的所有分段的语音数据拼接得到拼接语音数据,将该拼接语音数据作为合成语音发送至终端播放。
[0035]示例的,上述分段可以采用通用的分段方式,上述段可以为文本信息的自然段,当然也可以为一句话等等。
[0036]示例的,上述将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果具体可以包括:
[0037]将n*m个文本识别结果中的一个文本识别结果与第一文本信息进行逐字比对获取与第一文本信息相同的字数量x1,确定相似度=x1/X;其中X为第一文本信息的总字数。
[0038]示例的,上述将n*m个文本识别结果中的一个文本识别结果与第一文本信息进行逐字比对获取与第一文本信息相同的字数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种AI语音数据的分析处理方法,其特征在于,所述方法包括如下步骤:数据中心接收终端发送的待合成的第一文本信息,将该第一文本信息通过n种语音合成模型合成得到n个语音数据;数据中心将n个语音数据的每条语音数据分别通过m个语音识别模型识别得到n*m个文本识别结果,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果;数据中心将第一文本识别结果对应的第一语音数据作为第一文本信息对应的合成语音,将该合成语音发送至终端播放。2.根据权利要求1所述的方法,其特征在于,所述方法在接收到第一文本信息之后,还包括:数据中心将第一文本信息执行分段处理得到多个分段,将每个分段作为一个文本信息执行语音合成操作以及语音识别操作,查找每个分段的相似度最高的文本识别结果,将所有分段的相似度最高的文本识别结果对应的所有分段的语音数据拼接得到拼接语音数据,将该拼接语音数据作为合成语音发送至终端播放。3.根据权利要求1所述的方法,其特征在于,将n*m个文本识别结果与该第一文本信息进行比对得到相似度最高的第一文本识别结果具体包括:将n*m个文本识别结果中的一个文本识别结果与第一文本信息进行逐字比对获取与第一文本信息相同的字数量x1,确定相似度=x1/X;其中X为第一文本信息的总字数。4.根据权利要求3所述的方法,其特征在于,所述将n*m个文本识别结果中的一个文本识别结果与第一文本信息进行逐字比对获取与第一文本信息相同的字数量x1具体包括:将一个文本识别结果按标点符号作为分隔符,将相邻两个分隔符之间的字符作为一个字符串A1,将第一文本信息按标点符号作为分隔符,将相邻两个分隔符之间的字符作为一个字符串B1,将字符串A1和字符串B1按分隔符前后对齐后,逐字比对确定字符串A1的相同字的数量x
n
,遍历所有分隔符中的字符串得到所有字符串的相同字的数量,将所有字符串的相同字的数量相加得到的和即为数...

【专利技术属性】
技术研发人员:冯甜甜
申请(专利权)人:深圳妙月科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1