文本的处理方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：24414235 阅读：42 留言：0更新日期：2020-06-06 10:40

本公开提供一种文本的处理方法、装置、设备及计算机可读存储介质，方法包括：获取待处理文本，对所述待处理文本进行向量化处理，获得所述待处理文本对应的第一向量信息；将所述第一向量信息输入至预设的预训练层，获得所述待处理文本信息对应的稠密向量；采用预设的多任务输出层对所述第一向量信息以及所述稠密向量进行处理，获得所述待处理文本对应的语言学特征信息；根据所述语言学特征信息生成所述待处理文本对应的合成语音。从而避免了由于多个网络模型的累计误差造成的语言学特征信息不精准的缺陷。此外，无需对多个网络模型进行分别训练，训练效率较高。

Text processing method, device, equipment and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
文本的处理方法、装置、设备及计算机可读存储介质
本公开涉及人工智能领域，尤其涉及一种文本的处理方法、装置、设备及计算机可读存储介质。
技术介绍
随着人工智能的蓬勃发展，合成语音越来越多的应用在工作、生活中。举例来说，终端设备中可以安装有智能语音助手的应用，该应用可以获取用户的语音指令，并采用预设的合成语音对该语音指令进行响应。为了提高用户体验，合成语音中也需要引入语言学特征信息，例如语音、语调等。因此，在生成合成语音的过程中，首先要确定待合成语音的文本对应的语言学特征信息，从而根据语言学特征信息生成的合成语音能够更加贴合用户的语音。现有技术中一般都是采用pipeline流程实现对待合成语音的文本对应的语言学特征信息的获取，现有技术中用于确定文本语音学特征信息的文本处理装置中具体包括多个网络模型，例如分词模型、韵律获取模型等。多个网络模型按照预设的顺序连接，前一网络模型输出的分类结果作为后一网络模型的输入，将最后一网络模型输出的数据作为待合成语音的文本对应的语言学特征信息。但是，采用上述方法进行待合成语音的文本对应的语言学特征信息的获取时，由于各网络模型均存在误差信息，多个网络模型的累计误差信息较大，导致确定的语言学特征信息准确率不高。此外，每一个网络模型均需要单独训练，训练过程较为繁琐。
技术实现思路
本公开提供一种文本的处理方法、装置、设备及计算机可读存储介质，用于解决现有的文本语言学特征信息获取方法多个网络模型输出的数据的累计误差较大，导致获得的语言学特征信息也不够精准...

【技术保护点】
1.一种文本的处理方法，其特征在于，包括：/n获取待处理文本，对所述待处理文本进行向量化处理，获得所述待处理文本对应的第一向量信息；/n将所述第一向量信息输入至预设的预训练层，获得所述待处理文本信息对应的稠密向量；/n采用预设的多任务输出层对所述第一向量信息以及所述稠密向量进行处理，获得所述待处理文本对应的语言学特征信息；/n根据所述语言学特征信息生成所述待处理文本对应的合成语音。/n

【技术特征摘要】
1.一种文本的处理方法，其特征在于，包括：
获取待处理文本，对所述待处理文本进行向量化处理，获得所述待处理文本对应的第一向量信息；
将所述第一向量信息输入至预设的预训练层，获得所述待处理文本信息对应的稠密向量；
采用预设的多任务输出层对所述第一向量信息以及所述稠密向量进行处理，获得所述待处理文本对应的语言学特征信息；
根据所述语言学特征信息生成所述待处理文本对应的合成语音。

2.根据权利要求1所述的方法，其特征在于，所述对所述待处理文本进行向量化处理，包括：
通过Embedding方法对所述待处理文本进行向量化处理。

3.根据权利要求1所述的方法，其特征在于，所述采用预设的多任务输出层对所述第一向量信息以及所述稠密向量进行处理，包括：
通过残差网络连接所述第一向量信息以及所述稠密向量，采用预设的多任务输出层对连接后的所述第一向量信息以及所述稠密向量进行处理。

4.根据权利要求1所述的方法，其特征在于，所述多任务输出层包括编码层以及解码层，所述采用预设的多任务输出层对所述第一向量信息以及所述稠密向量进行处理，包括：
采用所述编码层对所述第一向量信息以及所述稠密向量进行处理，获得包括所述稠密向量以及第一向量信息隐藏表征信息的第二向量信息；
采用所述解码层对所述第二向量信息进行处理，获得所述待处理文本对应的语言学特征信息。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：
确定所述待处理文本中拼音不包括声母的字符；
对所述字符拼音中的声母进行补充操作，以使所述待处理文本中各字符的拼音能够对齐。

6.根据权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：
获取待训...

【专利技术属性】
技术研发人员：潘俊杰，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人