对文本识别说话者和训练说话者识别模型的方法和装置制造方法及图纸

技术编号：35515306 阅读：12 留言：0更新日期：2022-11-09 14:31

本申请公开了一种对文本识别说话者和训练说话者识别模型的方法和装置，属于计算机技术领域。所述方法包括：获取目标文本中的目标对白句；基于所述目标文本对应的说话者名单，对所述目标对白句的相邻句进行说话者名称识别；基于所述相邻句的说话者名称识别结果，在所述相邻句中确定所述目标对白句的说话者相关句；若确定出所述目标对白句的说话者相关句，则将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型，得到所述目标对白句的说话者信息。采用本申请，可以提高说话者识别模型的识别准确度。者识别模型的识别准确度。者识别模型的识别准确度。

全部详细技术资料下载

【技术实现步骤摘要】
对文本识别说话者和训练说话者识别模型的方法和装置

[0001]本申请涉及计算机
，特别涉及一种对文本识别说话者和训练说话者识别模型的方法和装置。

技术介绍

[0002]随着语音合成技术的不断发展，有声书朗读广泛兴起。在有声书朗读时，采取多说话人配音的朗读模式，能够大大提高用户的体验感。实现多说话人配音的朗读模式需要确定文本中对话的说话者。当前，大多通过机器学习的方式，将完整的文章文本输入到模型中，得到其中每个对白句对应的说话者。
[0003]但是，如果想要模型的预测结果较为准确，就需要大量完整的样本文章对模型进行训练。当样本文章数量较少时，无法保证经过训练的模型的预测结果的准确性。

技术实现思路

[0004]本申请实施例提供了一种对文本识别说话者和训练说话者识别模型的方法和装置，以解决相关技术的问题。所述技术方案如下：
[0005]第一方面，提供了一种对文本识别说话者的方法，所述方法包括：
[0006]获取目标文本中的目标对白句，所述目标对白句为所述目标文本的任一对白句；
[0007]基于所述目标文本对应的说话者名单，对所述目标对白句的相邻句进行说话者名称识别，其中所述说话者名单包括至少一个说话者名称；
[0008]基于所述相邻句的说话者名称识别结果，在所述相邻句中确定所述目标对白句的说话者相关句；
[0009]若确定出所述目标对白句的说话者相关句，则将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型，得到所述目标对白句的说话者信息，其...

【技术保护点】

【技术特征摘要】
1.一种对文本识别说话者的方法，其特征在于，所述方法包括：获取目标文本中的目标对白句，所述目标对白句为所述目标文本的任一对白句；基于所述目标文本对应的说话者名单，对所述目标对白句的相邻句进行说话者名称识别，其中所述说话者名单包括至少一个说话者名称；基于所述相邻句的说话者名称识别结果，在所述相邻句中确定所述目标对白句的说话者相关句；若确定出所述目标对白句的说话者相关句，则将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型，得到所述目标对白句的说话者信息，其中，所述说话者信息是所述目标对白句的说话者名称或用于指示所述目标对白句无对应的说话者名称的指示信息。2.根据权利要求1所述的方法，其特征在于，所述获取目标文本中的目标对白句之前，所述方法还包括：基于句尾标点符号对所述目标文本进行分句，得到多个句；对于所述多个句中包含引号的句，将引号中的内容和引号外的内容分为不同的句；在对所述目标文本分句得到的全部句中，将引号中的内容确定为所述目标文本中的对白句。3.根据权利要求1所述的方法，其特征在于，所述获取目标文本中的目标对白句，包括：在所述目标文本的全部对白句中，按照在所述目标文本中的位置由前至后获取目标对白句。4.根据权利要求1所述的方法，其特征在于，所述基于所述目标文本对应的说话者名单，对所述目标对白句的相邻句进行说话者名称识别，包括：在所述目标对白句的相邻句中，查找所述目标文本对应的说话者名单中的说话者名称，并将包含说话者名称的相邻句确定为所述目标对白句的相邻句。5.根据权利要求4所述的方法，其特征在于，所述基于所述相邻句的说话者名称识别结果，在所述相邻句中确定所述目标对白句的说话者相关句，包括：如果所述目标对白句的相邻句中只有一个相邻句包含说话者名称，且包含说话者名称的相邻句未被确定为所述目标对白句之外的其他对白句对应的说话者相关句，则将所述包含说话者名称的相邻句确定为所述目标对白句的说话者相关句；如果所述目标对白句的两个相邻句均包含说话者名称，且所述目标对白句前部的相邻句未被确定为其他对白句对应的说话者相关句，则将所述前部的相邻句确定为所述目标对白句的说话者相关句；如果所述目标对白句的相邻句均包含说话者名称，且所述目标对白句前部的相邻句已被确定为其他对白句对应的说话者相关句，则将所述目标对白句后部的相邻句确定为所述目标对白句的说话者相关句；如果所述目标对白句没有包含说话者名称的相邻句，或者所述目标对白句的包含说话者名称的相邻句已被确定为其他对白句对应的说话者相关句，则确定所述目标对白句没有说话者相关句。6.根据权利要求1
‑
5任一项所述的方法，其特征在于，所述基于所述相邻句的说话者名称识别结果，在所述相邻句中确定所述目标对白句的说话者相关句之后，所述方法还包括：
如果未确定出所述目标对白句的说话者相关句，则确定所述目标对白句无对应的说话者名称。7.根据权利要求1
‑
5任一项所述的方法，其特征在于，所述说话者识别模型为机器阅读理解MRC模型；所述将所述目标对白句和所述说话者相关句输入经过训练...

【专利技术属性】
技术研发人员：申柯秋，徐东，赵伟峰，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人