对文本识别说话者和训练说话者识别模型的方法和装置制造方法及图纸

技术编号:35515306 阅读:12 留言:0更新日期:2022-11-09 14:31
本申请公开了一种对文本识别说话者和训练说话者识别模型的方法和装置,属于计算机技术领域。所述方法包括:获取目标文本中的目标对白句;基于所述目标文本对应的说话者名单,对所述目标对白句的相邻句进行说话者名称识别;基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句;若确定出所述目标对白句的说话者相关句,则将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型,得到所述目标对白句的说话者信息。采用本申请,可以提高说话者识别模型的识别准确度。者识别模型的识别准确度。者识别模型的识别准确度。

【技术实现步骤摘要】
对文本识别说话者和训练说话者识别模型的方法和装置


[0001]本申请涉及计算机
,特别涉及一种对文本识别说话者和训练说话者识别模型的方法和装置。

技术介绍

[0002]随着语音合成技术的不断发展,有声书朗读广泛兴起。在有声书朗读时,采取多说话人配音的朗读模式,能够大大提高用户的体验感。实现多说话人配音的朗读模式需要确定文本中对话的说话者。当前,大多通过机器学习的方式,将完整的文章文本输入到模型中,得到其中每个对白句对应的说话者。
[0003]但是,如果想要模型的预测结果较为准确,就需要大量完整的样本文章对模型进行训练。当样本文章数量较少时,无法保证经过训练的模型的预测结果的准确性。

技术实现思路

[0004]本申请实施例提供了一种对文本识别说话者和训练说话者识别模型的方法和装置,以解决相关技术的问题。所述技术方案如下:
[0005]第一方面,提供了一种对文本识别说话者的方法,所述方法包括:
[0006]获取目标文本中的目标对白句,所述目标对白句为所述目标文本的任一对白句;
[0007]基于所述目标文本对应的说话者名单,对所述目标对白句的相邻句进行说话者名称识别,其中所述说话者名单包括至少一个说话者名称;
[0008]基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句;
[0009]若确定出所述目标对白句的说话者相关句,则将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型,得到所述目标对白句的说话者信息,其中,所述说话者信息是所述目标对白句的说话者名称或用于指示所述目标对白句无对应的说话者名称的指示信息。
[0010]在一种可能的实现方式中,所述获取目标文本中的目标对白句之前,所述方法还包括:
[0011]基于句尾标点符号对所述目标文本进行分句,得到多个句;
[0012]对于所述多个句中包含引号的句,将引号中的内容和引号外的内容分为不同的句;
[0013]在对所述目标文本分句得到的全部句中,将引号中的内容确定为所述目标文本中的对白句。
[0014]在一种可能的实现方式中,所述获取目标文本中的目标对白句,包括:
[0015]在所述目标文本的全部对白句中,按照在所述目标文本中的位置由前至后获取目标对白句。
[0016]在一种可能的实现方式中,所述基于所述目标文本对应的说话者名单,对所述目
标对白句的相邻句进行说话者名称识别,包括:
[0017]在所述目标对白句的相邻句中,查找所述目标文本对应的说话者名单中的说话者名称,并将包含说话者名称的相邻句确定为所述目标对白句的相邻句。
[0018]在一种可能的实现方式中,所述基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句,包括:
[0019]如果所述目标对白句的相邻句中只有一个相邻句包含说话者名称,且包含说话者名称的相邻句未被确定为所述目标对白句之外的其他对白句对应的说话者相关句,则将所述包含说话者名称的相邻句确定为所述目标对白句的说话者相关句;
[0020]如果所述目标对白句的两个相邻句均包含说话者名称,且所述目标对白句前部的相邻句未被确定为其他对白句对应的说话者相关句,则将所述前部的相邻句确定为所述目标对白句的说话者相关句;
[0021]如果所述目标对白句的相邻句均包含说话者名称,且所述目标对白句前部的相邻句已被确定为其他对白句对应的说话者相关句,则将所述目标对白句后部的相邻句确定为所述目标对白句的说话者相关句;
[0022]如果所述目标对白句没有包含说话者名称的相邻句,或者所述目标对白句的包含说话者名称的相邻句已被确定为其他对白句对应的说话者相关句,则确定所述目标对白句没有说话者相关句。
[0023]在一种可能的实现方式中,所述基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句之后,所述方法还包括:
[0024]如果未确定出所述目标对白句的说话者相关句,则确定所述目标对白句无对应的说话者名称。
[0025]在一种可能的实现方式中,所述说话者识别模型为机器阅读理解MRC模型;
[0026]所述将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型,得到所述目标对白句的说话者信息,包括:
[0027]将所述目标对白句和预设的提问句组成问题字段,并将所述目标对白句和所述说话者相关句组成问题相关文本字段,其中,所述提问句用于询问所述目标对白句的说话者名称;
[0028]将所述问题字段和所述问题相关文本字段输入所述MRC模型,得到所述目标对白句的说话者信息。
[0029]第二方面,提供了一种训练说话者识别模型的方法,所述方法包括:
[0030]获取样本文本中的样本对白句;
[0031]基于所述样本文本对应的样本说话者名单,对所述样本对白句的相邻句进行说话者名称识别,其中,所述样本说话者名单包括至少一个说话者名称;
[0032]基于所述相邻句的说话者名称识别结果,在所述样本对白句的相邻句中确定所述样本对白句对应的样本说话者相关句;
[0033]以所述样本对白句和所述样本对白句对应的样本说话者相关句为输入样本数据,对待训练的说话者识别模型进行训练调参,得到调参后的说话者识别模型;
[0034]若训练调参满足预设结束条件,则将调参后的说话者识别模型确定为训练完成的说话者识别模型。
[0035]第三方面,提供了一种对文本识别说话者的装置,所述装置包括:
[0036]获取模块,用于获取目标文本中的目标对白句;
[0037]识别模块,用于基于所述目标文本对应的说话者名单,对所述目标对白句的相邻句进行说话者名称识别,其中所述说话者名单包括至少一个说话者名称;
[0038]确定模块,用于基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句;
[0039]输出模块,用于若确定出所述目标对白句的说话者相关句,则将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型,得到所述目标对白句的说话者信息,其中,所述说话者信息是所述目标对白句的说话者名称或用于指示所述目标对白句无对应的说话者名称的指示信息。
[0040]在一种可能的实现方式中,所述确定模块,还用于:
[0041]基于句尾标点符号对所述目标文本进行分句,得到多个句;
[0042]对于所述多个句中包含引号的句,将引号中的内容和引号外的内容分为不同的句;
[0043]在对所述目标文本分句得到的全部句中,将引号中的内容确定为所述目标文本中的对白句。
[0044]在一种可能的实现方式中,所述获取模块,用于:
[0045]在所述目标文本的全部对白句中,按照在所述目标文本中的位置由前至后获取目标对白句。
[0046]在一种可能的实现方式中,所述识别模块,用于:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对文本识别说话者的方法,其特征在于,所述方法包括:获取目标文本中的目标对白句,所述目标对白句为所述目标文本的任一对白句;基于所述目标文本对应的说话者名单,对所述目标对白句的相邻句进行说话者名称识别,其中所述说话者名单包括至少一个说话者名称;基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句;若确定出所述目标对白句的说话者相关句,则将所述目标对白句和所述说话者相关句输入经过训练的说话者识别模型,得到所述目标对白句的说话者信息,其中,所述说话者信息是所述目标对白句的说话者名称或用于指示所述目标对白句无对应的说话者名称的指示信息。2.根据权利要求1所述的方法,其特征在于,所述获取目标文本中的目标对白句之前,所述方法还包括:基于句尾标点符号对所述目标文本进行分句,得到多个句;对于所述多个句中包含引号的句,将引号中的内容和引号外的内容分为不同的句;在对所述目标文本分句得到的全部句中,将引号中的内容确定为所述目标文本中的对白句。3.根据权利要求1所述的方法,其特征在于,所述获取目标文本中的目标对白句,包括:在所述目标文本的全部对白句中,按照在所述目标文本中的位置由前至后获取目标对白句。4.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本对应的说话者名单,对所述目标对白句的相邻句进行说话者名称识别,包括:在所述目标对白句的相邻句中,查找所述目标文本对应的说话者名单中的说话者名称,并将包含说话者名称的相邻句确定为所述目标对白句的相邻句。5.根据权利要求4所述的方法,其特征在于,所述基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句,包括:如果所述目标对白句的相邻句中只有一个相邻句包含说话者名称,且包含说话者名称的相邻句未被确定为所述目标对白句之外的其他对白句对应的说话者相关句,则将所述包含说话者名称的相邻句确定为所述目标对白句的说话者相关句;如果所述目标对白句的两个相邻句均包含说话者名称,且所述目标对白句前部的相邻句未被确定为其他对白句对应的说话者相关句,则将所述前部的相邻句确定为所述目标对白句的说话者相关句;如果所述目标对白句的相邻句均包含说话者名称,且所述目标对白句前部的相邻句已被确定为其他对白句对应的说话者相关句,则将所述目标对白句后部的相邻句确定为所述目标对白句的说话者相关句;如果所述目标对白句没有包含说话者名称的相邻句,或者所述目标对白句的包含说话者名称的相邻句已被确定为其他对白句对应的说话者相关句,则确定所述目标对白句没有说话者相关句。6.根据权利要求1

5任一项所述的方法,其特征在于,所述基于所述相邻句的说话者名称识别结果,在所述相邻句中确定所述目标对白句的说话者相关句之后,所述方法还包括:
如果未确定出所述目标对白句的说话者相关句,则确定所述目标对白句无对应的说话者名称。7.根据权利要求1

5任一项所述的方法,其特征在于,所述说话者识别模型为机器阅读理解MRC模型;所述将所述目标对白句和所述说话者相关句输入经过训练...

【专利技术属性】
技术研发人员:申柯秋徐东赵伟峰
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1