文本中角色的识别方法、装置、可读介质和电子设备制造方法及图纸

技术编号:28748006 阅读:64 留言:0更新日期:2021-06-06 19:07
本公开涉及一种文本中角色的识别方法、装置、可读介质和电子设备,涉及电子信息处理技术领域,该方法包括:获取待识别文本中包括的每个字和每个字对应的字向量,确定待识别文本中,每个字对应的关联词语对应的词向量,关联词语根据该字对应的组合词语确定,组合词语由该字和与该字相邻的预设个数的字组成,将每个字对应的字向量,和该字对应的关联词语对应的词向量,组成该字对应的组合向量,以得到待识别文本对应的组合向量序列,组合向量序列包括待识别文本中每个字对应的组合向量,根据组合向量序列和预先训练的识别模型,确定待识别文本中包括的角色实体。本公开能够提高识别角色实体的准确度。实体的准确度。实体的准确度。

【技术实现步骤摘要】
文本中角色的识别方法、装置、可读介质和电子设备


[0001]本公开涉及电子信息处理
,具体地,涉及一种文本中角色的识别方法、装置、可读介质和电子设备。

技术介绍

[0002]随着电子信息技术的不断发展,人们的娱乐生活也越来越丰富,阅读电子书已经成为了一种主流的阅读方式。为了使用户在不方便阅览电子书时,也能通过听觉来获取电子书中包括的信息,或者边读边听,从视觉和听觉两个维度来获取电子书中包括的信息,往往会为电子书预先录制对应的音频,以供用户收听。为了丰富音频的表现力,在录制音频的过程中,可以使用不同的音色来录制电子书中不同角色的对话,因此需要先识别出电子书中的不同角色。通常情况下,需要人工对电子书中的每个角色进行标注,处理效率和准确度都较低。

技术实现思路

[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面,本公开提供一种文本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本中角色的识别方法,其特征在于,所述方法包括:获取待识别文本中包括的每个字和每个字对应的字向量;确定所述待识别文本中,每个字对应的关联词语对应的词向量,所述关联词语根据该字对应的组合词语确定,所述组合词语由该字和与该字相邻的预设个数的字组成;将每个字对应的字向量,和该字对应的所述关联词语对应的词向量,组成该字对应的组合向量,以得到所述待识别文本对应的组合向量序列,所述组合向量序列包括所述待识别文本中每个字对应的组合向量;根据所述组合向量序列和预先训练的识别模型,确定所述待识别文本中包括的角色实体。2.根据权利要求1所述的方法,其特征在于,所述确定所述待识别文本中,每个字对应的关联词语对应的词向量,包括:针对每个字,获取该字和与该字相邻的预设个数的字组成的所述组合词语;将所述组合词语中,与预设的词语词典匹配的所述组合词语作为该字对应的所述关联词语,并获取所述关联词语对应的词向量。3.根据权利要求1所述的方法,其特征在于,所述根据所述组合向量序列和预先训练的识别模型,确定所述待识别文本中包括的角色实体,包括:将所述组合向量序列输入所述识别模型,以得到所述识别模型输出的所述待识别文本中每个字对应的属性标签,所述属性标签用于指示该字是否属于所述角色实体;根据所述待识别文本中每个字对应的所述属性标签,确定所述待识别文本中包括的所述角色实体。4.根据权利要求3所述的方法,其特征在于,所述属性标签还用于指示该字在所述角色实体中的位置为起始位置,或者终止位置,或者中间位置。5.根据权利要求4所述的方法,其特征在于,所述根据所述待识别文本中每个字对应的所述属性标签,确定所述待识别文本中包括的所述角色实体,包括:若目标字对应的所述属性标签指示所述目标字属于所述角色实体,根据所述属性标签指示的所述目标字在所述角色实体中的位置,确定包括所述目标字的所述角色实体,所述目标字为所述待识别文本中的任一字。6.根据权利要求1所述的方法,其特征在于,所述待识别文本包括第一待识别文本和第二待识别文本,所述第一待识别文本对应指定总文本中的任一对话语句,所述第二待识别文本对应所述指定总文本中,与所述第一待识别文本对应的对话语句之间的距离满足预设条件的语句;在所述根据所述组合向量序列和预先训练的识别模型,确定所述待识别文本中包括的角色实体之后,所述方法还包括:确定所述待识别文本中包括的每个所述角色实体对应的属性特征,所述属性特征包括:该角色实体与所述第一待识别文本的第一位...

【专利技术属性】
技术研发人员:伍林
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1