对话归属的识别方法、装置、可读介质和电子设备制造方法及图纸

技术编号:28748041 阅读:36 留言:0更新日期:2021-06-06 19:08
本公开涉及一种对话归属的识别方法、装置、可读介质和电子设备,涉及电子信息处理技术领域,该方法包括:在指定总文本包括的多个语句中,确定目标对话语句对应的第一文本和目标语句对应的第二文本,目标对话语句为多个语句中的任一对话语句,目标语句为与目标对话语句之间的距离满足预设条件的语句,提取第一文本和第二文本中包括的至少一个候选对象,确定每个候选对象对应的属性特征,针对每个候选对象,将第一文本、第二文本、该候选对象和该候选对象对应的属性特征,输入预先训练的识别模型,以得到识别模型输出的该候选对象与目标对话语句的匹配度,根据每个候选对象与目标对话语句的匹配度,确定目标对话语句所属的目标对象。象。象。

【技术实现步骤摘要】
对话归属的识别方法、装置、可读介质和电子设备


[0001]本公开涉及电子信息处理
,具体地,涉及一种对话归属的识别方法、装置、可读介质和电子设备。

技术介绍

[0002]随着电子信息技术的不断发展,人们的娱乐生活也越来越丰富,阅读电子书已经成为了一种主流的阅读方式。为了使用户在不方便阅览电子书时,也能通过听觉来获取电子书中包括的信息,或者边读边听,从视觉和听觉两个维度来获取电子书中包括的信息,往往会为电子书预先录制对应的音频,以供用户收听。
[0003]为了丰富音频的表现力,在录制音频的过程中,可以使用不同的音色来录制电子书中不同角色的对话。通常情况下,需要人工对电子书中的每个对话的归属进行标注,处理效率和准确度都较低。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面,本公开提供一种对话归属的识别方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种对话归属的识别方法,其特征在于,所述方法包括:在指定总文本包括的多个语句中,确定目标对话语句对应的第一文本和目标语句对应的第二文本,所述目标对话语句为多个语句中的任一对话语句,所述目标语句为与所述目标对话语句之间的距离满足预设条件的语句;提取所述第一文本和所述第二文本中包括的至少一个候选对象;确定每个所述候选对象对应的属性特征,所述属性特征包括:该候选对象与所述目标对话语句的第一位置关系、该候选对象所属的语句与所述目标对话语句的第二位置关系、该候选对象所属的语句的对话属性中的一种或多种;针对每个所述候选对象,将所述第一文本、所述第二文本、该候选对象和该候选对象对应的所述属性特征,输入预先训练的识别模型,以得到所述识别模型输出的该候选对象与所述目标对话语句的匹配度;根据每个所述候选对象与所述目标对话语句的匹配度,确定所述目标对话语句所属的目标对象。2.根据权利要求1所述的方法,其特征在于,所述在指定总文本包括的多个语句中,确定目标对话语句对应的第一文本和目标语句对应的第二文本,包括:按照预设的划分符号对所述指定总文本进行划分,以得到每个语句对应的文本;将任一包括对话符号的语句确定为所述目标对话语句,并确定所述目标对话语句对应的所述第一文本;按照多个语句在所述指定总文本中的位置,将与所述目标对话语句之间的距离小于或等于距离阈值的语句确定为所述目标语句,并确定所述目标语句对应的所述第二文本。3.根据权利要求1所述的方法,其特征在于,所述确定每个所述候选对象对应的属性特征,包括:根据该候选对象和所述目标对话语句,确定所述第一位置关系,所述第一位置关系包括:该候选对象是否属于所述目标对话语句、该候选对象是否属于目标段落、该候选对象与所述目标对话语句的距离中的一种或多种;所述目标段落为所述指定总文本中所述目标对话语句所属的段落;根据该候选对象所属的语句与所述目标对话语句的距离,确定所述第二位置关系;根据该候选对象所属的语句确定所述对话属性,所述对话属性包括:该候选对象所属的语句是否为对话语句、该候选对象所属的语句对应的第三文本是否包括对话模板、该候选对象在该候选对象所属的语句中的位置中的一种或多种。4.根据权利要求1所述的方法,其特征在于,所述提取所述第一文本和所述第二文本中包括的至少一个候选对象,包括:获取第四文本中每个字对应的字向量,和每个字对应的关联词语对应的词向量,所述第四文本为所述第一文本和所述第二文本中包括的任一语句对应的文本;将该字对应的字向量,和该字对应的关联词语对应的词向量,组成该字对应的组合向量,以得到所述第四文本对应的组合向量序列,所述组合向量序列包括所述第四文本中每个字对应的所述组合向量;根据所述组合向量序列和预先训练的提取模型,确定所述第四文本中包括的所述候选对象。
5.根据权利要求4所述的方法,其特征在于,所述获取第四文本中每个字对应的字向量,和每个...

【专利技术属性】
技术研发人员:伍林
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1