基于电子书的对话人物识别方法、电子设备及存储介质技术

技术编号:28872569 阅读:20 留言:0更新日期:2021-06-15 23:05
本发明专利技术公开了一种基于电子书的对话人物识别方法、电子设备及存储介质,该方法包括:获取电子书文本中包含的对话信息,提取对话信息中包含的人物对话内容以及对话关联内容,确定人物对话内容以及对话关联内容之间的次序关系;获取预先训练的与人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,将对话信息输入获取到的对话人物识别模型;根据对话人物识别模型的输出结果,识别对话信息中包含的与说话者相对应的人物类实体。该方式预先训练与人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,从而根据该次序关系调用相应的对话人物识别模型进行识别,提升了识别结果的准确性。

【技术实现步骤摘要】
基于电子书的对话人物识别方法、电子设备及存储介质
本专利技术涉及计算机领域,具体涉及一种基于电子书的对话人物识别方法、电子设备及存储介质。
技术介绍
目前,随着有声读物的日益普及,越来越多的用户开始从看书转换为听书,相应的,在制作有声读物的过程中,需要针对电子书执行文本转语音的操作。通常情况下,直接调用开源的文本转语音工具实现语音合成处理。在上述处理方式中,针对电子书文本中的全部内容均执行统一的处理。但是,专利技术人在实现本专利技术的过程中发现:对于包含对话内容的电子书而言,旁白内容以及对话内容的感情色彩不同,采用相同的处理方式不利于用户快速理解书籍内容;并且,对应于不同说话人的多个对话内容的感情色彩以及人物音质特征也各不相同,采用相同的处理方式不利于用户区分与对话内容相对应的说话人。由此可见,为了提升语音合成效果,亟需一种能够准确识别电子书中的对话人物的方案,以便针对不同的对话人物执行不同的语音合成处理方式。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于电子书的对话人物识别方法、电子设备及存储介质。根据本专利技术的一个方面,提供了一种基于电子书的对话人物识别方法,该方法包括:获取电子书文本中包含的对话信息,提取所述对话信息中包含的人物对话内容以及对话关联内容,确定所述人物对话内容以及对话关联内容之间的次序关系;获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,将所述对话信息输入获取到的对话人物识别模型;根据所述对话人物识别模型的输出结果,识别所述对话信息中包含的与说话者相对应的人物类实体。根据本专利技术的另一方面,提供了一种电子设备,该电子设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:获取电子书文本中包含的对话信息,提取所述对话信息中包含的人物对话内容以及对话关联内容,确定所述人物对话内容以及对话关联内容之间的次序关系;获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,将所述对话信息输入获取到的对话人物识别模型;根据所述对话人物识别模型的输出结果,识别所述对话信息中包含的与说话者相对应的人物类实体。根据本专利技术的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行以下操作:获取电子书文本中包含的对话信息,提取所述对话信息中包含的人物对话内容以及对话关联内容,确定所述人物对话内容以及对话关联内容之间的次序关系;获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,将所述对话信息输入获取到的对话人物识别模型;根据所述对话人物识别模型的输出结果,识别所述对话信息中包含的与说话者相对应的人物类实体。在本专利技术提供的基于电子书的对话人物识别方法、电子设备及存储介质中,首先,获取电子书文本中包含的对话信息,提取对话信息中包含的人物对话内容以及对话关联内容,确定人物对话内容以及对话关联内容之间的次序关系;然后,获取预先训练的与人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,根据该对话人物识别模型识别对话关联内容中包含的与说话者相对应的人物类实体。由此可见,该方式能够预先训练与人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,从而根据对话信息中包含的人物对话内容以及对话关联内容的次序关系调用相应的对话人物识别模型进行识别,进而提升识别结果的准确性。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术一个实施例提供的基于电子书的对话人物识别方法的流程图;图2示出了本专利技术另一个实施例提供的基于电子书的对话人物识别方法的流程图;图3示出了根据本专利技术另一个实施例的一种电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。实施例一图1示出了本专利技术一个实施例提供的基于电子书的对话人物识别方法的流程图。如图1所示,该方法包括以下步骤:步骤S110:获取电子书文本中包含的对话信息,提取对话信息中包含的人物对话内容以及对话关联内容,确定人物对话内容以及对话关联内容之间的次序关系。其中,电子书文本中包含的对话信息是指:含有人物对话内容的文本信息,具体包括人物说话的具体内容以及与说话内容相关的上下文信息。其中,对话关联内容与人物对话内容关联紧密且位置相邻,用于交代人物对话内容的对话情景信息,具体包括:人物情景、地点情景、时间情景等多个维度的情景信息。相应的,通过分割人物对话内容以及对话关联内容,能够确定人物对话内容以及对话关联内容之间的次序关系,并基于该次序关系从对话关联内容中提取用于指示说话人的信息,达到识别说话人的目的。其中,专利技术人在实现本专利技术的过程中发现,人物对话内容以及对话关联内容之间的次序关系对于识别说话人具有重要影响,不同的次序关系所对应的识别结果也可能存在差异。因此,为了准确识别对话内容的说话人,在本实施例中,需要确定人物对话内容以及对话关联内容之间的次序关系。其中,人物对话内容以及对话关联内容之间的次序关系主要包括以下两种情况:在第一种情况中,人物对话内容位于对话关联内容之前。例如,对话信息如下:“我已经考虑清楚了。”李四悠悠的说。其中,“我已经考虑清楚了”为人物对话内容,“李四悠悠的说”为对话关联内容。显然,人物对话内容位于对话关联内容之前,该种方式用于重点突出人物对话内容,因而将对话关联内容后置。在第二种情况中,人物对话内容位于对话关联内容之后。例如,对话信息如下:张三笑呵呵的说道:“你今天怎么有空过来了?”其中,“你今天怎么有空过来了”为人物对话内容,“张三笑呵呵的说道”为对话关联内容。显然,人物对话内容位于对话关联内容之后,该种方式用于重点突出对话人物。除上述两种方式外,人物对话内容以及对话关联内容之间的次序关系还可能为各种情况。例如,对话关联内容可能位于两段不同的人物对话内容之间,或者,人物对话内容也本文档来自技高网...

【技术保护点】
1.一种基于电子书的对话人物识别方法,其中,所述方法包括:/n获取电子书文本中包含的对话信息,提取所述对话信息中包含的人物对话内容以及对话关联内容,确定所述人物对话内容以及对话关联内容之间的次序关系;/n获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,将所述对话信息输入获取到的对话人物识别模型;/n根据所述对话人物识别模型的输出结果,识别所述对话信息中包含的与说话者相对应的人物类实体。/n

【技术特征摘要】
1.一种基于电子书的对话人物识别方法,其中,所述方法包括:
获取电子书文本中包含的对话信息,提取所述对话信息中包含的人物对话内容以及对话关联内容,确定所述人物对话内容以及对话关联内容之间的次序关系;
获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,将所述对话信息输入获取到的对话人物识别模型;
根据所述对话人物识别模型的输出结果,识别所述对话信息中包含的与说话者相对应的人物类实体。


2.根据权利要求1所述的方法,其中,所述预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型包括:
人物对话内容位于所述对话关联内容之前的第一识别模型,以及人物对话内容位于所述对话关联内容之后的第二识别模型;
其中,所述第一识别模型通过预先获取到的人物对话内容位于所述对话关联内容之前的第一训练样本训练得到;所述第二识别模型通过预先获取到的人物对话内容位于所述对话关联内容之后的第二训练样本训练得到。


3.根据权利要求2所述的方法,其中,所述提取所述对话信息中包含的人物对话内容以及对话关联内容,确定所述人物对话内容以及对话关联内容之间的次序关系包括:
当提取出的人物对话内容为至少两个,和/或提取出的对话关联内容为至少两个时,
将相邻的人物对话内容以及对话关联内容确定为一个关联次序组合,得到所述对话信息中包含的至少两个关联次序组合,分别确定各个关联次序组合中的所述人物对话内容以及对话关联内容之间的次序关系。


4.根据权利要求3所述的方法,其中,所述获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型,将所述对话信息输入获取到的对话人物识别模型包括:
分别获取与各个关联次序组合中的所述人物对话内容以及对话关联内容之间的次序关系相对应的对话人物识别模型,得到与所述关联次序组合相对应的输出结果;
则所述根据所述对话人物识别模型的输出结果,识别所述对话信息中包含的与说话者相对应的人物类实体包括:
获取与各个关联次序组合相对应的多个输出结果,根据多个输出结果的置信度确定所述对话关联内容中包含的与说话者相对应的人物类实体。


5.根据权利要求1-4任一所述的方法,其中,所述根据所述对话人物识别模型的输出结果,识别所述对话信息中包含的与说话者相对应的人物类实体进一步包括:
识别所述对话关联内容中包含的人物类候选实体以及与所述人物类候选实体相对应的上下文信息;<...

【专利技术属性】
技术研发人员:丁廷震
申请(专利权)人:掌阅科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1