基于电子书的对话人物识别方法、电子设备及存储介质技术

技术编号：28872569 阅读：20 留言：0更新日期：2021-06-15 23:05

本发明专利技术公开了一种基于电子书的对话人物识别方法、电子设备及存储介质，该方法包括：获取电子书文本中包含的对话信息，提取对话信息中包含的人物对话内容以及对话关联内容，确定人物对话内容以及对话关联内容之间的次序关系；获取预先训练的与人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型，将对话信息输入获取到的对话人物识别模型；根据对话人物识别模型的输出结果，识别对话信息中包含的与说话者相对应的人物类实体。该方式预先训练与人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型，从而根据该次序关系调用相应的对话人物识别模型进行识别，提升了识别结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于电子书的对话人物识别方法、电子设备及存储介质
本专利技术涉及计算机领域，具体涉及一种基于电子书的对话人物识别方法、电子设备及存储介质。
技术介绍
目前，随着有声读物的日益普及，越来越多的用户开始从看书转换为听书，相应的，在制作有声读物的过程中，需要针对电子书执行文本转语音的操作。通常情况下，直接调用开源的文本转语音工具实现语音合成处理。在上述处理方式中，针对电子书文本中的全部内容均执行统一的处理。但是，专利技术人在实现本专利技术的过程中发现：对于包含对话内容的电子书而言，旁白内容以及对话内容的感情色彩不同，采用相同的处理方式不利于用户快速理解书籍内容；并且，对应于不同说话人的多个对话内容的感情色彩以及人物音质特征也各不相同，采用相同的处理方式不利于用户区分与对话内容相对应的说话人。由此可见，为了提升语音合成效果，亟需一种能够准确识别电子书中的对话人物的方案，以便针对不同的对话人物执行不同的语音合成处理方式。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于电子书的对话人物识别方法、电子设备及存储介质。根据本专利技术的一个方面，提供了一种基于电子书的对话人物识别方法，该方法包括：获取电子书文本中包含的对话信息，提取所述对话信息中包含的人物对话内容以及对话关联内容，确定所述人物对话内容以及对话关联内容之间的次序关系；获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型，将所...

【技术保护点】
1.一种基于电子书的对话人物识别方法，其中，所述方法包括：/n获取电子书文本中包含的对话信息，提取所述对话信息中包含的人物对话内容以及对话关联内容，确定所述人物对话内容以及对话关联内容之间的次序关系；/n获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型，将所述对话信息输入获取到的对话人物识别模型；/n根据所述对话人物识别模型的输出结果，识别所述对话信息中包含的与说话者相对应的人物类实体。/n

【技术特征摘要】
1.一种基于电子书的对话人物识别方法，其中，所述方法包括：
获取电子书文本中包含的对话信息，提取所述对话信息中包含的人物对话内容以及对话关联内容，确定所述人物对话内容以及对话关联内容之间的次序关系；
获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型，将所述对话信息输入获取到的对话人物识别模型；
根据所述对话人物识别模型的输出结果，识别所述对话信息中包含的与说话者相对应的人物类实体。

2.根据权利要求1所述的方法，其中，所述预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型包括：
人物对话内容位于所述对话关联内容之前的第一识别模型，以及人物对话内容位于所述对话关联内容之后的第二识别模型；
其中，所述第一识别模型通过预先获取到的人物对话内容位于所述对话关联内容之前的第一训练样本训练得到；所述第二识别模型通过预先获取到的人物对话内容位于所述对话关联内容之后的第二训练样本训练得到。

3.根据权利要求2所述的方法，其中，所述提取所述对话信息中包含的人物对话内容以及对话关联内容，确定所述人物对话内容以及对话关联内容之间的次序关系包括：
当提取出的人物对话内容为至少两个，和/或提取出的对话关联内容为至少两个时，
将相邻的人物对话内容以及对话关联内容确定为一个关联次序组合，得到所述对话信息中包含的至少两个关联次序组合，分别确定各个关联次序组合中的所述人物对话内容以及对话关联内容之间的次序关系。

4.根据权利要求3所述的方法，其中，所述获取预先训练的与所述人物对话内容以及对话关联内容之间的次序关系相匹配的对话人物识别模型，将所述对话信息输入获取到的对话人物识别模型包括：
分别获取与各个关联次序组合中的所述人物对话内容以及对话关联内容之间的次序关系相对应的对话人物识别模型，得到与所述关联次序组合相对应的输出结果；
则所述根据所述对话人物识别模型的输出结果，识别所述对话信息中包含的与说话者相对应的人物类实体包括：
获取与各个关联次序组合相对应的多个输出结果，根据多个输出结果的置信度确定所述对话关联内容中包含的与说话者相对应的人物类实体。

5.根据权利要求1-4任一所述的方法，其中，所述根据所述对话人物识别模型的输出结果，识别所述对话信息中包含的与说话者相对应的人物类实体进一步包括：
识别所述对话关联内容中包含的人物类候选实体以及与所述人物类候选实体相对应的上下文信息；<...

【专利技术属性】
技术研发人员：丁廷震，
申请(专利权)人：掌阅科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人