一种人物关系补全方法及装置制造方法及图纸

技术编号:26172334 阅读:31 留言:0更新日期:2020-10-31 13:49
本发明专利技术公开了一种人物关系补全方法及装置,其中,人物关系补全方法包括:采集用户语音信息;根据用户语音信息,获取包含人物实体词或人物关系词的目标句式;判断该目标句式是否存在残缺;当判定该目标句式中存在残缺时,获取用户当前阅读的书页图像;识别书页图像中的文字信息,获取对应的书页文本信息;通过训练好的人物关系抽取模型,对书页文本信息进行人物关系抽取,获得书页文本信息包含的人物实体词对及对应的人物关系词;根据抽取到的人物实体词对及对应的人物关系词来补全目标句式;根据补全后的目标句式,给用户以相应反馈。本发明专利技术在不建立庞大实体关系库的情况下,帮助用户快速理清人物关系,便于用户更好的进行阅读。

【技术实现步骤摘要】
一种人物关系补全方法及装置
本专利技术涉及自然语言处理技术,尤其涉及一种人物关系补全方法及装置。
技术介绍
阅读,是一项非常好的习惯,可以给人带来丰富的知识,增强孩子们的知识面;也可以提升孩子的语言能力,发展孩子的思维能力等。因此家长们也越来越重视对孩子阅读习惯的培养。而在孩子们在阅读时,如果书中人物关系复杂,常常会搞不清里面的人物关系,导致在阅读的时候不能很好的理解里面的内容。而家长的教育能力有强有弱,或不能付出足够的时间或精力来陪孩子们阅读,帮助其梳理书中的人物关系。因此,如何帮助孩子们理清人物关系,以便于他们更好的进行阅读理解是一个需要解决的技术问题。
技术实现思路
为解决上述技术问题,本专利技术提供一种人物关系补全方法及装置,具体的,本专利技术的技术方案如下:一方面,本专利技术公开了一种人物关系补全方法,包括:采集用户语音信息;根据所述用户语音信息,获取包含人物实体词或人物关系词的目标句式;判断所述目标句式是否存在人物关系词残缺或人物实体词残缺;当判定所述目标句式中存在人物关系词残词缺或人物实体词残缺时,获取所述用户当前阅读的书页图像;识别所述书页图像中的文字信息,获取对应的书页文本信息;通过训练好的人物关系抽取模型,对所述书页文本信息进行人物关系抽取,获得所述书页文本信息包含的人物实体词对及对应的人物关系词;根据所述书页文本信息包含的人物实体词对及对应的人物关系词,补全所述目标句式中残缺的人物实体词或人物关系词;r>根据补全后的目标句式,给所述用户以相应反馈。优选地,在采集用户语料之前还包括:获取标注了人物实体与人物关系的实体关系抽取训练样本;将所述实体关系抽取训练样本输入初始模型进行训练学习,获得人物关系抽取模型。优选地,所述通过训练好的人物关系抽取模型,对所述书页文本信息进行人物关系抽取,获得所述书页文本信息包含的人物实体词对及对应的人物关系词包括:当判定所述目标句式中存在人物实体词残缺时,根据所述目标句式中已有的人物实体词及人物关系词,在所述书页文本信息中查找关联目标语句;当判定所述目标句式中存在人物关系词残缺时,根据所述目标句式中已有的人物实体词对,在所述书页文本信息中查找关联目标语句;将所述查找到的关联目标语句输入所述训练好的人物关系抽取模型进行人物关系抽取,获得若干组人物实体词对及其对应的人物关系词。优选地,所述根据所述目标句式中已有的人物实体词及人物关系词,在所述书页文本信息中查找关联目标语句包括:获取所述目标句式中已有的人物实体词的同义实体词;获取所述目标句式中已有的人物关系词的同义关系词;在所述书页文本信息中,查找与所述目标句式中的人物实体词、所述同义实体词、所述目标句式中已有的人物关系词、或所述同义关系词之中任意一个关键词相关的语句作为关联目标语句。优选地,所述根据所述用户语音信息,获取包含人物实体词或人物关系词的目标句式包括:识别所述语音信息,将所述语音信息转换为对应的文字信息;将所述转换后的文字信息输入到所述人物关系抽取模型进行人物关系抽取,输出抽取出的人物实体词和/或人物关系词;根据抽取出的人物实体词和/或人物关系词,生成对应的目标句式。另一方面,本专利技术还公开了一种人物关系补全装置,包括:语音采集模块,用于采集用户语音信息;提取生成模块,用于根据所述用户语音信息,获取包含人物实体词或人物关系词的目标句式;残缺判断模块,用于判断所述目标句式是否存在人物关系词残缺或人物实体词残缺;图像采集模块,用于当判定所述目标句式中存在人物关系词残词缺或人物实体词残缺时,获取所述用户当前阅读的书页图像;图像识别模块,用于识别所述书页图像中的文字信息,获取对应的书页文本信息;人物关系抽取模块,用于通过训练好的人物关系抽取模型,对所述书页文本信息进行人物关系抽取,获得所述书页文本信息包含的人物实体词对及对应的人物关系词;补全模块,用于根据所述书页文本信息包含的人物实体词对及对应的人物关系词,补全所述目标句式中残缺的人物实体词或人物关系词;反馈模块,用于根据补全后的目标句式,给所述用户以相应反馈。优选地,所述人物关系补全装置还包括:样本获取模块,用于获取标注了人物实体与人物关系的实体关系抽取训练样本;学习训练模块,用于将所述实体关系抽取训练样本输入初始模型进行训练学习,获得人物关系抽取模型。优选地,所述人物关系抽取模块包括:查找子模块,用于当判定所述目标句式中存在人物实体词残缺时,根据所述目标句式中已有的人物实体词及人物关系词,在所述书页文本信息中查找关联目标语句;当判定所述目标句式中存在人物关系词残缺时,根据所述目标句式中已有的人物实体词对,在所述书页文本信息中查找关联目标语句;抽取子模块,用于将所述查找到的关联目标语句输入所述训练好的人物关系抽取模型进行人物关系抽取,获得若干组人物实体词对及其对应的人物关系词。优选地,所述查找子模块包括:同义词获取单元,用于获取所述目标句式中已有的人物实体词的同义实体词;还用于获取所述目标句式中已有的人物关系词的同义关系词;关联查找单元,用于在所述书页文本信息中,查找与所述目标句式中的人物实体词、所述同义实体词、所述目标句式中已有的人物关系词、或所述同义关系词之中任意一个关键词相关的语句作为关联目标语句。优选地,所述提取生成模块包括:识别转换子模块,用于识别所述语音信息,将所述语音信息转换为对应的文字信息;便于所述人物关系抽取模块将所述转换后的文字信息输入到所述人物关系抽取模型进行人物关系抽取,输出抽取出的人物实体词和/或人物关系词;目标句式生成子模块,用于根据抽取出的人物实体词和/或人物关系词,生成对应的目标句式。本专利技术至少具备以下一项有益技术效果:(1)采用本专利技术的人物关系补全方法,用户在读某本书时,不清楚人物关系词,则可随时提问,本专利技术在不用建立庞大的实体关系库的情况下,实时采集书面信息进行人物关系抽取,然后结合用户的语音信息配对给出用户答案,帮助用户快速理清人物关系,从而辅助用户理解阅读。(2)本专利技术在采集到的书页信息中进行了信息筛选,选取出了关联目标语句,只需从这些关联目标语句中去抽取人物关系即可,降低了人物关系抽取难度和复杂度,提高了处理速度,从而提升了用户体验。(3)本专利技术采用的人物关系抽取模型是基于神经网络技术通过训练学习获得,尤其是采用了有监督的学习方法来进行训练学习,使得获得的人物关系抽取模型的抽取速度和准确度也更高。(4)本专利技术根据目标句式获得现有的人物实体词或人物关系词来获取对应的人物实体同义词或人物关系同义词,从而提高在书页信息中寻找关联目标语句的全面性,避免由于表达方式的不同而漏掉关联目标语句。提高了后续的人物关系补全概率。附图说明为了更清楚地说明本文档来自技高网...

【技术保护点】
1.一种人物关系补全方法,其特征在于,包括:/n采集用户语音信息;/n根据所述用户语音信息,获取包含人物实体词或人物关系词的目标句式;/n判断所述目标句式是否存在人物关系词残缺或人物实体词残缺;/n当判定所述目标句式中存在人物关系词残词缺或人物实体词残缺时,获取所述用户当前阅读的书页图像;/n识别所述书页图像中的文字信息,获取对应的书页文本信息;/n通过训练好的人物关系抽取模型,对所述书页文本信息进行人物关系抽取,获得所述书页文本信息包含的人物实体词对及对应的人物关系词;/n根据所述书页文本信息包含的人物实体词对及对应的人物关系词,补全所述目标句式中残缺的人物实体词或人物关系词;/n根据补全后的目标句式,给所述用户以相应反馈。/n

【技术特征摘要】
1.一种人物关系补全方法,其特征在于,包括:
采集用户语音信息;
根据所述用户语音信息,获取包含人物实体词或人物关系词的目标句式;
判断所述目标句式是否存在人物关系词残缺或人物实体词残缺;
当判定所述目标句式中存在人物关系词残词缺或人物实体词残缺时,获取所述用户当前阅读的书页图像;
识别所述书页图像中的文字信息,获取对应的书页文本信息;
通过训练好的人物关系抽取模型,对所述书页文本信息进行人物关系抽取,获得所述书页文本信息包含的人物实体词对及对应的人物关系词;
根据所述书页文本信息包含的人物实体词对及对应的人物关系词,补全所述目标句式中残缺的人物实体词或人物关系词;
根据补全后的目标句式,给所述用户以相应反馈。


2.根据权利要求1所述的一种人物关系补全方法,其特征在于,在采集用户语料之前还包括:
获取标注了人物实体与人物关系的实体关系抽取训练样本;
将所述实体关系抽取训练样本输入初始模型进行训练学习,获得人物关系抽取模型。


3.根据权利要求1所述的一种人物关系补全方法,其特征在于,所述通过训练好的人物关系抽取模型,对所述书页文本信息进行人物关系抽取,获得所述书页文本信息包含的人物实体词对及对应的人物关系词包括:
当判定所述目标句式中存在人物实体词残缺时,根据所述目标句式中已有的人物实体词及人物关系词,在所述书页文本信息中查找关联目标语句;
当判定所述目标句式中存在人物关系词残缺时,根据所述目标句式中已有的人物实体词对,在所述书页文本信息中查找关联目标语句;
将所述查找到的关联目标语句输入所述训练好的人物关系抽取模型进行人物关系抽取,获得若干组人物实体词对及其对应的人物关系词。


4.根据权利要求3所述的一种人物关系补全方法,其特征在于,
所述根据所述目标句式中已有的人物实体词及人物关系词,在所述书页文本信息中查找关联目标语句包括:
获取所述目标句式中已有的人物实体词的同义实体词;
获取所述目标句式中已有的人物关系词的同义关系词;
在所述书页文本信息中,查找与所述目标句式中的人物实体词、所述同义实体词、所述目标句式中已有的人物关系词、或所述同义关系词之中任意一个关键词相关的语句作为关联目标语句。


5.根据权利要求1-4任一项所述的一种人物关系补全方法,其特征在于,所述根据所述用户语音信息,获取包含人物实体词或人物关系词的目标句式包括:
识别所述语音信息,将所述语音信息转换为对应的文字信息;
将所述转换后的文字信息输入到所述人物关系抽取模型进行人物关系抽取,输出抽取出的人物实体词和/或人物关系词;
根据抽取出的人物实体词和/或人物关系词,生成对应的目标句式。


6.一种...

【专利技术属性】
技术研发人员:张平
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1