基于指代消歧的信息获取方法、信息获取装置与机器人制造方法及图纸

技术编号:39278101 阅读:8 留言:0更新日期:2023-11-07 10:53
本申请提供了一种基于指代消歧的信息获取方法、信息获取装置与机器人。该方法包括:采用目标分类模型,对接收到的当前问题进行分类,得到当前问题对应的主语和谓语;将当前问题对应的谓语与当前的主分类集合进行合并处理,得到更新后的主分类集合,将当前问题对应的主语与当前的副分类集合进行合并处理,得到更新后的副分类集合,主分类集合为由多个问题的谓语组成的集合,副分类集合为由多个问题的主语组成的集合;基于更新后的主分类集合中的谓语以及更新后的副分类集合中的主语进行组合,得到至少一个目标问题,并将目标问题对应的答案显示在显示屏上,从而解决了现有技术中难以较为准确和快速地命中用户的问题,并进行针对性回答的问题。针对性回答的问题。针对性回答的问题。

【技术实现步骤摘要】
基于指代消歧的信息获取方法、信息获取装置与机器人


[0001]本申请涉及人工智能
,具体而言,涉及一种基于指代消歧的信息获取方法、信息获取装置、计算机可读存储介质与机器人。

技术介绍

[0002]关系抽取为从一句话中,找到哪些实体与哪些实体有哪些关系。关系抽取可以从复杂的非结构化文本中提取出机器能够理解的结构化数据。非结构化的文本在进行关系抽取之后,可以得到结构化的图数据,进行实体与实体之间的跨文本关联。所谓的关系,指的是文本中实体与实体之间的关系,具体的关系为一系列的主谓宾三元组:(主语S,谓语P,宾语O)。目前主流的关系抽取方法是采用多轮问答法。也就是说,确定多个问题,并进行解答。但是,该方法存在难以较为准确和快速地命中用户想要了解到的问题。

技术实现思路

[0003]本申请的主要目的在于提供一种基于指代消歧的信息获取方法、信息获取装置、计算机可读存储介质与机器人,以至少解决现有技术中难以较为准确和快速地命中用户的问题,并进行针对性回答的问题。
[0004]为了实现上述目的,根据本申请的一个方面,提供了一种基于指代消歧的信息获取方法,包括:采用目标分类模型,对接收到的当前问题进行分类,得到所述当前问题对应的主语和谓语,所述目标分类模型为采用机器学习对多组样本数据进行训练得到的分类模型,所述多组样本数据中的每一组均包括训练问题以及所述训练问题对应的主语和谓语;将所述当前问题对应的谓语与当前的主分类集合进行合并处理,得到更新后的所述主分类集合,将所述当前问题对应的主语与当前的副分类集合进行合并处理,得到更新后的所述副分类集合,所述主分类集合为由多个问题的谓语组成的集合,所述副分类集合为由多个所述问题的主语组成的集合;基于更新后的所述主分类集合中的所述谓语以及更新后的所述副分类集合中的所述主语进行组合,得到至少一个目标问题,并将所述目标问题对应的答案显示在显示屏上。
[0005]可选地,所述主分类集合中各所述谓语的优先级是按照第一目标时间顺序进行排序的,所述第一目标时间顺序为各所述谓语进入所述主分类集合由晚到早的时间顺序,将所述当前问题对应的谓语与当前的主分类集合进行合并处理,得到更新后的所述主分类集合,包括:确定所述当前问题对应的谓语与第一谓语的相似度,得到目标相似度,所述第一谓语为当前的所述主分类集合中优先级最高的谓语;在所述目标相似度低于预设阈值的情况下,将所述当前问题对应的谓语合并至当前的所述主分类集合中,得到更新后的所述主分类集合。
[0006]可选地,在得到更新后的所述主分类集合之后,所述信息获取方法还包括:对更新后的所述主分类集合中各所述谓语的优先级进行更新,得到再次更新后的所述主分类集合;若再次更新后的所述主分类集合中的所述谓语的数量超过预设谓语阈值,删除再次更
新后的所述主分类集合中优先级最低的所述谓语。
[0007]可选地,所述副分类集合中各所述主语的优先级是按照第二目标时间顺序进行排序的,所述第二目标时间为各所述主语进入到所述副分类集合由晚到早的时间顺序,将所述当前问题对应的主语与当前的副分类集合进行合并处理,得到更新后的所述副分类集合,包括:将所述当前问题对应的主语并入到当前的所述副分类集合中,得到更新后的所述副分类集合。
[0008]可选地,在将所述当前问题对应的主语并入到当前的所述副分类集合中,得到更新后的所述副分类集合之后,所述信息获取方法还包括:对更新后的所述副分类集合中各所述主语的优先级进行更新,得到再次更新后的所述副分类集合;若再次更新后的所述副分类集合中的所述主语的数量超过预设主语阈值,删除再次更新后的所述副分类集合中优先级最低的所述主语。
[0009]可选地,所述主分类集合中各所述谓语的优先级是按照第一目标时间顺序进行排序的,所述第一目标时间顺序为各所述谓语进入所述主分类集合由晚到早的时间顺序,所述副分类集合中各所述主语的优先级是按照第二目标时间顺序进行排序的,所述第二目标时间为各所述主语进入到所述副分类集合由晚到早的时间顺序,基于更新后的所述主分类集合中的所述谓语以及更新后的所述副分类集合中的所述主语进行组合,得到至少一个目标问题,包括:采用更新后的所述副分类集合中优先级最高的所述主语与更新后的所述主分类集合中优先级最高的所述谓语进行组合,得到所述目标问题。
[0010]可选地,所述主分类集合中各所述谓语的优先级是按照第一目标时间顺序进行排序的,所述第一目标时间顺序为各所述谓语进入所述主分类集合由晚到早的时间顺序,所述副分类集合中各所述主语的优先级是按照第二目标时间顺序进行排序的,所述第二目标时间为各所述主语进入到所述副分类集合由晚到早的时间顺序,在可对多个所述目标问题的答案进行显示的情况下,基于更新后的所述主分类集合中的所述谓语以及更新后的所述副分类集合中的所述主语进行组合,得到至少一个目标问题,包括:基于可显示答案的所述目标问题的个数,从更新后的所述副分类集合中,按照优先级由高到低的顺序,确定与可显示答案的所述目标问题的个数相同的目标主语;采用各所述目标主语分别与更新后的所述主分类集合中的所述谓语进行组合,得到多个所述目标问题。
[0011]根据本申请的另一方面,提供了一种基于指代消歧的信息获取方法,包括:分类单元,用于采用目标分类模型,对接收到的当前问题进行分类,得到所述当前问题对应的主语和谓语,所述目标分类模型为采用机器学习对多组样本数据进行训练得到的分类模型,所述多组样本数据中的每一组均包括训练问题以及所述训练问题对应的主语和谓语;合并单元,用于将所述当前问题对应的谓语与当前的主分类集合进行合并处理,得到更新后的所述主分类集合,将所述当前问题对应的主语与当前的副分类集合进行合并处理,得到更新后的所述副分类集合,所述主分类集合为由多个问题的谓语组成的集合,所述副分类集合为由多个所述问题的主语组成的集合;组合单元,用于基于更新后的所述主分类集合中的所述谓语以及更新后的所述副分类集合中的所述主语进行组合,得到至少一个目标问题,并将所述目标问题对应的答案显示在显示屏上。
[0012]根据本申请的再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执
行任意一种所述的基于指代消歧的信息获取方法。
[0013]根据本申请的又一方面,提供了一种机器人,包括:基于指代消歧的信息获取装置,所述信息获取装置用于执行任意一种所述的基于指代消歧的信息获取方法。
[0014]应用本申请的技术方案,首先,采用预先训练好的目标分类模型,对接收到的当前问题进行分类,得到当前问题中的主语和谓语。然后,将当前问题中的谓语与当前的主分类集合中已有的谓语进行合并,以及将当前问题中的主语与当前的副分类集合中已有的主语进行合并,分别得到更新后的主分类集合以及更新后的副分类集合。最后,基于更新后的主分类集合中的谓语以及更新后的副分类集合中的主语进行组合,得到至少一个目标问题,且将该目标问题对应的答复显示在显示屏,这样实现了为用户推荐目标问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于指代消歧的信息获取方法,其特征在于,包括:采用目标分类模型,对接收到的当前问题进行分类,得到所述当前问题对应的主语和谓语,所述目标分类模型为采用机器学习对多组样本数据进行训练得到的分类模型,所述多组样本数据中的每一组均包括训练问题以及所述训练问题对应的主语和谓语;将所述当前问题对应的谓语与当前的主分类集合进行合并处理,得到更新后的所述主分类集合,将所述当前问题对应的主语与当前的副分类集合进行合并处理,得到更新后的所述副分类集合,所述主分类集合为由多个问题的谓语组成的集合,所述副分类集合为由多个所述问题的主语组成的集合;基于更新后的所述主分类集合中的所述谓语以及更新后的所述副分类集合中的所述主语进行组合,得到至少一个目标问题,并将所述目标问题对应的答案显示在显示屏上。2.根据权利要求1所述的信息获取方法,其特征在于,所述主分类集合中各所述谓语的优先级是按照第一目标时间顺序进行排序的,所述第一目标时间顺序为各所述谓语进入所述主分类集合由晚到早的时间顺序,将所述当前问题对应的谓语与当前的主分类集合进行合并处理,得到更新后的所述主分类集合,包括:确定所述当前问题对应的谓语与第一谓语的相似度,得到目标相似度,所述第一谓语为当前的所述主分类集合中优先级最高的谓语;在所述目标相似度低于预设阈值的情况下,将所述当前问题对应的谓语合并至当前的所述主分类集合中,得到更新后的所述主分类集合。3.根据权利要求2所述的信息获取方法,其特征在于,在得到更新后的所述主分类集合之后,所述信息获取方法还包括:对更新后的所述主分类集合中各所述谓语的优先级进行更新,得到再次更新后的所述主分类集合;若再次更新后的所述主分类集合中的所述谓语的数量超过预设谓语阈值,删除再次更新后的所述主分类集合中优先级最低的所述谓语。4.根据权利要求1所述的信息获取方法,其特征在于,所述副分类集合中各所述主语的优先级是按照第二目标时间顺序进行排序的,所述第二目标时间为各所述主语进入到所述副分类集合由晚到早的时间顺序,将所述当前问题对应的主语与当前的副分类集合进行合并处理,得到更新后的所述副分类集合,包括:将所述当前问题对应的主语并入到当前的所述副分类集合中,得到更新后的所述副分类集合。5.根据权利要求4所述的信息获取方法,其特征在于,在将所述当前问题对应的主语并入到当前的所述副分类集合中,得到更新后的所述副分类集合之后,所述信息获取方法还包括:对更新后的所述副分类集合中各所述主语的优先级进行更新,得到再次更新后的所述副分类集合;若再次更新后的所述副分类集合中的所述主语的数量超过预设主语阈值,删除再次更新后的所述副分类集合中优先级最低的所述主语。
6.根据权利要求1所述的信息获取方法,其特征在于,所述...

【专利技术属性】
技术研发人员:陈博文王璐石正福李健陈明武卫东
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1