基于指代消歧的信息获取方法、信息获取装置与机器人制造方法及图纸

技术编号：39278101 阅读：8 留言：0更新日期：2023-11-07 10:53

本申请提供了一种基于指代消歧的信息获取方法、信息获取装置与机器人。该方法包括：采用目标分类模型，对接收到的当前问题进行分类，得到当前问题对应的主语和谓语；将当前问题对应的谓语与当前的主分类集合进行合并处理，得到更新后的主分类集合，将当前问题对应的主语与当前的副分类集合进行合并处理，得到更新后的副分类集合，主分类集合为由多个问题的谓语组成的集合，副分类集合为由多个问题的主语组成的集合；基于更新后的主分类集合中的谓语以及更新后的副分类集合中的主语进行组合，得到至少一个目标问题，并将目标问题对应的答案显示在显示屏上，从而解决了现有技术中难以较为准确和快速地命中用户的问题，并进行针对性回答的问题。针对性回答的问题。针对性回答的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于指代消歧的信息获取方法、信息获取装置与机器人

[0001]本申请涉及人工智能
，具体而言，涉及一种基于指代消歧的信息获取方法、信息获取装置、计算机可读存储介质与机器人。

技术介绍

[0002]关系抽取为从一句话中，找到哪些实体与哪些实体有哪些关系。关系抽取可以从复杂的非结构化文本中提取出机器能够理解的结构化数据。非结构化的文本在进行关系抽取之后，可以得到结构化的图数据，进行实体与实体之间的跨文本关联。所谓的关系，指的是文本中实体与实体之间的关系，具体的关系为一系列的主谓宾三元组：(主语S，谓语P，宾语O)。目前主流的关系抽取方法是采用多轮问答法。也就是说，确定多个问题，并进行解答。但是，该方法存在难以较为准确和快速地命中用户想要了解到的问题。

技术实现思路

[0003]本申请的主要目的在于提供一种基于指代消歧的信息获取方法、信息获取装置、计算机可读存储介质与机器人，以至少解决现有技术中难以较为准确和快速地命中用户的问题，并进行针对性回答的问题。
[0004]为了实现上述目的，根据本申请的一个方面，提供了一种基于指代消歧的信息获取方法，包括：采用目标分类模型，对接收到的当前问题进行分类，得到所述当前问题对应的主语和谓语，所述目标分类模型为采用机器学习对多组样本数据进行训练得到的分类模型，所述多组样本数据中的每一组均包括训练问题以及所述训练问题对应的主语和谓语；将所述当前问题对应的谓语与当前的主分类集合进行合并处理，得到更新后的所述主分类集合，将所述当前问题对应的主语与当前的副分类集合进...

【技术保护点】

【技术特征摘要】
1.一种基于指代消歧的信息获取方法，其特征在于，包括：采用目标分类模型，对接收到的当前问题进行分类，得到所述当前问题对应的主语和谓语，所述目标分类模型为采用机器学习对多组样本数据进行训练得到的分类模型，所述多组样本数据中的每一组均包括训练问题以及所述训练问题对应的主语和谓语；将所述当前问题对应的谓语与当前的主分类集合进行合并处理，得到更新后的所述主分类集合，将所述当前问题对应的主语与当前的副分类集合进行合并处理，得到更新后的所述副分类集合，所述主分类集合为由多个问题的谓语组成的集合，所述副分类集合为由多个所述问题的主语组成的集合；基于更新后的所述主分类集合中的所述谓语以及更新后的所述副分类集合中的所述主语进行组合，得到至少一个目标问题，并将所述目标问题对应的答案显示在显示屏上。2.根据权利要求1所述的信息获取方法，其特征在于，所述主分类集合中各所述谓语的优先级是按照第一目标时间顺序进行排序的，所述第一目标时间顺序为各所述谓语进入所述主分类集合由晚到早的时间顺序，将所述当前问题对应的谓语与当前的主分类集合进行合并处理，得到更新后的所述主分类集合，包括：确定所述当前问题对应的谓语与第一谓语的相似度，得到目标相似度，所述第一谓语为当前的所述主分类集合中优先级最高的谓语；在所述目标相似度低于预设阈值的情况下，将所述当前问题对应的谓语合并至当前的所述主分类集合中，得到更新后的所述主分类集合。3.根据权利要求2所述的信息获取方法，其特征在于，在得到更新后的所述主分类集合之后，所述信息获取方法还包括：对更新后的所述主分类集合中各所述谓语的优先级进行更新，得到再次更新后的所述主分类集合；若再次更新后的所述主分类集合中的所述谓语的数量超过预设谓语阈值，删除再次更新后的所述主分类集合中优先级最低的所述谓语。4.根据权利要求1所述的信息获取方法，其特征在于，所述副分类集合中各所述主语的优先级是按照第二目标时间顺序进行排序的，所述第二目标时间为各所述主语进入到所述副分类集合由晚到早的时间顺序，将所述当前问题对应的主语与当前的副分类集合进行合并处理，得到更新后的所述副分类集合，包括：将所述当前问题对应的主语并入到当前的所述副分类集合中，得到更新后的所述副分类集合。5.根据权利要求4所述的信息获取方法，其特征在于，在将所述当前问题对应的主语并入到当前的所述副分类集合中，得到更新后的所述副分类集合之后，所述信息获取方法还包括：对更新后的所述副分类集合中各所述主语的优先级进行更新，得到再次更新后的所述副分类集合；若再次更新后的所述副分类集合中的所述主语的数量超过预设主语阈值，删除再次更新后的所述副分类集合中优先级最低的所述主语。
6.根据权利要求1所述的信息获取方法，其特征在于，所述...

【专利技术属性】
技术研发人员：陈博文，王璐，石正福，李健，陈明，武卫东，
申请(专利权)人：北京捷通华声科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人