本申请公开了一种知识抽取、问答及推荐方法和相关装置、设备、介质。该方法包括:获取时序知识图谱;基于若干三元组分别标注的有效时间进行聚类,得到若干种时间性质的三元组集合;其中,若干种时间性质包括闭区间性质、开区间性质和瞬时性质中的至少一种;对于各种时间性质的三元组集合,获取三元组的特征表示分别在三元组的各个有效超平面上的投影表示;基于三元组分别在各种时间性质的三元组集合所提取得到的投影表示,融合得到三元组的知识表示。通过上述方式,从关系的角度利用三元组的时间性质建模,从而将关系所携带的时间语义信息纳入模型结构中,使得知识表示的事实更加精准。准。准。
【技术实现步骤摘要】
知识抽取、问答及推荐方法和相关装置、设备、介质
[0001]本申请涉及知识图谱
,特别是涉及一种知识抽取、问答及推荐方法和相关装置、设备、介质。
技术介绍
[0002]知识图谱(knowledge Graph,简称KG)将现实世界中的事实(即知识)以有向图的结构化形式来表示,包含着语义信息。随着人工智能发展,知识图谱作为人工智能实现的技术基石,广泛用于问答、推荐系统等领域。大部分研究将知识图谱视为静态,以三元组(head头实体,relation关系,tail尾实体)的形式来表示知识,而忽略其中的时间信息,然而许多知识只在特定的时间上有效。例如,工作岗位的聘用有效期,突发事件的发生时间等等,将时间信息加以融入便构成了时序知识图谱(Temporal Knowledge Graph,简称TKG)。时序知识图谱中的知识以四元组的形式来表示,即(head头实体,relation关系,tail尾实体,time时间戳),时序知识图谱增加了时间维度time,与静态知识图谱结构不同的是,实体之间的边(即关系)上带有时间注释。
[0003]无论是静态还是时序,现有知识图谱虽然规模大,但是仍然存在着不完整的问题,无法涵盖现实世界的所有知识。自然语言处理领域中的word2vec模型将词编码为低维向量,映射至向量空间中,受到该启发,知识图谱表示学习将KG中的实体和关系也编码至连续的向量空间中,使用低维向量来表示结构以及语义信息,基于现有知识对KG进行补全(Knowledge Graph Embedding,简称KGE)或推理,使得知识图谱能够涵盖更丰富的知识。已有广泛的研究关注于静态知识图谱表示学习,技术流派清晰且成熟,包括基于翻译、基于语义匹配、神经网络的静态知识图谱补全方法,而对于时序知识图谱来说,如何有效地利用四元组中的时间注释以生成更好的实体、关系表示仍处于探索阶段。
技术实现思路
[0004]本申请主要解决的技术问题是提供一种知识抽取、问答及推荐方法和相关装置、设备、介质,能够将关系所携带的时间语义信息纳入模型结构中,使得知识表示的事实更加精准。
[0005]为了解决上述问题,本申请采用的一种技术方案是提供一种知识抽取方法,该方法包括:获取时序知识图谱;其中,时序知识图谱包含若干三元组,且各三元组中的关系标注有关系的有效时间;基于若干三元组分别标注的有效时间进行聚类,得到若干种时间性质的三元组集合;其中,若干种时间性质包括闭区间性质、开区间性质和瞬时性质中的至少一种;对于各种时间性质的三元组集合,获取三元组的特征表示分别在三元组的各个有效超平面上的投影表示;其中,三元组的有效超平面基于三元组标注的有效时间在三元组集合的若干时间超平面选择得到;基于三元组分别在各种时间性质的三元组集合所提取得到的投影表示,融合得到三元组的知识表示。
[0006]其中,若干时间超平面基于三元组集合中各三元组标注的有效时间划分得到,各
时间超平面分别对应的时间域互不重合,且三元组的有效超平面对应的时间域与三元组标注的有效时间存在重合部分。
[0007]其中,若干时间超平面分别被选择作为有效超平面的次数之间的差异低于预设值。
[0008]其中,获取三元组的特征表示分别在三元组的各个有效超平面上的投影表示,包括:基于有效超平面的法向表示,获取特征表示在有效超平面法向方向上的法向投影;基于特征表示和法向投影,得到投影表示。
[0009]其中,基于若干三元组分别标注的有效时间进行聚类,得到若干种时间性质的三元组集合,包括:基于三元组所标注的有效时间,确定三元组所属的时间性质;基于三元组所属的时间性质,聚类得到若干种时间性质的三元组集合。
[0010]其中,特征表示是预先经若干轮训练得到的,且在每轮训练过程中,执行在各有效超平面上进行特征投影的步骤,并基于投影表示的置信分值调整特征表示。
[0011]其中,特征投影基于时间超平面的法向表示得到,特征表示的训练步骤包括:将按时间排序的时间超平面,分别作为当前超平面,并将当前超平面的前一时间超平面作为参考超平面;基于参考超平面的法向表示,得到参考超平面在时间维度演化下一时间域的预测表示;基于参考超平面对应的预测表示与当前超平面的法向表示之间的表示差异,得到第一损失,并基于投影表示的置信分值,得到第二损失;基于第一损失和第二损失,调整特征表示。
[0012]其中,基于参考超平面对应的预测表示与当前超平面的法向表示之间的表示差异,得到第一损失,包括:对于各三元组集合,分别获取三元组集合的相邻时间超平面之间的表示差异,并基于各个表示差异,得到子损失;基于各三元组集合分别对应的子损失,获取第一损失。
[0013]为了解决上述问题,本申请采用的另一种技术方案是提供一种问答方法,该方法包括:获取用户问题;将用户问题转换成规则化问题;将规则化问题与基于知识表示模型输出的知识表示进行问题匹配,将相似度最高的匹配结果确定为答案;其中,知识表示模型输出的知识表示包括头实体表示、尾实体表示和关系表示,且知识表示利用如上述技术方案提供的知识抽取方法得到。
[0014]为了解决上述问题,本申请采用的另一种技术方案是提供一种推荐方法,该方法包括:获取商品信息以及用户的交互信息;根据商品信息和交互信息建立时序知识图谱;获取时序知识图谱中各三元组的知识表示;根据知识表示,对商品进行评分预测,最终根据评分顺序得到商品的推荐结果;其中,三元组的知识表示包括头实体表示、尾实体表示和关系表示,且知识表示利用如上述技术方案提供的知识抽取方法得到。
[0015]为了解决上述问题,本申请采用的另一种技术方案是提供一种知识抽取装置,该知识抽取装置包括:图谱获取模块,用于获取时序知识图谱;其中,时序知识图谱包含若干三元组,且各三元组中的关系标注有关系的有效时间;聚类模块,用于基于若干三元组分别标注的有效时间进行聚类,得到若干种时间性质的三元组集合;其中,若干种时间性质包括闭区间性质、开区间性质和瞬时性质中的至少一种;投影模块,用于对于各种时间性质的三元组集合,获取三元组的特征表示分别在三元组的各个有效超平面上的投影表示;其中,三元组的有效超平面基于三元组标注的有效时间在三元组集合的若干时间超平面选择得到;
融合模块,用于基于三元组分别在各种时间性质的三元组集合所提取得到的投影表示,融合得到三元组的知识表示。
[0016]为了解决上述问题,本申请采用的另一种技术方案是提供一种问答装置,该问答装置包括:问题获取模块,用于获取用户问题;转化模块,用于将用户问题转换成规则化问题;匹配模块,用于将规则化问题与基于知识表示模型输出的知识表示进行问题匹配,将相似度最高的匹配结果确定为答案。
[0017]为了解决上述问题,本申请采用的另一种技术方案是提供一种推荐装置,该推荐装置包括:信息获取模块,用于获取商品信息以及用户的交互信息;知识抽取模块,用于根据商品信息和交互信息建立时序知识图谱,并获取时序知识图谱中各三元组的知识表示;评分模块,用于根据知识表示,对商品进行评分本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种知识抽取方法,其特征在于,包括:获取时序知识图谱;其中,所述时序知识图谱包含若干三元组,且各所述三元组中的关系标注有所述关系的有效时间;基于所述若干三元组分别标注的有效时间进行聚类,得到若干种时间性质的三元组集合;其中,所述若干种时间性质包括闭区间性质、开区间性质和瞬时性质中的至少一种;对于各种所述时间性质的三元组集合,获取所述三元组的特征表示分别在所述三元组的各个有效超平面上的投影表示;其中,所述三元组的有效超平面基于所述三元组标注的有效时间在所述三元组集合的若干时间超平面选择得到;基于所述三元组分别在各种所述时间性质的三元组集合所提取得到的投影表示,融合得到所述三元组的知识表示。2.根据权利要求1所述的方法,其特征在于,所述若干时间超平面基于所述三元组集合中各所述三元组标注的有效时间划分得到,各所述时间超平面分别对应的时间域互不重合,且所述三元组的有效超平面对应的时间域与所述三元组标注的有效时间存在重合部分。3.根据权利要求1所述的方法,其特征在于,所述若干时间超平面分别被选择作为所述有效超平面的次数之间的差异低于预设值。4.根据权利要求1所述的方法,其特征在于,所述获取所述三元组的特征表示分别在所述三元组的各个有效超平面上的投影表示,包括:基于所述有效超平面的法向表示,获取所述特征表示在所述有效超平面法向方向上的法向投影;基于所述特征表示和所述法向投影,得到所述投影表示。5.根据权利要求1所述的方法,其特征在于,所述基于所述若干三元组分别标注的有效时间进行聚类,得到若干种时间性质的三元组集合,包括:基于所述三元组所标注的有效时间,确定所述三元组所属的时间性质;基于所述三元组所属的时间性质,聚类得到所述若干种时间性质的三元组集合。6.根据权利要求1所述的方法,其特征在于,所述特征表示是预先经若干轮训练得到的,且在每轮训练过程中,执行在各所述有效超平面上进行特征投影的步骤,并基于所述投影表示的置信分值调整所述特征表示。7.根据权利要求6所述的方法,其特征在于,所述特征投影基于所述时间超平面的法向表示得到,所述特征表示的训练步骤包括:将按时间排序的时间超平面,分别作为当前超平面,并将所述当前超平面的前一所述时间超平面作为参考超平面;基于所述参考超平面的法向表示,得到所述参考超平面在时间维度演化下一时间域的预测表示;基于所述参考超平面对应的预测表示与所述当前超平面的法向表示之间的表示差异,得到第一损失,并基于所述投影表示的置信分值,得到第二损失;基于所述第一损失和所述第二损失,调整所述特征表示。8.根据权利要求7所述的方法,其特征在于,所述基于所述参考超平面对应的预测表示与所述当前超平面的法向表示之间的表示差异,得到第一损失,包括:
对于各所述三元组集合,分别获取所述三元组集合的相邻所述时间超平面之间的表示差异,并基于各个所述表示差异,得到子损失;基于各所述三元组集合分别对...
【专利技术属性】
技术研发人员:袁琳,李直旭,陈志刚,支洪平,何莹,
申请(专利权)人:科大讯飞苏州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。