【技术实现步骤摘要】
一种融合用户交互与低冗余的知识图谱实体摘要生成方法
[0001]本专利技术涉及知识图谱
,更具体地说,它涉及一种融合用户交互与低冗余的知识图谱实体摘要生成方法。
技术介绍
[0002]低冗余实体摘要算法是基于非监督算法构建的,算法中重点考量三元组的结构重要性和语义冗余度,将两个特性结合进行计算。大量三元组数据构成的RDF数据集是一类图结构,从图结构中我们能够观察到各个三元组之间的结构关系。针对三元组结构重要性这一点早已有相关的研究LinkSUM、FCAES、FACES
‑
E以及RELIN等,这些算法有的计算三元组在知识图谱中的全局结构结构重要性,衡量标准依据三元组在整个知识图谱中的出现频度来计算,出现的越少说明承载的信息越多,被标记为越重要。还有一些算法计算的方式和前面的完全相反,更关注全局特性,计算时在全局出现次数越多的三元组被认为是越重要的。不同三元组有着不同的结构目标和结构特点,因此我们在选择具体的结构重要性计算方式时,要充分考虑三元组自身的特点,选择具有针对性的计算方法。其次摘要的大小是有限的 ...
【技术保护点】
【技术特征摘要】
1.一种融合用户交互与低冗余的知识图谱实体摘要生成方法,其特征是:包括低冗余摘要算法和用户交互摘要算法;低冗余摘要算法将结构重要性高和语义冗余度低的三元组选入摘要中,将低冗余摘要算法的结果作为用户交互算法的输入参数,生成摘要作为交互算法的S0,即初始摘要;用户交互摘要算法采用“DeleteAndUpdate”模式,用户在交互前端根据S0选择自己不感兴趣的进行删除,后端接受后选择候选三元组数据集中最优的三元组反馈给用户,以更新摘要。2.根据权利要求1所述的一种融合用户交互与低冗余的知识图谱实体摘要生成方法,其特征是:低冗余摘要算法算法共分为以下3步:S1.考虑三元组的结构重要性:选取全局流行度高的三元组,因为属性的高流行度通常意味着较高的通...
【专利技术属性】
技术研发人员:崔刚,张亶,张情川,王鑫,杨漾,周旺,任昊文,蔡春雷,邹宁,李晓林,赵子涵,章潇静,杨文婧,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。