基于图谱标签降噪的素材推荐方法及系统技术方案

技术编号:27975852 阅读:31 留言:0更新日期:2021-04-06 14:10
本申请公开了一种基于图谱标签降噪的素材推荐方法及系统,素材推荐方法包括:预处理步骤:从用户的搜索内容中抽取关键词并对所述关键词进行处理;匹配步骤:根据处理后的所述关键词与知识图谱中的节点进行匹配;抽取步骤:抽取匹配后的节点子图,并通过Louvain算法对所述节点子图进行聚类,根据聚类结果输出搜索结果;输出步骤:通过下游模型对所述搜索结果进行排序和推荐。本发明专利技术的降噪方式可以很大程度上减少图谱中的标签噪声,使得通过图谱做索引的文章相关度更高,同时在性能上有很大帮助,并且可视化效果也很好,从而提高了用户体验。

【技术实现步骤摘要】
基于图谱标签降噪的素材推荐方法及系统
本专利技术属于基于图谱标签降噪的素材推荐的方法领域,具体涉及一种基于图谱标签降噪的素材推荐方法及系统。
技术介绍
传统的搜索引擎,在一定程度上解决了用户从互联网中获取信息的难题,但由于它们是基于关键词或字符串的,并没有对查询的目标和用户的查询输入进行理解。因此,它们在搜索准确度方面存在明显的欠缺。运用了知识图谱的智能搜索引擎可以返回更加精准的结果。然而构造和应用领域知识图谱,依然面临着各种挑战和难题。一个比较麻烦的问题是构造知识图谱,我们需要对图谱进行大量人工的打标,但是很多人打标的方式不一样,造成打标的结果也参差不齐。打标质量太差会造成大量的标签不具有实际意义,歧义很多,也会带来很多噪声。因为我们在搜索时大部分时候是通过匹配搜索内容和标签,然后根据标签再去找相似的素材等等,那么标签的质量就很重要了。现有的方法:我们在使用图谱进行素材搜索时,会首先根据用户搜索信息抽取关键词,然后将关键词和图谱中的标签节点进行映射,然后通过该节点去找相关的热门素材。然而这个方法的最大问题是,如果标签里本文档来自技高网...

【技术保护点】
1.一种基于图谱标签降噪的素材推荐方法,其特征在于,包括:/n预处理步骤:从用户的搜索内容中抽取关键词并对所述关键词进行处理;/n匹配步骤:根据处理后的所述关键词与知识图谱中的节点进行匹配;/n抽取步骤:抽取匹配后的节点子图,并通过Louvain算法对所述节点子图进行聚类,根据聚类结果输出搜索结果;/n输出步骤:通过下游模型对所述搜索结果进行排序和推荐。/n

【技术特征摘要】
1.一种基于图谱标签降噪的素材推荐方法,其特征在于,包括:
预处理步骤:从用户的搜索内容中抽取关键词并对所述关键词进行处理;
匹配步骤:根据处理后的所述关键词与知识图谱中的节点进行匹配;
抽取步骤:抽取匹配后的节点子图,并通过Louvain算法对所述节点子图进行聚类,根据聚类结果输出搜索结果;
输出步骤:通过下游模型对所述搜索结果进行排序和推荐。


2.如权利要求1所述的基于图谱标签降噪的素材推荐方法,其特征在于,所述预处理步骤包括:
关键词抽取步骤:通过算法从所述搜索内容中进行关键词抽取获得所述关键词;
消歧步骤:通过算法计算所述关键词和所述知识图谱的中节点的相关度。


3.如权利要求1所述的基于图谱标签降噪的素材推荐方法,其特征在于,所述匹配步骤包括:
根据所述相关度将所述关键词和所述知识图谱中的节点建立映射关系。


4.如权利要求1所述的基于图谱标签降噪的素材推荐方法,其特征在于,所述抽取步骤包括:
节点子图抽取步骤:根据所述映射关系抽取所述知识图谱中的节点周围的所述子图;
聚类步骤:通过所述Louvain算法获取所述子图中的热门节点;
搜索结果获得步骤:根据所述热门节点获得所述搜索结果。


5.如权利要求1所述的基于图谱标签降噪的素材推荐方法,其特征在于,所述下游模型为语义相关匹配算法或者为基于用户和物品信息的推荐模型。


6.一种基于图谱标签降噪的素材推荐系统,其特征在...

【专利技术属性】
技术研发人员:陈嘉真孙泽懿张琛
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1