The present invention provides a resource recommendation method, including: A, obtaining information of each resource to be recommended and resource information that is controlled; B, obtaining its initial keyword tag for each resource information, which includes several keywords of the resource information under the initial keyword tag; C, each of the initial keyword tags. Key words, identify similar key words for each keyword, which include a number of key words similar to the key words; D, for each resource information, it combines its initial keyword label with a similar keyword tag as a new label for the resource information, which includes the initial closure. Key words and similar key words are included in the key words; E, according to each recommended resource information and the new label in the control resource information, calculate the similarity between the resource information to be recommended and the control resource information, and recommend the recommended resource information that the similar results exceed the specified threshold.
【技术实现步骤摘要】
一种资源推荐方法
本专利技术属于计算机应用
,具体涉及一种资源推荐方法。
技术介绍
随着互联网技术的日益普及,有越来越多的信息在互联网上展示,如何对信息进行分类对于人们快速查找有用信息尤其重要。标签系统以关键词的形式对资源进行分类,是一种灵活的、开放的分类方式,是对用户无约束的运用自由定义的关键字的方式进行协作分类的一种工具。常见的关键词标签提取技术有TF-IDF算法,此算法主要通过特征词向量来描述文本特征。通过计算得到文本特征向量,通过计算向量之间的余弦相似度,得到文本相似度排序,随后对文本进行相似推荐。关键词提取的标签能帮助用户管理分类资源的信息资源,并提供分享和交流的平台,由于标签的自动化提取过程的不足,不可避免的出现以下问题:同义标签、标签的抽象程度不同,例如,苹果和水果,喜欢和喜爱,a股和股票。标签是在描述同一种类型,所要表达的信息类似,但是表达方式不同。但是由于通过余弦相似度来计算文本相似度仅仅是把标签当成一个维度,未考量每一个标签的相似标签,从而会导致标签粒度太粗,以使一些相似资源未获得推荐,从而导致推荐结果不准确。因此,目前亟需一种提高资源推荐准确度的资源推荐方法。
技术实现思路
有鉴于此,本申请提供一种资源推荐方法,对各个资源内部的各个初始关键词标签获取了其相似性标签,并进一步地据此进行资源之间的相似性的比对,本申请通过细化标签的粒度,有利于更精确的获取到相似的资源,以有利于提高资源推荐的准确度。本申请提供一种资源推荐方法,其特征在于,包括:A、获取待推荐的各个资源信息以及对照资源信息;B、分别获取每个资源信息的初始关键词标签集合,及获 ...
【技术保护点】
1.一种资源推荐方法,其特征在于,包括:A、获取待推荐的各个资源信息以及对照的资源信息;B、针对每个资源信息,获取其初始关键词标签,所述初始关键词标签下包括所述资源信息的若干关键词;C、针对每个初始关键词标签内的各关键词,确定出各关键词的相似关键词标签,所述相似关键词标签下包括与所述关键词相似的若干关键词;D、针对每个资源信息,将对应其的初始关键词标签与相似关键词标签合并作为所述资源信息新标签,所述新标签下包括所述初始关键词标签与所述相似关键词标签所包含的关键词;E、根据每个所述待推荐的资源信息以及对照的资源信息中的新标签,计算所述待推荐的资源信息与对照的资源信息的相似性;并将相似结果超过指定阈值的待推荐的资源信息进行推荐。
【技术特征摘要】
1.一种资源推荐方法,其特征在于,包括:A、获取待推荐的各个资源信息以及对照的资源信息;B、针对每个资源信息,获取其初始关键词标签,所述初始关键词标签下包括所述资源信息的若干关键词;C、针对每个初始关键词标签内的各关键词,确定出各关键词的相似关键词标签,所述相似关键词标签下包括与所述关键词相似的若干关键词;D、针对每个资源信息,将对应其的初始关键词标签与相似关键词标签合并作为所述资源信息新标签,所述新标签下包括所述初始关键词标签与所述相似关键词标签所包含的关键词;E、根据每个所述待推荐的资源信息以及对照的资源信息中的新标签,计算所述待推荐的资源信息与对照的资源信息的相似性;并将相似结果超过指定阈值的待推荐的资源信息进行推荐。2.根据权利要求1所述的方法,其特征在于,所述步骤B包括:b1、针对每个资源信息,将其所包含的各个信息合并生成长文本信息,对所述文长本信息进行分词处理形成语料;b2、针对各资源所形成的语料,通过TF-IDF算法确定出各资源信息包含的关键词及各关键词的权重,并对于权重超过阈值的关键词打上初始关键词标签。3.根据权利要求2所述的方法,其特征在于,所述步骤b2中所述通过TF-IDF算法确定出各资源信息包含的关键词及各关键词的权重的步骤包括:针对所述各资源所形成的各语料中的各词语,计算各词语TF和IDF;将每个词语的TF和IDF相乘得到该词语的TF-IDF值作为各词语的权重;针对各个资源信息,将其对应的权重超过指定阈值的词语作为该资源的关键词。4.根据权利要求1-3任一项所述的方法,其特征在于,所述步骤C包括:c1、使用Word2Vec获取每个资源信息中的各个初始关键词标签内的各初始关键词的词空间向量模型;c2、根...
【专利技术属性】
技术研发人员:苗原,李鹏,公艳,张勇,
申请(专利权)人:北京方正阿帕比技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。