【技术实现步骤摘要】
一种融合知识图谱的服务推荐方法
本专利技术涉及数据分析
,尤其涉及一种融合知识图谱的服务推荐方法。
技术介绍
目前的服务推荐方法大多存在冷启动问题,不能很好的对新的或者未被用户评分的服务进行推荐,会造成给用户推荐的服务并不符合用户真正需要的情况。且当前的解决方法中鲜有与知识图谱相结合的方法。
技术实现思路
基于上述存在的问题,本专利技术提供一种融合知识图谱的服务推荐方法,用以解决现有的推荐方法的冷启动问题。本专利技术提出一种融合知识图谱的服务推荐方法,包括:对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;将知识图 ...
【技术保护点】
1.一种融合知识图谱的服务推荐方法,其特征是,包括:/n对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;/n通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;/n将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;/n将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;/n将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;/n结合基于服 ...
【技术特征摘要】
1.一种融合知识图谱的服务推荐方法,其特征是,包括:
对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;
通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;
将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;
将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;
将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;
结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
2.如权利要求1所述的方法,其特征是,所述对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组包括:
服务集A,A={a1,a2,...,an},对于A中的每个服务个体a∈A,进行以下操作:
将服务个体a的特征信息Ma进行分词,得到分词后的结果ma={ma1,ma2,...,man};
对分词后的结果ma中的每一个词mai(i=1,2,...,n)的词性进行标注,包括标注为名词、动词、形容词等;
对词性标注后的mai进行命名实体识别,确定mai实体的类型(人名、地名、机构名或其它);
利用mai的命名实体识别结果,通过依存句法分析,将ma中每个词之间的关系表示出来ra=(mai,r,maj),i,j=1,2,...,n,i≠j,其中r为14种依存句法分析标注关系(主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)等)之一;
将ra中包含服务个体特征信息的主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)进行抽取,形成服务个体a的三元关系组Ga=(a,rj,tj),j=1,2,....;
在a的三元关系组Ga=(a,rj,tj),j=1,2,....中,tj包含着a的特征词,取tj的全集为服务个体a的特征词集合CFa={CFa1,CFa2,....}。
3.如权利要求1或2所述的方法,其特征是,所述通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,的特征词集合CFa={CFa1,CFa2,....}进行以下操作:
设特征词CFai在a的特征信息中出现nai次,a的特征信息中共有Σknak个词。计算特征词CFai的TF值,
设特征信息语料库中的文档总数为D,其中包含CFai的文档数为Dai。计算特征词CFai的IDF值,IDFai=log(D/(Dai+1));
计算特征词CFai的TF-IDF值,TF-IDFai=TFai×IDFai;
对服务个体a特征词集合CFa中所有特征词的TF-IDF值进行排序,选取前ω作为服务个体a的特征词集合CF’a={CF’a1,CF’a2,...,CF’aω};
根据新的服务个体a的特征词集合CF’a,对应删除a中不必要的三元关系组,更新后的三元关系组记为G’a=(a,r’j,t’j),j=1,2,...。
4.如权利要求1或2或3所述的方法,其特征是,所述将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱,具体为:
设服务知识图谱为G,对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,进行以下操作:
判断G中是否存在服务个体a对应的实体;
如果G中存在服务个体a对应的实体,即a∈G,进行以下操作:
将服务个...
【专利技术属性】
技术研发人员:杨贞帼,张宏国,马超,黄海,
申请(专利权)人:哈尔滨理工大学,
类型:发明
国别省市:黑龙江;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。