【技术实现步骤摘要】
基于知识图谱的科技服务推荐方法、装置、设备及存储介质
本专利技术涉及科技服务推荐领域,具体而言,本专利技术涉及一种基于知识图谱的科技服务推荐方法、装置、设备及存储介质。
技术介绍
科技服务业是围绕科技创新开展的服务支撑性行业。高科技产品的研制过程涉及专利技术、技术人才、技术设备、研发平台等科技要素。随着科技的飞速发展,各类科技服务要素爆发式发展。面对海量的科技服务要素信息,需求方往往难以找到与项目产品匹配的科技服务要素,从而影响了产品的研发效率。特别是,大多数的项目产品的研制过程都涉及到多个流程环节,每个流程环节对科技服务要素的需求情况各不相同。因此,如何针对项目产品研制过程的各个流程环节,实施针对性的科技服务推荐是目前亟待解决的问题。
技术实现思路
为了解决上述技术问题中的至少一个,本专利技术第一方面提出了一种基于知识图谱的科技服务推荐方法,其具体技术方案如下:一种基于知识图谱的科技服务推荐方法,其包括:获取科技服务需求对象的包括有若干流程环节的流程文档,及各流程环节对应的需求文 ...
【技术保护点】
1.一种基于知识图谱的科技服务推荐方法,其特征在于,包括:/n获取科技服务需求对象的包括有若干流程环节的流程文档,及各所述流程环节对应的需求文档;/n获取各所述流程环节对应的需求文档的初始关键词;/n使用网络爬虫爬取到各所述流程环节的初始科技服务文档;/n基于命名实体抽取模型及所述初始科技服务文档抽取出所述初始科技服务文档所涉及的初始命名实体;/n使用抽取出的初始命名实体对所述初始关键词进行扩充得到各所述流程环节对应的需求文档的扩充关键词;/n基于所述流程环节对应的需求文档的扩充关键词获得各所述流程环节的最终科技服务文档;/n基于命名实体抽取模型及所述最终科技服务文档抽取出 ...
【技术特征摘要】
1.一种基于知识图谱的科技服务推荐方法,其特征在于,包括:
获取科技服务需求对象的包括有若干流程环节的流程文档,及各所述流程环节对应的需求文档;
获取各所述流程环节对应的需求文档的初始关键词;
使用网络爬虫爬取到各所述流程环节的初始科技服务文档;
基于命名实体抽取模型及所述初始科技服务文档抽取出所述初始科技服务文档所涉及的初始命名实体;
使用抽取出的初始命名实体对所述初始关键词进行扩充得到各所述流程环节对应的需求文档的扩充关键词;
基于所述流程环节对应的需求文档的扩充关键词获得各所述流程环节的最终科技服务文档;
基于命名实体抽取模型及所述最终科技服务文档抽取出所述最终科技服务文档所涉及的扩充命名实体;
基于关系抽取模型、所述的最终科技服务文档及所述扩充命名实体抽取出各所述扩充命名实体之间的关系;
将所述扩充命名实体及各所述扩充命名实体之间的关系存储至图数据库中以形成知识图谱;
基于所述知识图谱实施对科技服务需求对象的科技服务推荐。
2.如权利要求1所述的科技服务推荐方法,其特征在于,所述获取各所述流程环节对应的需求文档的初始关键词包括:
采用jieba中文分词方法对所述流程环节对应的需求文档进行分词处理,并剔除其中的停用词,统计出高频词作为所述初始关键词。
3.如权利要求1所述的基于知识图谱的科技服务推荐方法,其特征在于,所述使用网络爬虫爬取到各所述流程环节的初始科技服务文档包括:
针对各所述流程环节,使用网络爬虫分别从选定的目标网络平台上爬取到若干候选科技服务文档;
计算各所述候选科技服务文档与对应的需求文档的初始关键词之间的相关度,选择相关度大于预定阈值的所述候选科技服务文档作为所述初始科技服务文档。
4.如权利要求3所述的科技服务推荐方法,其特征在于:
所述候选科技服务文档为词数少于预定阈值的短文本,所述计算各所述候选科技服务文档与对应的需求文档的初始关键词之间的相关度包括:
采用jieba中文分词方法对所述候选科技服务文档进行分词处理,并剔除其中的停用词,并统计出其中的高频词作为所述候选科技服务文档的关键词;
使用word2vec模型分别将所述候选科技服务文档的关键词和对应的需求文档的初始关键词映射为词向量;
基于所述候选科技服务文档和所述需求文档的初始关键词的词向量计算所述候选科技服务文档与所述需求文档的初始关键词之间的相关度。
5.如权利要求3所述的科技服务推荐方法,其特征在于:
所述候选科技服务文档为词数等于或多于预定阈值的长文本,所述计算各所述候选科技服务文档与对应的需求文档的初始关键词之间的相关度包括:
采用LDA模型从所述选科技服务文档中抽取出关键词;
使用word2vec模型分别将所述候选科技服务文档的关键...
【专利技术属性】
技术研发人员:孙圣力,徐嘉辰,李青山,司华友,
申请(专利权)人:北京大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。