获取数据资源的方法、装置、存储介质及处理器制造方法及图纸

技术编号:24090919 阅读:21 留言:0更新日期:2020-05-09 08:02
本发明专利技术实施例提供一种获取数据资源的方法、装置、存储介质及处理器,属于计算机技术领域。所述方法包括:获取关键词和检索标签;根据所述关键词和检索标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息;对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值;根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到每个目标数据资源的平均值,并根据所述平均值对相应的目标数据资源进行排序。本发明专利技术实施例适用于在数据资源管理系统中获取数据资源的过程。

Methods, devices, storage media and processors for obtaining data resources

【技术实现步骤摘要】
获取数据资源的方法、装置、存储介质及处理器
本专利技术涉及计算机
,具体地涉及一种获取数据资源的方法、装置、存储介质及处理器。
技术介绍
在数据资源管理系统中,数据资源按照一定标准存储,并按照一定标准进行分类且通过界面展示每一类的数据资源。当用户在数据资源管理系统中检索数据资源时,往往由于种类繁多难以寻找到对自己有用的数据资源。对于现有技术中的网站搜索引擎,由于其更加侧重于文字匹配的检索,无法适用于数据资源管理系统中的检索。
技术实现思路
本专利技术实施例的目的是提供一种获取数据资源的方法、装置、存储介质及处理器,提供了针对于数据资源管理系统中的检索方式,且在提供检索结果时进行推荐排序,提高用户获取目标数据资源的效率。为了实现上述目的,第一方面,本专利技术实施例提供一种获取数据资源的方法,所述方法包括:获取关键词和检索标签;根据所述关键词和检索标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息;对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值;根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到每个目标数据资源的平均值,并根据所述平均值对相应的目标数据资源进行排序。进一步地,所述数据资源管理系统中包括多个数据资源、以及每个数据资源所对应的名称、描述和标签;并且,所述根据所述关键词和检索标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息包括:将所述数据资源管理系统中数据资源的名称和/或描述与所述关键词匹配、且标签与所述检索标签匹配的数据资源,确定为所述待排序的目标数据资源;所述维度信息中包括名称相关性和描述相关性,通过下述方式确定所述目标数据资源的所述名称相关性以及描述相关性所对应的维度数值:将所述目标数据资源的名称和描述与所述关键词进行匹配,分别得到所述目标数据资源的名称相似值和描述相似值。进一步地,在所述根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均时,其中所述维度信息所对应的维度数值包括所述名称相关性所对应的所述名称相似值以及所述描述相关性所对应的描述相似值,或所述名称相关性和描述相关性所对应的综合相似值,其中所述综合相似值由所述名称相似值和所述描述相似值得到。进一步地,所述维度信息还包括数据质量、最近更新时间、点击数、收藏数、评论数、评论情感、版本迭代频率或关联关系总数量中的至少一个,其中所述关联关系总数量为数据资源与其它数据资源关联的次数。进一步地,所述对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值包括:当所述维度信息中包括数据质量时,根据所述目标数据资源的数据质量对应的文字标签以及预设文字与数值的对应关系,将所述目标数据资源的数据质量对应的文字标签转换为质量数值,所述数据质量表示数据资源的质量;和/或当所述维度信息中包括最近更新时间时,通过unix时间戳转换器,将所述目标数据资源的最近更新时间转换为更新时间数值;和/或当所述维度信息中包括评论情感时,通过情感识别工具,将所述目标数据资源的评论情感转换为评论情感比例。进一步地,所述根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到每个目标数据资源的平均值包括:根据得到每个目标数据资源的平均值,其中,K为每个目标数据资源的平均值,n为每个目标数据资源的维度信息的数量,wi为每个目标数据资源第i个维度信息所对应的预设权重,ai为每个目标数据资源第i个维度信息所对应的维度数值。进一步地,在所述得到待排序的目标数据资源以及各目标数据资源对应的维度信息之后,所述方法还包括:根据各目标数据资源的名称、描述、全文以及标签,检索得到与各目标数据资源相关的其它数据资源以及所述其它数据资源对应的维度信息;对所述其它数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值;根据所述其它数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到所述其它数据资源的平均值,并根据所述平均值对相应的其它数据资源进行排序。第二方面,本专利技术实施例提供一种获取数据资源的装置,所述装置包括:获取单元,用于获取关键词和检索标签;检索单元,用于根据所述关键词和检索标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息;预处理单元,用于对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值;排序单元,用于根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到每个目标数据资源的平均值,并根据所述平均值对相应的目标数据资源进行排序。第三方面,本专利技术实施例提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上所述的获取数据资源的方法。第四方面,本专利技术实施例提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行如上所述的获取数据资源的方法。通过上述技术方案,获取到关键词和检索标签之后,根据所述关键词和检测标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息,在对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理后,得到该维度信息对应的维度数值,然后根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到每个目标数据资源的平均值,并根据所述平均值对相应的目标数据资源进行排序。本专利技术实施例提供了针对于数据资源管理系统中的检索方式,利用多维度信息推荐的排序方式,提高用户获取目标数据资源的效率。本专利技术实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术实施例,但并不构成对本专利技术实施例的限制。在附图中:图1是本专利技术实施例提供的字段表的示例;图2是本专利技术实施例提供的数据资源管理系统的示例;图3是本专利技术实施例提供的一种获取数据资源的方法的流程示意图;图4是本专利技术实施例提供的利用elasticsearch数据库以及检索标签得到数据资源的代码示例;图5是本专利技术实施例提供的利用elasticsearch数据库检索得到目标数据资源的代码示例;图6是本专利技术实施例提供的一种获取数据资源的装置的结构示意图。具体实施方式以下结合附图对本专利技术实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本专利技术实施例,并不用于限制本专利技术实施例。本申请中涉及的术语解释:数据资源管理系统是一种收集、存储、展示、关联、推荐数据资源本文档来自技高网...

【技术保护点】
1.一种获取数据资源的方法,其特征在于,所述方法包括:/n获取关键词和检索标签;/n根据所述关键词和检索标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息;/n对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值;/n根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到每个目标数据资源的平均值,并根据所述平均值对相应的目标数据资源进行排序。/n

【技术特征摘要】
1.一种获取数据资源的方法,其特征在于,所述方法包括:
获取关键词和检索标签;
根据所述关键词和检索标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息;
对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值;
根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均,得到每个目标数据资源的平均值,并根据所述平均值对相应的目标数据资源进行排序。


2.根据权利要求1所述的方法,其特征在于,所述数据资源管理系统中包括多个数据资源、以及每个数据资源所对应的名称、描述和标签;
并且,所述根据所述关键词和检索标签在数据资源管理系统中进行检索,得到待排序的目标数据资源以及各目标数据资源对应的维度信息包括:
将所述数据资源管理系统中数据资源的名称和/或描述与所述关键词匹配、且标签与所述检索标签匹配的数据资源,确定为所述待排序的目标数据资源;
所述维度信息中包括名称相关性和描述相关性,通过下述方式确定所述目标数据资源的所述名称相关性以及描述相关性所对应的维度数值:
将所述目标数据资源的名称和描述与所述关键词进行匹配,分别得到所述目标数据资源的名称相似值和描述相似值。


3.根据权利要求2所述的方法,其特征在于,在所述根据所述目标数据资源各维度信息所对应的维度数值和各维度信息所对应的预设权重进行加权平均时,其中所述维度信息所对应的维度数值包括所述名称相关性所对应的所述名称相似值以及所述描述相关性所对应的描述相似值,或所述名称相关性和描述相关性所对应的综合相似值,其中所述综合相似值由所述名称相似值和所述描述相似值得到。


4.根据权利要求2所述的方法,其特征在于,所述维度信息还包括数据质量、最近更新时间、点击数、收藏数、评论数、评论情感、版本迭代频率或关联关系总数量中的至少一个,其中所述关联关系总数量为数据资源与其它数据资源关联的次数。


5.根据权利要求1所述的方法,其特征在于,所述对所述目标数据资源对应的维度信息中非数值化的维度信息进行预处理,得到该维度信息对应的维度数值包括:
当所述维度信息中包括数据质量时,根据所述目标数据资源的数据质量对应的文字标签以及预设文字与数值的对应关系,将所述目标数据资源的数据质量对应的文字标签转换为质量数值,所述数据质量表示数...

【专利技术属性】
技术研发人员:张力
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1