数据资产的检索方法、电子设备及计算机可读存储介质技术

技术编号:35577216 阅读:19 留言:0更新日期:2022-11-12 16:02
本申请公开了一种数据资产的检索方法、电子设备及计算机可读存储介质。所述检索方法包括:接收并响应用户的检索指令,确定待检索的数据资产;基于利用极端梯度增强算法模型预设的目标检索参数和所述待检索的数据资产的关键字信息,生成检索语句;其中,所述目标检索参数为对所述待检索的数据资产成为目标数据资产具有预设影响程度的目标资产特征信息;利用所述检索语句对所述待检索的数据资产进行检索,按与所述目标资产特征信息相关的预设顺序输出检索结果。上述方案,能够实现在用户检索时智能排序的效果,辅助用户快速定位目标数据资产,极大程度的提升用户的用数效率。极大程度的提升用户的用数效率。极大程度的提升用户的用数效率。

【技术实现步骤摘要】
数据资产的检索方法、电子设备及计算机可读存储介质


[0001]本申请涉及数据管理
,特别是涉及一种数据资产的检索方法、电子设备及计算机可读存储介质。

技术介绍

[0002]数据是新时代的石油,随着企业数字化转型的铺开,企业对数据依赖持续加强,内部各级人员的数据探索频率也将日渐提升。然而,在茫茫的数据海洋中,如何能够快速的找到自己想要的数据呢?目前业内常规的做法是将数据资产信息存放在例如ElasticSearch(一个基于Lucene的搜索服务器)的分析引擎中,利用引擎自带的检索功能,实现数据资产的检索,同步在展示端增加一些如库名等限定条件辅助用户定位。此做法较线下通过excel数据字典检索查阅的方式,改进效果明显。但随着数据资产的持续叠加,当检索结果大于3页时,也是不利于用户定位数据资产,尤其对数据系统不了解的用户。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种数据资产的检索方法、电子设备及计算机可读存储介质,能够实现在用户检索时智能排序的效果,辅助用户快速定位目标数据资产,提升用户的用数效率。
[0004]为了解决上述问题,本申请第一方面提供了一种数据资产的检索方法,所述检索方法包括:接收并响应用户的检索指令,确定待检索的数据资产;基于利用极端梯度增强算法模型预设的目标检索参数和所述待检索的数据资产的关键字信息,生成检索语句;其中,所述目标检索参数为对所述待检索的数据资产成为目标数据资产具有预设影响程度的目标资产特征信息;利用所述检索语句对所述待检索的数据资产进行检索,按与所述目标资产特征信息相关的预设顺序输出检索结果。
[0005]其中,在所述接收并响应用户的检索指令,确定待检索的数据资产的步骤之前,所述检索方法还包括:基于所述用户的历史检索数据,得到若干个样本数据资产;提取所述用户的基本信息和所述样本数据资产的资产信息,作为所述样本数据资产的资产特征标签;利用具有所述资产特征标签的若干个所述样本数据资产对初始的极端梯度增强算法模型中进行训练,得到训练后的极端梯度增强算法模型。
[0006]其中,在所述利用具有所述资产特征标签的若干个所述样本数据资产对初始的极端梯度增强算法模型中进行训练,得到训练后的极端梯度增强算法模型的步骤之前,包括:根据所述用户与所述样本数据资产的关系生成近度,以及根据与所述用户同组的用户与所述样本数据资产的关系生成相似度,并将所述近度和所述相似度作为所述样本数据资产的资产特征标签。
[0007]其中,所述利用具有所述资产特征标签的若干个所述样本数据资产对初始的极端梯度增强算法模型中进行训练,得到训练后的极端梯度增强算法模型的步骤,包括:将具有所述资产特征标签的若干个所述样本数据资产分成训练样本和测试样本;将所述训练样本
按照正样本和反样本输入到所述初始的极端梯度增强算法模型;其中,所述正样本为具有是目标数据资产的资产特征标签的样本数据资产,所述反样本为具有否目标数据资产的资产特征标签的样本数据资产;将所述资产特征标签中的是否目标数据资产的值为1的标签作为目标变量,将所述资产特征标签中的其他标签作为所有的特征变量,计算所有的特征变量与所述目标变量之间的影响程度大小;根据所述影响程度大小得到对所述目标变量的影响程度排名最高的预设数量个特征变量;根据所述对所述目标变量的重要程度排名最高的预设数量个特征变量,得到待测试的极端梯度增强算法模型;利用所述测试样本对所述待测试的极端梯度增强算法模型进行性能评估,基于性能评估结果得到训练后的极端梯度增强算法模型。
[0008]其中,所述利用所述测试样本对所述待测试的极端梯度增强算法模型进行性能评估,基于性能评估结果得到训练后的极端梯度增强算法模型的步骤,包括:利用测试样本,采用10折交叉验证的方式对所述待测试的极端梯度增强算法模型进行测试,得到所述测试样本对应的测试结果;根据所述测试样本对应的测试结果对所述待测试的极端梯度增强算法模型的参数进行调整,得到所述训练后的极端梯度增强算法模型。
[0009]其中,所述基于利用极端梯度增强算法模型预设的目标检索参数和所述待检索的数据资产的关键字信息,生成检索语句的步骤,包括:利用所述极端梯度增强算法模型,输出所述资产特征信息对所述待检索的数据资产是否是目标数据资产的影响程度权重,基于所述影响程度权重对所述目标检索参数进行预设;所述资产特征信息包括数据资产的资产信息、用户的基本信息以及包含近度和相似度的衍生信息;提取所述待检索的数据资产对应的检索关键字;根据所述检索关键字和所述目标检索参数,生成带有排序条件的检索语句。
[0010]其中,所述利用所述检索语句对所述待检索的数据资产进行检索,按与所述目标资产特征信息相关的预设顺序输出检索结果的步骤,包括:利用所述检索语句获取到与所述待检索的数据资产相关的检索结果;根据所述检索语句中的排序条件,对所述检索结果按所述与所述目标资产特征信息相关的预设顺序进行排列。
[0011]其中,所述与所述目标资产特征信息相关的预设顺序是,按所述检索结果中所具有的目标资产特征信息对所述待检索的数据资产是否是目标数据资产的影响程度大小降序。
[0012]为解决上述问题,本申请第二方面提供了一种电子设备,所述声源方位的定位电子设备包括相互连接的处理器和存储器;所述存储器用于存储程序指令,所述处理器用于执行所述程序指令以实现上述第一方面的数据资产的检索方法。
[0013]为解决上述问题,本申请第三方面提供了一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现上述第一方面的数据资产的检索方法。
[0014]本专利技术的有益效果是:区别于现有技术的情况,本申请通过极端梯度增强算法模型预设目标检索参数,目标检索参数为对待检索的数据资产成为目标数据资产具有预设影响程度的目标资产特征信息,在接收并响应用户的检索指令后可以确定待检索的数据资产,然后基于预设的目标检索参数和待检索的数据资产的关键字信息,生成检索语句,于是可以利用检索语句对待检索的数据资产进行检索,按与目标资产特征信息相关的预设顺序输出检索结果,可以理解的是,极端梯度增强算法模型预设的目标检索参数表明目标资产
特征信息对是否目标数据资产具有一定的影响程度,因此结合目标检索参数和待检索的数据资产的关键字信息来对检索结果进行排序,可以提高首页命中率,辅助用户快速定位目标数据资产,让用户更快速有效的找到待检索的数据资产,极大程序的提升用户用数效率,加速数据价值挖掘进程,从而赋能企业经营决策。
附图说明
[0015]图1是本申请数据资产的检索方法一实施例的流程示意图;
[0016]图2是图1中步骤S12一实施例的流程示意图;
[0017]图3是图1中步骤S13一实施例的流程示意图;
[0018]图4是本申请数据资产的检索方法中关于极端梯度增强算法模型的训练方法一实施例的流程示意图;
[0019]图5是图4中步骤S44一实施例的流程示意图;
[0020]图6是图5中步骤S4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据资产的检索方法,其特征在于,所述检索方法包括:接收并响应用户的检索指令,确定待检索的数据资产;基于利用极端梯度增强算法模型预设的目标检索参数和所述待检索的数据资产的关键字信息,生成检索语句;其中,所述目标检索参数为对所述待检索的数据资产成为目标数据资产具有预设影响程度的目标资产特征信息;利用所述检索语句对所述待检索的数据资产进行检索,按与所述目标资产特征信息相关的预设顺序输出检索结果。2.根据权利要求1所述的数据资产的检索方法,其特征在于,在所述接收并响应用户的检索指令,确定待检索的数据资产的步骤之前,所述检索方法还包括:基于所述用户的历史检索数据,得到若干个样本数据资产;提取所述用户的基本信息和所述样本数据资产的资产信息,作为所述样本数据资产的资产特征标签;利用具有所述资产特征标签的若干个所述样本数据资产对初始的极端梯度增强算法模型中进行训练,得到训练后的极端梯度增强算法模型。3.根据权利要求2所述的数据资产的检索方法,其特征在于,在所述利用具有所述资产特征标签的若干个所述样本数据资产对初始的极端梯度增强算法模型中进行训练,得到训练后的极端梯度增强算法模型的步骤之前,包括:根据所述用户与所述样本数据资产的关系生成近度,以及根据与所述用户同组的用户与所述样本数据资产的关系生成相似度,并将所述近度和所述相似度作为所述样本数据资产的资产特征标签。4.根据权利要求2或3所述的数据资产的检索方法,其特征在于,所述利用具有所述资产特征标签的若干个所述样本数据资产对初始的极端梯度增强算法模型中进行训练,得到训练后的极端梯度增强算法模型的步骤,包括:将具有所述资产特征标签的若干个所述样本数据资产分成训练样本和测试样本;将所述训练样本按照正样本和反样本输入到所述初始的极端梯度增强算法模型;其中,所述正样本为具有是目标数据资产的资产特征标签的样本数据资产,所述反样本为具有否目标数据资产的资产特征标签的样本数据资产;将所述资产特征标签中的是否目标数据资产的值为1的标签作为目标变量,将所述资产特征标签中的其他标签作为所有的特征变量,计算所有的特征变量与所述目标变量之间的影响程度大小;根据所述影响程度大小得到对所述目标变量的影响程度排名最高的预设数量个特征变量;根据所述对所述目标变量的重要程度排名最高的预设数量个特征变量,得到待测试的极端梯度增...

【专利技术属性】
技术研发人员:陈文捷
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1