【技术实现步骤摘要】
数据检索方法、装置、设备及存储介质
[0001]本申请实施例涉及数据分析
,尤其涉及一种数据检索方法、装置、设备及存储介质。
技术介绍
[0002]现有的企业自行建立的搜索引擎大多是使用传统的检索方法构建,功能代码集成于企业业务系统本身,且索引文件的数据来源通常也局限于业务系统内的数据,并通过构建专属业务词库,分配相关域的计算权重,来调节搜索结果的命中排序,当需要搜索的数据不仅限于本业务系统,而是包含外源性数据在内的多元化数据时,难以保证检索结果满足用户期望。
技术实现思路
[0003]本申请实施例提供了一种数据检索方法、装置、设备及存储介质,以解决现有技术中搜索引擎在搜索多元化数据时,搜索结果无法满足用户期望的问题。
[0004]第一方面,本申请实施例提供了一种数据检索方法,该数据检索方法包括:
[0005]响应于获取到的检索请求,确定对应目标检索词和请求对象;
[0006]基于请求对象对应的对象检索词库和预先构建的业务系统检索词库,分别对目标检索词进行分词处理,请求对象对应的对象检索词库基于请求对象的检索历史构建,业务系统检索词库基于本地业务系统中的数据和外源数据库中的数据构建;
[0007]基于业务系统检索词库对应的分词处理结果和预先设置的优先级标签,建立对应的检索索引;
[0008]基于请求对象对应的业务系统、基于对象检索词库得到的分词结果和检索索引,得到检索结果。
[0009]可选地,业务系统检索词库通过如下方式得到:获取本地业务系统数据 ...
【技术保护点】
【技术特征摘要】
1.一种数据检索方法,其特征在于,所述数据检索方法包括:响应于获取到的检索请求,确定对应目标检索词和请求对象;基于所述请求对象对应的对象检索词库和预先构建的业务系统检索词库,分别对所述目标检索词进行分词处理,所述请求对象对应的对象检索词库基于请求对象的检索历史构建,所述业务系统检索词库基于本地业务系统中的数据和外源数据库中的数据构建;基于业务系统检索词库对应的分词处理结果和预先设置的优先级标签,建立对应的检索索引;基于所述请求对象对应的业务系统、基于对象检索词库得到的分词结果和所述检索索引,得到检索结果。2.根据权利要求1所述的数据检索方法,其特征在于,所述业务系统检索词库通过如下方式得到:获取本地业务系统数据和采集的外源数据库中的外源性数据;基于所述本地业务系统数据和外源性数据中的结构化数据,得到对应的结构化数据副本;基于所述本地业务系统数据和外源性数据中的非结构化数据,得到对应的实体图谱,所述实体图谱用于表示本地业务系统数据与外源性数据间的关联关系;基于所述本地业务系统数据和外源性数据的具体来源,对所述结构化数据和非结构化数据分别添加对应的来源标签;基于非结构化数据的文件格式,对所述非结构化数据添加格式标签,并基于所述结构化数据副本、实体图谱、来源标签和格式标签,得到所述业务系统检索词库。3.根据权利要求2所述的数据检索方法,其特征在于,所述基于所述本地业务系统数据和外源性数据中的结构化数据,得到对应的结构化数据副本,包括:建立所述结构化数据与所述本地业务系统数据对应的数据库的主键关联;基于所述主键关联,对所述外源性数据进行整合;将所述整合结果和基于主键关联的本地业务系统数据结合,生成所述结构化数据副本。4.根据权利要求2所述的数据检索方法,其特征在于,所述基于所述本地业务系统数据和外源性数据中的非结构化数据,得到对应的实体图谱,包括:提取所述非结构化数据的目标信息,所述目标信息包括实体、实体属性和分类标签;基于所述目标信息,通过相关性分析,得到所述非结构化数据间的匹配度;抽取所述目标信息中的实体对应词条,并在所述词条上标注所述匹配度;基于所述匹配度,建立所述目标信息中的实体对应的图数据库,并生成所述实体图谱。5.根据权利要求4所述的数据检索方法,其特征在于,所述基于所述本地业务系统数据和外源性数据的具体来源,对所述结构化数据和非结构化数据分别添加对应的来源标签,包括:在所述结构化数据副本中添加所述结构化数据对应的来源性标注;在同一结构化数据副本中的子数据中,根据数据来源设置对应的优先级标签;在所述非结构化数据的图数据库中,添加每个实体对应的来源标签。6.根据权利要求2至5中任一项所述的数据检索方法,其特征在于,所述外源性数据通
过如下方式采集得到:若所述外源性数据为结构化数据,实时监听所述外源性数据对应外源业务系统的外源数据库的数据变化;根据数据变化对应的数据内容的类型,采集外源性数据中的结构化数据;若所述外源性数据为非结构化数据,获取所述外源业务系统的推送请求;基于所述推送请求,获取所述外源业务系统对应的外源性数据。7.根据权利要求6所述的数据检索方法,其特征在于,所述根据数据变化对应的数据内容的类型,采集外源性数据中的结构化数据,包括:若所述数据内容为单表数据变化,向外源业务系统发送拉取任务,以提取数据信息的单表;若所述数据内容为持续增量变更信息,向外源业务系统发送订阅任务,以通过订阅增量持续获取实时的增量变更信息;若所述数据内容为未采集过的存量数据,...
【专利技术属性】
技术研发人员:张岱彬,尹泓钦,王豪,李若,刘伦,陈力,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。