【技术实现步骤摘要】
元数据搜索方法、装置、设备及计算机可读存储介质
本专利技术涉及金融科技(Fintech)
,尤其涉及一种元数据搜索方法、装置、设备及计算机可读存储介质。
技术介绍
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。随着金融科技(Fintech),尤其是互联网科技金融的不断发展,企业业务不断增长,业务的元数据的数据量也在不断地膨胀。目前,主要是通过数据的Like操作符(用于在WHERE子句中搜索列中的指定模式)或ElasticSearch(搜索服务器)对元数据进行搜索。在通过Like操作符做输入数据的模糊搜索,由于其只是单纯对输入数据的前后数据的模糊匹配,无法满足分词搜索的要求,也无法做更加精准的匹配;在使用ElasticSearch进行元数据的搜索时,由于通常采用单一的查询方式进行搜索查询,准确度较差,输出的搜索结果的前排也不一定会出现需要搜索的目标文档。因此,现有的元数据搜索方法的准确 ...
【技术保护点】
1.一种元数据搜索方法,其特征在于,所述元数据搜索方法包括:在接收到元数据搜索指令时,获取所述元数据搜索指令中携带的第一目标搜索词;基于所述第一目标搜索词和第一预设查询方式搜索预先建立的元数据资源的索引文件,得到第一搜索结果;对所述第一目标搜索词进行分词处理,得到第二目标搜索词,并基于所述第二目标搜索词和第二预设查询方式搜索所述元数据资源的索引文件,得到第二搜索结果;计算所述第一搜索结果和所述第二搜索结果中所搜索到的各文档的排序评分,并根据所述排序评分对所搜索到的各文档进行排序显示。
【技术特征摘要】
1.一种元数据搜索方法,其特征在于,所述元数据搜索方法包括:在接收到元数据搜索指令时,获取所述元数据搜索指令中携带的第一目标搜索词;基于所述第一目标搜索词和第一预设查询方式搜索预先建立的元数据资源的索引文件,得到第一搜索结果;对所述第一目标搜索词进行分词处理,得到第二目标搜索词,并基于所述第二目标搜索词和第二预设查询方式搜索所述元数据资源的索引文件,得到第二搜索结果;计算所述第一搜索结果和所述第二搜索结果中所搜索到的各文档的排序评分,并根据所述排序评分对所搜索到的各文档进行排序显示。2.如权利要求1所述的元数据搜索方法,其特征在于,所述计算所述第一搜索结果和所述第二搜索结果中所搜索到的各文档的排序评分,并根据所述排序评分对所搜索到的各文档进行排序显示的步骤包括:获取所述第一搜索结果和所述第二搜索结果中所搜索到的文档及各文档中所搜索到的目标搜索词,并将所述第一搜索结果和所述第二搜索结果中所搜索到的文档记作搜索结果文档,将所述各文档中所搜索到的目标搜索词记作搜索结果词;基于所述搜索结果词和预设计算规则计算各搜索结果文档的词汇评分,并计算查询归一因子和协调因子;对所述词汇评分、所述查询归一因子和所述协调因子进行相乘处理,得到各搜索结果文档的排序评分;根据所述排序评分的大小按从大到小的顺序对各搜索结果文档进行排序显示。3.如权利要求2所述的元数据搜索方法,其特征在于,所述基于所述搜索结果词和预设计算规则计算各搜索结果文档的词汇评分,并计算查询归一因子和协调因子的步骤包括:获取各搜索结果文档所属种类对应的第一预设权重、各搜索结果文档对应的第二预设权重及各搜索结果词所对应的查询方式对应的第三预设权重,根据所述第一预设权重、所述第二预设权重和所述第三预设权重计算得到各搜索结果词的权重;获取各搜索结果词的词频、逆向文件频率和字段归一值,基于所述词频、所述逆向文件频率、所述字段归一值和所述各搜索结果词的权重,按第一预设计算公式计算得到所述搜索结果文档的词汇评分;根据所述逆向文件频率和第二预设计算公式计算得到查询归一因子;获取所述搜索结果词的数量,并获取所述第一目标搜索词的数量及所述第二目标搜索词的数量,基于所述搜索结果词的数量、所述第一目标搜索词的数量、所述第二目标搜索词和第三预设计算公式的数量计算得到协调因子。4.如权利要求3所述的元数据搜索方法,其特征在于,所述第一预设计算公式为:vi=∑(TFij·IDFij·wij·aij)所述第二预设计算公式为:所述第三预设计算公式为:fi2=ni/(n1+n2)其中,vi为搜索结果文档i的排序评分,TFij为搜索结果文档i中搜索结果词j的词频,IDFij为搜索结果文档i中搜索结果词j的逆...
【专利技术属性】
技术研发人员:陈文浩,兰冲,张志杰,周可,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。