索引方法、装置、计算机设备、存储介质和程序产品制造方法及图纸

技术编号:39138437 阅读:6 留言:0更新日期:2023-10-23 14:53
本申请涉及大数据技术领域,特别是涉及一种索引方法、装置、计算机设备、存储介质和程序产品。所述方法包括:分别获取多个分支索引库的字段信息;根据各所述分支索引库对应的所述字段信息,将多个所述分支索引库映射成一个综合索引库;获取初始索引词,并对所述初始索引词进行查询理解Query Understanding,以获取实际索引词;根据所述实际索引词和所述综合索引库,确定索引结果。采用上述索引方法,能够提高索引结果的准确性。高索引结果的准确性。高索引结果的准确性。

【技术实现步骤摘要】
索引方法、装置、计算机设备、存储介质和程序产品


[0001]本申请涉及大数据
,特别是涉及一种索引方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]随着大数据技术的发展,索引成为日常工作、生活中极为常用的一项技术但传统的索引技术中,存在索引结果的准确性偏低的不足。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够提高索引结果的准确性的索引方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0004]第一方面,本申请提供了一种索引方法,索引方法包括:
[0005]分别获取多个分支索引库的字段信息;
[0006]根据各分支索引库对应的字段信息,将多个分支索引库映射成一个综合索引库;
[0007]获取初始索引词,并对初始索引词进行查询理解Query Understanding,以获取实际索引词;
[0008]根据实际索引词和综合索引库,确定索引结果。
[0009]在其中一个实施例中,字段信息至少包括字段名称和字段类型;根据各分支索引库对应的字段信息,将多个分支索引库映射成一个综合索引库,包括:
[0010]对各分支索引库的字段求并集,将并集结果保存至综合索引库,以将多个分支索引库映射成一个综合索引库,求并集过程中所涉的相同的字段是指字段名称和字段类型均相同的字段。
[0011]在其中一个实施例中,字段信息还包括字段长度;综合索引库中的各字段的字段长度,不小于各分支索引库中对应的字段的字段长度。
[0012]在其中一个实施例中,获取初始索引词之前,还包括:
[0013]增加源字段至综合索引库,源字段用于标识源自于各分支索引库。
[0014]在其中一个实施例中,对初始索引词进行查询理解Query Understanding,以获取实际索引词,包括:
[0015]根据索引所处业务场景、业务所属领域的领域词汇、历史索引数据中的至少一个,对初始索引词进行Query Understanding,以获取实际索引词。
[0016]在其中一个实施例中,根据实际索引词和综合索引库,确定索引结果,包括:
[0017]根据实际索引词和综合索引库,确定按照相关度排序的初始索引结果;
[0018]根据索引所处业务场景、历史索引数据中的至少一个,对初始索引结果进行排序,以确定实际索引结果。
[0019]第二方面,本申请还提供了一种索引装置,索引装置包括:
[0020]字段获取模块,用于分别获取多个分支索引库的字段信息;
[0021]索引库映射模块,用于根据各分支索引库对应的字段信息,将多个分支索引库映射成一个综合索引库;
[0022]索引词理解模块,用于获取初始索引词,并对初始索引词进行查询理解Query Understanding,以获取实际索引词;
[0023]结果确定模块,用于根据实际索引词和综合索引库,确定索引结果。
[0024]第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的方法的步骤。
[0025]第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的方法的步骤。
[0026]第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
[0027]上述索引方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,分别获取多个分支索引库的字段信息,并根据各分支索引库对应的字段信息,将多个分支索引库映射成一个综合索引库。综合索引库中包含了各分支索引库的所有字段及信息,使用户能基于一个综合索引库进行索引,并基于同一排序标准获取索引结果,有利于提高索引结果的准确性,避免了用户基于多个分支索引库进行索引时,各分支索引库的排序标准不一致且缺少可比性,进而导致获取的索引结果准确性偏低的情形。进一步地,获取用户的初始索引词,并对初始索引词进行Query Understanding,即对初始索引词进行预处理、分词、改写、权重分析、意图识别等,以获取实际索引词,此过程有利于精准获取用户的索引意图,进而提高索引结果的准确性,避免用户的初始索引词描述不准确、描述错误时,导致获取的索引结果并不符合索引意图的情形。再进一步地,基于综合索引库,以Query Understanding后所获取的实际索引词进行索引,能够确定符合用户索引意图的索引结果,提高了索引结果的准确性。
附图说明
[0028]图1为一个实施例中索引方法的流程示意图之一;
[0029]图2为一个实施例中索引方法的流程示意图之二;
[0030]图3为一个实施例中根据实际索引词和综合索引库,确定索引结果的流程示意图;
[0031]图4为一个实施例中索引方法的流程示意图之三;
[0032]图5为一个实施例中索引装置的结构框图;
[0033]图6为一个实施例中计算机设备的内部结构图。
具体实施方式
[0034]为了便于理解本申请实施例,下面将参照相关附图对本申请实施例进行更全面的描述。附图中给出了本申请实施例的首选实施例。但是,本申请实施例可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本申请实施例的公开内容更加透彻全面。
[0035]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请实施例的
的技术人员通常理解的含义相同。本文中在本申请实施例的说明书中所使用的术语只
是为了描述具体的实施例的目的,不是旨在于限制本申请实施例。
[0036]在使用时,单数形式的“一”、“一个”和“所述/该”也可以包括复数形式,除非上下文清楚指出另外的方式。还应当理解的是,术语“包括/包含”指定所陈述的特征、整体、步骤、操作、部分或它们的组合的存在,但是不排除存在或添加一个或更多个其他特征、整体、步骤、操作、部分或它们的组合的可能性。同时,在本说明书中使用的术语“和/或”包括相关所列项目的任何及所有组合。
[0037]如图1所示,本申请实施例提供一种索引方法,以解决传统索引技术所存在的,索引结果的准确性偏低的技术问题。本申请实施例以索引方法应用于手机银行应用程序APP为例予以论述,但需要强调的是,本索引方法不局限应用于手机银行APP,还可应用于其他能够进行数据索引的应用环境中。索引方法包括以下步骤110至步骤140。
[0038]步骤110,分别获取多个分支索引库的字段信息。其中,如在手机银行APP中,分支索引库包括功能索引库、产品索引库、生活缴费索引库、活动索引库等。具体地,利用自然语言理解、大数据等技术,对多个分支索引库的映射和字段进行细致分析,并分别获取多个分支索引库的字段信息。
[0039]步骤120,根据各分支索引库对应的字段信息,将多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种索引方法,其特征在于,所述方法包括:分别获取多个分支索引库的字段信息;根据各所述分支索引库对应的所述字段信息,将多个所述分支索引库映射成一个综合索引库;获取初始索引词,并对所述初始索引词进行查询理解Query Understanding,以获取实际索引词;根据所述实际索引词和所述综合索引库,确定索引结果。2.根据权利要求1所述的方法,其特征在于,所述字段信息至少包括字段名称和字段类型;所述根据各所述分支索引库对应的所述字段信息,将多个所述分支索引库映射成一个综合索引库,包括:对各所述分支索引库的字段求并集,将并集结果保存至所述综合索引库,以将多个所述分支索引库映射成一个综合索引库,所述求并集过程中所涉的相同的所述字段是指所述字段名称和所述字段类型均相同的所述字段。3.根据权利要求2所述的方法,其特征在于,所述字段信息还包括字段长度;所述综合索引库中的各所述字段的所述字段长度,不小于各所述分支索引库中对应的所述字段的所述字段长度。4.根据权利要求2所述的方法,其特征在于,所述获取初始索引词之前,还包括:增加源字段至所述综合索引库,所述源字段用于标识源自于各所述分支索引库。5.根据权利要求1所述的方法,其特征在于,所述对所述初始索引词进行查询理解Query Understanding,以获取实际索引词,包括:根据索引所处业务场景、业务所属领域的领域词汇、历史索引数据中的至...

【专利技术属性】
技术研发人员:张鹏举
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1