一种信息查询方法和装置制造方法及图纸

技术编号:34012640 阅读:16 留言:0更新日期:2022-07-02 14:58
本发明专利技术实施例提供了一种信息查询方法和装置。该方法包括:接收终端设备发送的查询请求;根据至少一个目标字典树,确定待查询文本中与查询请求对应的参考简称以及参考简称对应的参考全称;获取待查询文本中包括参考简称的第一文本段;将第一文本段和参考全称输入至预设神经网络模型中,获得预设神经网络模型的输出结果;根据输出结果,生成对应查询请求的处理结果,并将处理结果发送至终端设备。本发明专利技术实施例提供的技术方案,可以提高信息查询效率以及信息查询的准确性。率以及信息查询的准确性。率以及信息查询的准确性。

【技术实现步骤摘要】
一种信息查询方法和装置


[0001]本专利技术涉及数据处理
,特别是涉及一种信息查询方法和装置。

技术介绍

[0002]随着大数据时代的来临,人们面临和需要处理的信息越来越多,在海量信息中高效且准确地获取所需信息,已成为人们的迫切需求。其中,有些情况下,相同意义的信息,可能会以全称或简称的方式出现在文本中,因此,在进行信息查询时,还要考虑到简称的查询。
[0003]现有技术中,在对文本中的简称进行查询时,一般可以采用规则提取、相关性计算或序列标注等方法。其中,规则提取方法是通过设置不同的规则来查询对应的简称,但是这种方法难以穷举出所有简称,查询效果差,且规则提取方法只是将符合规则的简称都查询出来,无法判断查询出的简称是否为用户需求的简称,因此查询正确率较为低下。而对于相关性计算方法和序列标注方法,在查询过程中,则存在计算量大,查询时间长,查询效率低的问题。
[0004]总之,现有技术中的信息查询方法,存在信息查询效率较低且正确率较低的问题。

技术实现思路

[0005]本专利技术实施例提供一种信息查询方法和装置,以解决现有技术中,信息查询效率较低且正确率较低的问题。
[0006]第一方面,本专利技术实施例公开了一种信息查询方法,所述方法包括:
[0007]接收终端设备发送的查询请求;
[0008]根据至少一个目标字典树,确定待查询文本中与所述查询请求对应的参考简称以及所述参考简称对应的参考全称;其中,每一所述目标字典树中包括:一个全称对应的至少一个简称,每一所述目标字典树与包括的简称对应的全称之间建立有关联关系;其中,所述目标字典树为根据所述查询请求确定的;
[0009]获取所述待查询文本中包括所述参考简称的第一文本段;
[0010]将所述第一文本段和所述参考全称输入至预设神经网络模型中,获得所述预设神经网络模型的输出结果;其中,所述输出结果至少包括:所述第一文本段中的参考简称为对应的参考全称的简称的概率值,以及所述参考简称在所述第一文本段中的位置信息;
[0011]根据所述输出结果,生成对应所述查询请求的处理结果,并将所述处理结果发送至所述终端设备。
[0012]第二方面,本专利技术实施例公开了一种信息查询装置,所述信息查询装置包括:
[0013]接收模块,用于接收终端设备发送的查询请求;
[0014]第一确定模块,用于根据至少一个目标字典树,确定待查询文本中与所述查询请求对应的参考简称以及所述参考简称对应的参考全称;其中,每一所述目标字典树中包括:一个全称对应的至少一个简称,每一所述目标字典树与包括的简称对应的全称之间建立有
关联关系;其中,所述目标字典树为根据所述查询请求确定的;
[0015]第一获取模块,用于获取所述待查询文本中包括所述参考简称的第一文本段;
[0016]第二获取模块,用于将所述第一文本段和所述参考全称输入至预设神经网络模型中,获得所述预设神经网络模型的输出结果;其中,所述输出结果至少包括:所述第一文本段中的参考简称为对应的参考全称的简称的概率值,以及所述参考简称在所述第一文本段中的位置信息;
[0017]第一生成模块,用于根据所述输出结果,生成对应所述查询请求的处理结果,并将所述处理结果发送至所述终端设备。
[0018]第三方面,本专利技术实施例公开了一种电子设备,包括存储器和处理器,所述存储器存储可在处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上述的信息查询方法。
[0019]第四方面,本专利技术实施例公开了一种计算机可读存储介质,所述计算机可读存储介质存储有实现如上述的信息查询方法的计算机程序。
[0020]本专利技术实施例中,服务器可以根据至少一个目标字典树,在待查询文本中初步查询与查询请求对应的简称信息和全称信息。其中,每一个目标字典树由一个全称的至少一个简称信息构成,由于目标字典树可以利用公共前缀来减少查询时间,最大限度地减少无谓字符串的比较,因此可以快速的进行信息查询,提高查询效率。在完成初步查询后,服务器还可以通过预设神经网络模型,确定文本段中的简称为对应的参考全称的简称的概率值,依据该概率值可以对文本段中的简称进行进一步的筛选,同时还可以提高信息查询的准确性。
附图说明
[0021]图1是本专利技术的一种信息查询方法实施例的步骤流程图;
[0022]图2为本专利技术的一种字典树的结构示意图;
[0023]图3是本专利技术的一种信息查询装置实施例的结构框图。
具体实施方式
[0024]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0025]参照图1,示出了本专利技术实施例提供的一种信息查询方法的步骤流程图,该信息查询方法可以应用于服务器,其具体可以包括如下步骤:
[0026]步骤101:接收终端设备发送的查询请求。
[0027]本专利技术实施例中,服务器可以接收终端设备发送的查询请求,并依据该查询请求,确定用户所要查询的信息。
[0028]步骤102:根据至少一个目标字典树,确定待查询文本中与查询请求对应的参考简称以及参考简称对应的参考全称。
[0029]本专利技术实施例中,服务器在根据查询请求确定用户所要查询的信息后,则可以根据目标字典树,在待查询文本中查询相应的信息,即与查询请求对应的参考简称,以及参考简称对应的参考全称。其中,与查询请求对应的参考简称为目标字典树中包括的简称,参考
简称对应的参考全称为与目标字典树建立有关联关系的全称。
[0030]其中,服务器中存储有至少一个预设字典树,目标字典树为根据查询请求在所述至少一个预设字典树中确定的。
[0031]其中,每一个预设字典树中包括一个全称对应的至少一个简称,每一个预设字典树与包括的简称对应的全称之间建立有关联关系。这里所述的简称可以是中文简称,也可以是英文简称。例如,全称为:应用程序,其简称可以是:应用,也可以是:App。
[0032]其中,每一个预设字典树包括根节点和子节点,每个子节点可以包含至少一个字符,在简称为中文简称的情况下,每个子节点可以包含至少一个汉字。根节点到任一具有结束属性的子节点形成的节点路径上所包含的所有字符,即构成一个简称。其中,具有结束属性的子节点中包含一个简称的最后一个字符;在简称为中文简称的情况下,具有结束属性的子节点中包含一个简称的最后一个汉字。
[0033]本专利技术实施例中,针对每一预设字典树预先构建了失败指针(即fail指针),因此,服务器可以根据至少一个目标字典树和预先构建的失败指针,对待查询文本进行逐字遍历查询,判断待查询文本中是否包括目标字典树中的简称,从而通过目标字典树在待查询文本中查询用户所要查询的信息。
[0034]在确定待查询文本中包括目标字典树中的简称后,则可以根据该目标字典树与全称之间的关联关系,将该目标字典树对应的全称确定为待查询文本中的简称对应的参考全称。例如,待查询文本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息查询方法,应用于服务器,其特征在于,所述方法包括:接收终端设备发送的查询请求;根据至少一个目标字典树,确定待查询文本中与所述查询请求对应的参考简称以及所述参考简称对应的参考全称;其中,每一所述目标字典树中包括:一个全称对应的至少一个简称,每一所述目标字典树与包括的简称对应的全称之间建立有关联关系;其中,所述目标字典树为根据所述查询请求确定的;获取所述待查询文本中包括所述参考简称的第一文本段;将所述第一文本段和所述参考全称输入至预设神经网络模型中,获得所述预设神经网络模型的输出结果;其中,所述输出结果至少包括:所述第一文本段中的参考简称为对应的参考全称的简称的概率值,以及所述参考简称在所述第一文本段中的位置信息;根据所述输出结果,生成对应所述查询请求的处理结果,并将所述处理结果发送至所述终端设备。2.根据权利要求1所述的信息查询方法,其特征在于,在所述接收终端设备发送的查询请求之前,所述方法还包括:根据预设全称,生成所述预设全称对应的简称;根据所述预设全称对应的简称,生成目标字典树;其中,所述目标字典树包括根节点和子节点,每一所述子节点中包含至少一个字符,所述根节点到任一具有结束属性的子节点形成的节点路径上的字符构成一个简称。3.根据权利要求1所述的信息查询方法,其特征在于,所述获取所述待查询文本中包括所述参考简称的第一文本段,包括:获取所述待查询文本中包括所述参考简称的第三文本段;对所述第三文本段中的简称进行初步校验,去除所述第三文本段中部分参考简称不为对应的参考全称的简称的文本段,获得所述第一文本段。4.根据权利要求1所述的信息查询方法,其特征在于,所述待查询文本为所述服务器中存储的至少一个文本或用户输入的文本;在所述待查询文本为所述服务器中存储的至少一个文本的情况下,所述处理结果为:所述待查询文本中包括第二文本段的目标文本,以及所述参考简称在所述第二文本段中的位置信息;其中,所述第二文本段为所述第一文本段中参考简称为对应的参考全称的简称的概率值大于或等于预设概率值的文本段;在所述待查询文本为所述用户输入的文本的情况下,所述处理结果为:所述第一文本段中参考简称为对应的参考全称的简称的概率值大于或等于所述预设概率值的目标简称,以及所述目标简称在所述第一文本段中的位置信息。5.根据权利要求4所述的信息查询方法,其特征在于,在所述待查询文本为所述服务器中存储的至少一个文本的情况下,在所述根据至少一个目标字典树,确定...

【专利技术属性】
技术研发人员:杨春阳李健陈明武卫东
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1