信息检索方法、介质、设备及装置制造方法及图纸

技术编号:37576565 阅读:13 留言:0更新日期:2023-05-15 07:52
本发明专利技术公开了一种信息检索方法、介质、设备及装置,其中方法包括:获取待检索语料,并将所述待检索语料输入到意图分类模型中,以通过所述意图分类模型输出所述待检索语料对应的意图分类;将所述待检索语料输入到命名实体识别模型中,以通过所述命名实体识别模型抽取所述待检索语料对应的实体信息;根据所述意图分类和所述实体信息查询知识图谱,以得到相应的第一查询结果;能够有效提高数据检索的效率,降低查询所需耗时;同时,节约数据检索过程所需耗费的算力资源。需耗费的算力资源。需耗费的算力资源。

【技术实现步骤摘要】
信息检索方法、介质、设备及装置


[0001]本申请涉及数据检索领域,具体涉及一种信息检索方法、介质、设备及装置。

技术介绍

[0002]数据检索,在很多功能中都得到了应用。例如,在企业数据问答搜索功能的实现中。
[0003]相关技术中,企业数据问答搜索功能的实现,多只是简单地将待检索信息输入到预先训练好的模型中,以通过一个检索模型对待检索信息进行检索。这种方式下,数据检索的效率低下,查询速度较慢;且检索缺乏目的性,导致算力资源的浪费。

技术实现思路

[0004]鉴于上述问题,本申请提供了一种信息检索方法,能够有效提高数据检索的效率,降低查询所需耗时;同时,节约数据检索过程所需耗费的算力资源。
[0005]为实现上述目的,专利技术人提供了一种信息检索方法,包括:获取待检索语料,并将所述待检索语料输入到意图分类模型中,以通过所述意图分类模型输出所述待检索语料对应的意图分类;将所述待检索语料输入到命名实体识别模型中,以通过所述命名实体识别模型抽取所述待检索语料对应的实体信息;根据所述意图分类和所述实体信息查询知识图谱,以得到相应的第一查询结果。
[0006]区别于现有技术,上述技术方案在获取到待检索语料之后,首先,将待检索语料输入到意图分类模型中,以得到待检索语料所对应的意图分类;进一步地,根据意图分类和实体信息查询知识图谱,以确定第一查询结果,能够极大地提高检索效率,降低查询耗时。
[0007]在一些实施例中,在通过所述命名实体识别模型抽取所述待检索语料对应的实体信息之后,还包括:基于图数据库中文本的相似度匹配和实体的属性一致性对所述实体信息进行实体消歧。
[0008]在一些实施例中,该检索方法还包括:判断所述第一查询结果是否为空;在所述第一查询结果为空时,根据所述实体信息查询所述知识图谱,以得到相应的第二查询结果。
[0009]在一些实施例中,根据所述意图分类和所述实体信息查询知识图谱,以得到相应的第一查询结果,包括:根据所述意图分类获取相应类别的查询语句;基于所述查询语句和所述实体信息对所述知识图谱进行查询,以获取所述实体信息的相关信息,并将所述相关信息作为第一查询结果。
[0010]在一些实施例中,在所述第一查询结果不为空时,将所述第一查询结果转换为文本格式。
[0011]在一些实施例中,该检索方法还包括:将所述文本格式的第一查询结果和所述待检索语料输入到预先训练好的改造模型中,以通过所述改造模型对所述文本格式的第一查询结果和所述待检索语料进行信息抽取,得到最终检索结果。
[0012]为了达到上述目的,本专利技术第二方面实施例提出了一种计算机可读存储介质,其
上存储有信息检索程序,该信息检索程序被处理器执行时实现如上所述的信息检索方法。
[0013]为了达到上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上所述的信息检索方法。
[0014]为了达到上述目的,本专利技术第四方面实施例提出了一种信息检索装置,包括:意图分类模块,所述意图分类模块用于获取待检索语料,并将所述待检索语料输入到意图分类模型中,以通过所述意图分类模型输出所述待检索语料对应的意图分类;命名实体识别模块,所述命名实体识别模块用于将所述待检索语料输入到命名实体识别模型中,以通过所述命名实体识别模型抽取所述待检索语料对应的实体信息;查询模块,所述查询模块用于根据所述意图分类和所述实体信息查询知识图谱,以得到相应的第一查询结果。
[0015]在一些实施例中,在通过所述命名实体识别模型抽取所述待检索语料对应的实体信息之后,还包括:基于图数据库中文本的相似度匹配和实体的属性一致性对所述实体信息进行实体消歧。
[0016]上述
技术实现思路
相关记载仅是本申请技术方案的概述,为了让本领域普通技术人员能够更清楚地了解本申请的技术方案,进而可以依据说明书的文字及附图记载的内容予以实施,并且为了让本申请的上述目的及其它目的、特征和优点能够更易于理解,以下结合本申请的具体实施方式及附图进行说明。
附图说明
[0017]附图仅用于示出本申请具体实施方式以及其他相关内容的原理、实现方式、应用、特点以及效果等,并不能认为是对本申请的限制。
[0018]在说明书附图中:
[0019]图1为根据本专利技术实施例的信息检索方法的流程示意图;
[0020]图2为根据本专利技术实施例的信息检索装置的方框示意图。
具体实施方式
[0021]为详细说明本申请可能的应用场景,技术原理,可实施的具体方案,能实现目的与效果等,以下结合所列举的具体实施例并配合附图详予说明。本文所记载的实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。
[0022]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中各个位置出现的“实施例”一词并不一定指代相同的实施例,亦不特别限定其与其它实施例之间的独立性或关联性。原则上,在本申请中,只要不存在技术矛盾或冲突,各实施例中所提到的各项技术特征均可以以任意方式进行组合,以形成相应的可实施的技术方案。
[0023]除非另有定义,本文所使用的技术术语的含义与本申请所属
的技术人员通常理解的含义相同;本文中对相关术语的使用只是为了描述具体的实施例,而不是旨在限制本申请。
[0024]在本申请的描述中,用语“和/或”是一种用于描述对象之间逻辑关系的表述,表示
可以存在三种关系,例如A和/或B,表示:存在A,存在B,以及同时存在A和B这三种情况。另外,本文中字符“/”一般表示前后关联对象是一种“或”的逻辑关系。
[0025]在本申请中,诸如“第一”和“第二”之类的用语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何实际的数量、主次或顺序等关系。
[0026]在没有更多限制的情况下,在本申请中,语句中所使用的“包括”、“包含”、“具有”或者其他类似的表述,意在涵盖非排他性的包含,这些表述并不排除在包括所述要素的过程、方法或者产品中还可以存在另外的要素,从而使得包括一系列要素的过程、方法或者产品中不仅可以包括那些限定的要素,而且还可以包括没有明确列出的其他要素,或者还包括为这种过程、方法或者产品所固有的要素。
[0027]与《审查指南》中的理解相同,在本申请中,“大于”、“小于”、“超过”等表述理解为不包括本数;“以上”、“以下”、“以内”等表述理解为包括本数。此外,在本申请实施例的描述中“多个”的含义是两个以上(包括两个),与之类似的与“多”相关的表述亦做此类理解,例如“多组”、“多次”等,除非另有明确具体的限定。
[0028]在本申请实施例的描述中,所使用的与空间相关的表述,诸如“中心”“纵向”“横向”“长度”“宽度”“厚度”“上”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息检索方法,其特征在于,包括:获取待检索语料,并将所述待检索语料输入到意图分类模型中,以通过所述意图分类模型输出所述待检索语料对应的意图分类;将所述待检索语料输入到命名实体识别模型中,以通过所述命名实体识别模型抽取所述待检索语料对应的实体信息;根据所述意图分类和所述实体信息查询知识图谱,以得到相应的第一查询结果。2.如权利要求1所述的信息检索方法,其特征在于,在通过所述命名实体识别模型抽取所述待检索语料对应的实体信息之后,还包括:基于图数据库中文本的相似度匹配和实体的属性一致性对所述实体信息进行实体消歧。3.如权利要求1所述的信息检索方法,其特征在于,还包括:判断所述第一查询结果是否为空;在所述第一查询结果为空时,根据所述实体信息查询所述知识图谱,以得到相应的第二查询结果。4.如权利要求1所述的信息检索方法,其特征在于,根据所述意图分类和所述实体信息查询知识图谱,以得到相应的第一查询结果,包括:根据所述意图分类获取相应类别的查询语句;基于所述查询语句和所述实体信息对所述知识图谱进行查询,以获取所述实体信息的相关信息,并将所述相关信息作为第一查询结果。5.如权利要求3所述的信息检索方法,其特征在于,在所述第一查询结果不为空时,将所述第一查询结果转换为文本格式。6.如权利要求5所述的信息检索方法,其特征在于,还包括:将所述文本格式的第一查询...

【专利技术属性】
技术研发人员:罗建新王传熙沈强张怀刚阮义清
申请(专利权)人:福建正孚软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1