一种信息搜索方法、装置及存储介质制造方法及图纸

技术编号:36155156 阅读:9 留言:0更新日期:2022-12-31 20:01
一种信息搜索方法、装置及存储介质,涉及数据处理技术领域,解决了无法准确识别用户的搜索意图,导致搜索结果准确率低的问题。该信息搜索方法包括:获取查询文本,并将查询文本输入到实体识别模型,识别查询文本中的每一实体,得到查询文本中的实体以及实体的内容,该实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容;根据得到的实体,确定查询文本的搜索意图;生成与搜索意图对应且包括实体的内容的查询语句;根据查询语句进行信息搜索,得到满足查询语句的信息。得到满足查询语句的信息。得到满足查询语句的信息。

【技术实现步骤摘要】
包括:读取与正则规则匹配的数字格式类型库,确定目标分词属于目标数字格式类型;数字格式类型库包括多种数字格式类型;确定目标分词的内容为具备目标数字格式类型的数字信息,数字信息为数字实体的内容。
[0010]结合第一方面,在另一种可能的设计方式中,上述“根据得到的实体,确定查询文本的搜索意图”包括:统计得到的实体中每一类型的实体的分布,并根据分布确定搜索意图。
[0011]结合第一方面,在另一种可能的设计方式中,上述“根据得到的实体,确定查询文本的搜索意图”包括:将查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和第一搜索意图的置信度;统计得到的实体中每一类型的实体的分布,并根据分布确定第二搜索意图和第二搜索意图的置信度;将第一搜索意图和第二搜索意图中置信度满足预设条件的搜索意图作为搜索意图。
[0012]本申请利用意图识别模型初步确定出第一搜索意图,并根据确定出的每一类型的实体的分布确定出第二搜索意图,即采用两种不同的方式确定出第一搜索意图和第二搜索意图,还分别确定出这两种搜索意图的置信度,后续,根据置信度的数值大小从这两种搜索意图中确定出最终的搜索意图。这样从多个维度的角度出发确定出的搜索意图的准确度更高。
[0013]第二方面,本申请提供一种信息搜索装置。该信息搜索装置包括用于执行第一方面或第一方面中任一种可能的设计方式所述的方法的各个模块。
[0014]第三方面,本申请提供一种信息搜索装置,该信息搜索装置包括存储器和处理器。上述存储器和处理器耦合。该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令。当处理器执行该计算机指令时,信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
[0015]第四方面,本申请提供一种芯片系统,该芯片系统应用于信息搜索装置;所述芯片系统包括一个或多个接口电路,以及一个或多个处理器。所述接口电路和所述处理器通过线路互联;所述接口电路用于从所述信息搜索装置的存储器接收信号,并向所述处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令。当所述处理器执行所述计算机指令时,所述信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
[0016]第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令,当所述计算机指令在信息搜索装置上运行时,使得所述信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
[0017]第六方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令,当所述计算机指令在信息搜索装置上运行时,使得所述信息搜索装置执行如第一方面及其任一种可能的设计方式所述的信息搜索方法。
[0018]本申请中第二方面到第六方面及其各种实现方式的具体描述,可以参考第一方面及其各种实现方式中的详细描述;并且,第二方面到第六方面及其各种实现方式的有益效果,可以参考第一方面及其各种实现方式中的有益效果分析,此处不再赘述。
[0019]本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
[0020]图1为现有技术中计算机设备响应用户输入的文本显示的界面;
[0021]图2为本申请实施例提供的信息搜索系统的结构示意图;
[0022]图3为本申请实施例中服务器的结构示意图一;
[0023]图4为本申请实施例中信息搜索装置的硬件结构示意图;
[0024]图5为本申请实施例提供的信息搜索方法的流程示意图一;
[0025]图6为本申请实施例提供的信息搜索方法的流程示意图二;
[0026]图7A为本申请实施例提供的信息搜索方法的流程示意图三;
[0027]图7B为本申请实施例提供的信息搜索方法的流程示意图四;
[0028]图8为本申请实施例中一种搜索显示界面的示意图;
[0029]图9为本申请实施例中另一种搜索显示界面的示意图;
[0030]图10为本申请实施例中信息搜索装置的一种结构示意图。
具体实施方式
[0031]以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0032]此外,本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
[0033]通常,用户在提交自然语言表述的问题之后,计算机设备会利用各种自然语言处理技术去理解用户的搜索意图,然后根据用户的搜索意图将自然语言表述的文本分析成搜索引擎所需要的查询语句,将查询语句输入搜索引擎,并获取搜索引擎输出的相关信息,以及将相关信息反馈给用户。但是,在搜索语句包括模糊的时空信息/格式类似的数字的场景中,现有技术难以准确地识别用户的搜索意图,导致搜索结果准确率较低,难以满足用户需求。
[0034]例如:如图1中的(A)所示,用户于2021年6月24日在计算机设备显示的搜索框中输入搜索语句“昨天、A路口、女孩”。可以看出,用户的真实搜索意图是想要搜索2021年6月23日出现在A路口的女孩。现有技术中,计算机设备响应于用户点击的搜索操作,会显示如图1中的(B)显示的界面。该界面显示命名/内容包括有“昨天A路口女孩”的相关内容,或者呈现命名/内容包括有“昨天”、“A路口”、“女孩”等关键字的相关内容。可以看出,计算机设备最终呈现给用户的内容并不符合用户的真实需求。
[0035]基于此,本申请实施例提供一种信息搜索方法,利用实体识别模型准确地确定查询文本中的实体(包括预设类型,如时空类型、数字类型,的实体)以及实体的内容,并根据识别出的实体和查询文本确定搜索意图,以及生成与搜索意图对应且包括实体的内容的查询语句进行信息搜索,有效地提高了搜索结果的准确率。
[0036]本申请涉及到的实体是指客观存在并可相互区别的事务,包括具体的人、事、物、
抽象的概念或联系等。实体的类型可以根据事务的类型确定,如时空类型、人物类型、车辆类型等。搜索意图可以表征查询文本对应的用户真实需求。
[0037]本申请实施例提供的信息搜索方法适用于信息搜索系统。图2示出了该信息搜索系统的结构。如图2所示,信息搜索系统包括终端20和服务器21。终端20和服务器21之间通过网络连接进行数据交互。
[0038]可选的,信息搜索系统还可以包括存储设备22,服务器21与存储设备22连接。在实际应用中,服务器21与存储设备22可以集成在一个计算机设备中,也可以位于相互独立的两个计算机设备中,本申请实施例对服务器21与存储设备22的位置关系不作任何限定。
[0039]对于信息搜索系统而言,其中下述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息搜索方法,其特征在于,包括:获取查询文本;将所述查询文本输入到实体识别模型,识别所述查询文本中的每一实体,得到所述查询文本中的实体以及所述实体的内容;所述实体识别模型至少用于基于预设的正则规则确定预设类型的实体对应的实体内容;根据得到的实体,确定所述查询文本的搜索意图;生成与所述搜索意图对应的查询语句,所述查询语句包括所述实体的内容;根据所述查询语句进行信息搜索,得到满足所述查询语句的信息。2.根据权利要求1所述的信息搜索方法,其特征在于,所述实体识别模型包括正则识别模型,所述识别所述查询文本中的每一实体,得到所述查询文本中的实体以及所述实体的内容,包括:对所述查询文本进行分词,获得分词结果;确定所述分词结果中与所述正则识别模型中的所述正则规则匹配的目标分词;根据所述目标分词,利用所述正则规则识别并确定与所述目标分词对应的所述预设类型的实体的内容。3.根据权利要求2所述的信息搜索方法,其特征在于,所述预设类型的实体包括时空实体;所述根据所述目标分词,利用所述正则规则识别并确定与所述目标分词对应的所述预设类型的实体的内容,包括:根据所述正则规则对应的时空配置信息,将所述目标分词转换为对应的时空信息,所述时空信息为所述时空实体的内容。4.根据权利要求2所述的信息搜索方法,其特征在于,所述预设类型的实体包括数字实体;所述根据所述目标分词,利用所述正则规则识别并确定与所述目标分词对应的所述预设类型的实体的内容,包括:读取与所述正则规则匹配的数字格式类型库,确定所述目标分词属于目标数字格式类型;所述数字格式类型库包括多种数字格式类型;确定所述目标分词的内容为具备所述目标数字格式类型的数字信息,所述数字信息为所述数字实体的内容。5.根据权利要求1

4中任意一项所述的信息搜索方法,其特征在于,所述根据得到的实体,确定所述查询文本的搜索意图,包括:统计所述得到的实体中每一类型的实体的分布,并根据所述分布确定所述搜索意图。6.根据权利要求1

4中任意一项所述的信息搜索方法,其特征在于,所述根据得到的实体,确定所述查询文本的搜索意图,包括:将所述查询文本输入到意图识别模型,进行意图识别,得到第一搜索意图和所述第一搜索意图的置信度;统计所述得到的实体中每一类型的实体的分布,并根据所述分布确定第二搜索意图和所述第二搜索意图的置信度;将所述第一搜索意图和所述第二搜索意图中置信度满足预设条件的搜索意图作为所述搜索意图。7.一种信息搜索装置,其特征在于,包括:

【专利技术属性】
技术研发人员:王诗源任溯邵益兰
申请(专利权)人:杭州海康威视系统技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1