数据检索方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:36546221 阅读:12 留言:0更新日期:2023-02-04 16:58
本申请实施例提供了一种数据检索方法、装置、电子设备和可读存储介质,涉及计算机技术领域,在本申请实施例中,可以通过文本信息确定包含文本信息全部关键词的第一输入文本,以及包含文本信息部分关键词的第二输入文本,然后,可以确定第二输入文本对应的概率映射关系,并根据该概率映射关系以及第一输入文本确定匹配结果。在此过程中,由于概率映射关系包含第二输入文本与至少一个备选文本相同的概率,所以,本申请实施例综合概率映射关系以及第一输入文本可以更准确的确定匹配结果。第一输入文本可以更准确的确定匹配结果。第一输入文本可以更准确的确定匹配结果。

【技术实现步骤摘要】
数据检索方法、装置、电子设备和可读存储介质


[0001]本申请涉及计算机
,特别是涉及一种数据检索方法、装置、电子设备和可读存储介质。

技术介绍

[0002]目前,随着互联网技术的发展,越来越多的人选择通过互联网的方式进行信息检索,例如,人们可以通过互联网检索想阅读的文章,也可以通过互联网检索想查看的图片、视频,还可以通过互联网检索想了解的商品等等。
[0003]在相关技术中,用户可以通过终端输入一个或多个关键词进行检索,以得到相应的信息。
[0004]然而,由于互联网存在大量无效的信息,所以,如何使得用户能够准确的检索到有效信息是目前亟需解决的问题。

技术实现思路

[0005]有鉴于此,本申请实施例提供一种数据检索方法、装置、电子设备和可读存储介质,以提高数据检索的准确度。
[0006]第一方面,提供了一种数据检索方法,所述方法应用于电子设备,所述方法包括:
[0007]接收数据检索请求,所述数据检索请求至少包括文本信息。
[0008]根据所述文本信息,确定第一输入文本和至少一个第二输入文本,所述第一输入文本包括所述文本信息中的全部关键词,所述第二输入文本包括所述文本信息中的部分关键词。
[0009]确定所述第二输入文本对应的概率映射关系,所述概率映射关系包括所述第二输入文本与至少一个备选文本相同的概率。
[0010]根据所述概率映射关系和所述第一输入文本,确定匹配结果。
[0011]第二方面,提供了一种数据检索装置,所述装置应用于电子设备,所述装置包括:
[0012]接收模块,用于接收数据检索请求,所述数据检索请求至少包括文本信息。
[0013]输入文本确定模块,用于根据所述文本信息,确定第一输入文本和至少一个第二输入文本,所述第一输入文本包括所述文本信息中的全部关键词,所述第二输入文本包括所述文本信息中的部分关键词。
[0014]概率映射关系确定模块,用于确定所述第二输入文本对应的概率映射关系,所述概率映射关系包括所述第二输入文本与至少一个备选文本相同的概率。
[0015]匹配结果确定模块,用于根据所述概率映射关系和所述第一输入文本,确定匹配结果。
[0016]第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。
[0017]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。
[0018]第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如第一方面所述的方法。
[0019]在本申请实施例中,可以通过文本信息确定包含文本信息全部关键词的第一输入文本,以及包含文本信息部分关键词的第二输入文本,然后,可以确定第二输入文本对应的概率映射关系,并根据该概率映射关系以及第一输入文本确定匹配结果。在此过程中,由于概率映射关系包含第二输入文本与至少一个备选文本相同的概率,所以,本申请实施例综合概率映射关系以及第一输入文本可以更准确的确定匹配结果。
附图说明
[0020]通过以下参照附图对本申请实施例的描述,本申请实施例的上述以及其它目的、特征和优点将更为清楚,在附图中:
[0021]图1为本申请实施例数据检索系统的示意图;
[0022]图2为本申请实施例数据检索方法的流程图;
[0023]图3为本申请实施例确定第一输入文本和第二输入文本的流程图;
[0024]图4为本申请实施例通过深度语义匹配模型确定匹配结果的流程图;
[0025]图5为本申请实施例另一种数据检索方法的流程图;
[0026]图6为本申请实施例确定关键词文本、正样本和负样本的流程图;
[0027]图7为本申请实施例展示界面的示意图;
[0028]图8为本申请实施例数据检索装置的结构示意图;
[0029]图9为本申请实施例电子设备的结构示意图。
具体实施方式
[0030]以下基于实施例对本申请进行描述,但是本申请并不仅仅限于这些实施例。在下文对本申请的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本申请。为了避免混淆本申请的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
[0031]此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
[0032]除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
[0033]在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0034]在相关技术中,由于互联网中充斥大量对于用户无用的信息,所以,当用户通过关键词进行数据检索时,检索的结果中会出现大量无效的检索结果,使得检索的效率较低。
[0035]为了解决上述问题,本申请实施例提供一种数据检索系统,该系统可以设置在电子设备,其中,电子设备可以是终端或者服务器,终端可以是智能手机、平板电脑或者个人
计算机(Personal Computer,PC)等,服务器可以是单个服务器,也可以是以分布式方式配置的服务器集群,还可以是云服务器。
[0036]通过设置在电子设备中的数据检索系统,可以执行本申请实施例的数据检索方法,如图1所示,图1为本申请实施例数据检索系统的示意图,该示意图包括:用户端11和电子设备12。
[0037]在本申请实施例中,用户可以通过用户端11向电子设备12发送数据检索请求,其中,数据检索请求至少包括文本信息,该文本信息可以是用户通过用户端11输入的搜索字段。
[0038]如图1所示,电子设备12与用户端11可以通过网络进行无线数据传输,在另一种情况下,电子设备12与用户端11也可以通过数据线进行有线数据传输。
[0039]当电子设备12接收到用户端11发送的数据检索请求后,电子设备12可以对文本信息进行关键词提取,确定第一输入文本和至少一个第二输入文本。其中,第一输入文本可以包括文本信息中的全部关键词,第二输入文本可以包括文本信息中的部分关键词。
[0040]另外,本申请实施例中第一输入文本和第二输入文本的“第一”和“第二”仅是用于区分两种输入文本,不起到其它限定作用。
[0041]然后,电子设备可以根据第一输入文本和第二输入文本来确定匹配结果,其中,匹配结果是与数据检索请求中的文本信息相匹配的字段,在实际应用中,匹配结果可以是视频的简介信息、视频的标题、图片的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据检索方法,其特征在于,所述方法包括:接收数据检索请求,所述数据检索请求至少包括文本信息;根据所述文本信息,确定第一输入文本和至少一个第二输入文本,所述第一输入文本包括所述文本信息中的全部关键词,所述第二输入文本包括所述文本信息中的部分关键词;确定所述第二输入文本对应的概率映射关系,所述概率映射关系包括所述第二输入文本与至少一个备选文本相同的概率;以及根据所述概率映射关系和所述第一输入文本,确定匹配结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述概率映射关系和所述第一输入文本,确定匹配结果,包括:根据所述概率映射关系,确定所述第二输入文本对应的至少一个目标文本;以及根据所述第一输入文本和各目标文本之间相似度,在各目标文本中确定至少一个匹配结果。3.根据权利要求2所述的方法,其特征在于,所述根据所述概率映射关系,确定所述第二输入文本对应的至少一个目标文本,包括:根据所述概率映射关系,确定与所述第二输入文本相同的概率大于预定概率阈值的备选文本为目标文本。4.根据权利要求2所述的方法,其特征在于,所述根据所述概率映射关系,确定所述第二输入文本对应的至少一个目标文本,包括:根据所述概率映射关系,确定与所述第二输入文本相同的概率最大的预定数量个备选文本为目标文本。5.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息,确定第一输入文本和至少一个第二输入文本,包括:对所述文本信息进行分词处理,确定所述文本信息中的各关键词;基于所述文本信息中的各关键词,确定所述...

【专利技术属性】
技术研发人员:张军超
申请(专利权)人:北京橙心无限科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1