基于搜索的对象识别的方法、装置、设备以及存储介质制造方法及图纸

技术编号:32363918 阅读:18 留言:0更新日期:2022-02-20 03:35
本公开提供了一种基于搜索的对象识别方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及基于搜索的对象识别领域。具体实现方案为:获取与目标对象相关联的所有搜索请求;确定目标搜索请求在上述所有搜索请求中的占比值,其中,通过判定所有搜索请求的情感倾向确定上述目标搜索请求;确定与目标网页对应的可信度值,其中,上述目标网页为包含了与上述目标搜索请求关联的搜索内容的网页,上述可信度值用于表征上述目标网页佐证上述目标搜索请求的可信程度;基于上述占比值和上述可信度值,确定上述目标对象所属的对象类别。本公开解决了现有技术中基于搜索的对象识别方法采用点击率衡量可信程度,导致结果存在偏差的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
基于搜索的对象识别的方法、装置、设备以及存储介质


[0001]本公开涉及计算机
,尤其涉及基于搜索的对象识别领域。

技术介绍

[0002]互联网百科类产品中人物词条占有相当大的比重,且多样混杂,常常存在一些可疑人物的词条,由于各种原因,在词条正文中,并未包含提示信息,用户获取到的仅为片面信息,影响了百科类产品的全面性和中立性。因此,需要识别出可疑人物,并在页面对用户进行提示。
[0003]但是,现有技术中采用的基于搜索的对象识别方法对可疑人物的甄别没有黄金标准,即使是人工进行判定,也只能根据个人经验,这导致挖掘结果无法准确验证,且存在一定偏差。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本公开提供了一种用于基于搜索的对象识别的方法、装置、设备以及存储介质。
[0006]根据本公开的一方面,提供了一种基于搜索的对象识别方法,包括:获取与目标对象相关联的所有搜索请求;确定目标搜索请求在上述所有搜索请求中的占比值,其中,通过判定所有搜索请求的情感倾向确定上述目标搜索请求;确定与目标网页对应的可信度值,其中,上述目标网页为包含了与上述目标搜索请求关联的搜索内容的网页,上述可信度值用于表征上述目标网页佐证上述目标搜索请求的可信程度;基于上述占比值和上述可信度值,确定上述目标对象所属的对象类别。
[0007]可选的,上述获取与目标对象相关联的所有搜索请求,包括:检测接收到的搜索请求中是否存在与上述目标对象相关联的描述信息;若接收到的搜索请求中存在上述描述信息,则基于上述描述信息对接收到的搜索请求进行聚合处理,得到与上述目标对象相关联的上述所有搜索请求。
[0008]可选的,通过如下方式确定上述目标搜索请求:采用预设的样本模板从上述所有搜索请求中获取初始搜索请求;在对上述初始搜索请求进行回扫的过程中,采用情感倾向模型判定每个上述初始搜索请求的情感倾向;基于目标情感倾向扩充上述样本模板,以采用扩充后样本模板从上述所有搜索请求中再次获取上述初始搜索请求,并在迭代多次后得到上述目标搜索请求。
[0009]可选的,上述确定目标搜索请求在上述所有搜索请求中的占比值,包括:确定所有搜索请求的第一搜索流量值,以及上述目标搜索请求的第二搜索流量值;依据上述第一搜索流量值和上述第二搜索流量值,计算得到上述目标搜索请求在上述所有搜索请求中的占比值。
[0010]可选的,上述确定所有搜索请求的第一搜索流量值,以及上述目标搜索请求的第二搜索流量值,包括:计算上述所有搜索请求的流量总值,得到上述第一搜索流量值;计算
上述目标搜索请求对应的搜索流量值,得到上述第二搜索流量值。
[0011]可选的,上述确定与目标网页对应的可信度值,包括:获取上述目标网页相关的点击次数和展示次数;计算上述点击次数和展示次数的比值;将上述比值确定为上述可信度值。
[0012]可选的,上述基于上述占比值和上述可信度值,确定上述目标对象所属的对象类别,包括:比对预设的可信度阈值和上述可信度值,得到比对结果;依据上述比对结果筛选所有的网页,得到证据列表,其中,上述证据列表中的每个证据均包括:上述目标网页和上述目标网页的可信度值;基于上述占比值和上述证据列表,确定上述目标对象所属的对象类别。
[0013]根据本公开的另一方面,提供了一种基于搜索的对象识别装置,包括:获取模块,用于获取与目标对象相关联的所有搜索请求;第一确定模块,用于确定目标搜索请求在上述所有搜索请求中的占比值,其中,通过判定所有搜索请求的情感倾向确定上述目标搜索请求;第二确定模块,用于确定与目标网页对应的可信度值,其中,上述目标网页为包含了与上述目标搜索请求关联的搜索内容的网页,上述可信度值用于表征上述目标网页佐证上述目标搜索请求的可信程度;第三确定模块,用于基于上述占比值和上述可信度值,确定上述目标对象所属的对象类别。
[0014]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行任一项上述的基于搜索的对象识别方法。
[0015]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行任一项上述的基于搜索的对象识别方法。
[0016]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现任一项上述的基于搜索的对象识别方法。
[0017]在本公开实施例中,通过获取与目标对象相关联的所有搜索请求;确定目标搜索请求在上述所有搜索请求中的占比值,其中,通过判定所有搜索请求的情感倾向确定上述目标搜索请求;确定与目标网页对应的可信度值,其中,上述目标网页为包含了与上述目标搜索请求关联的搜索内容的网页,上述可信度值用于表征上述目标网页佐证上述目标搜索请求的可信程度;基于上述占比值和上述可信度值,确定上述目标对象所属的对象类别,达到了对目标对象进行识别的目的,从而实现了基于搜索占比和可信度判断目标对象类别的技术效果,进而解决了现有技术中基于搜索的对象识别方法采用点击率衡量可信程度,导致结果存在偏差的技术问题。
[0018]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0020]图1是根据本公开第一实施例的基于搜索的对象识别方法的步骤流程示意图;
[0021]图2是根据本公开第一实施例的确定与目标网页对应的可信度值过程示意图;
[0022]图3是根据本公开第一实施例的确定目标对象所属的对象类别过程示意图;
[0023]图4是根据本公开第二实施例的基于搜索的对象识别装置的结构示意图;
[0024]图5示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于搜索的对象识别方法,包括:获取与目标对象相关联的所有搜索请求;确定目标搜索请求在所述所有搜索请求中的占比值,其中,通过判定所有搜索请求的情感倾向确定所述目标搜索请求;确定与目标网页对应的可信度值,其中,所述目标网页为包含了与所述目标搜索请求关联的搜索内容的网页,所述可信度值用于表征所述目标网页佐证所述目标搜索请求的可信程度;基于所述占比值和所述可信度值,确定所述目标对象所属的对象类别。2.根据权利要求1所述的方法,其中,所述获取与目标对象相关联的所有搜索请求,包括:检测接收到的搜索请求中是否存在与所述目标对象相关联的描述信息;若接收到的搜索请求中存在所述描述信息,则基于所述描述信息对接收到的搜索请求进行聚合处理,得到与所述目标对象相关联的所述所有搜索请求。3.根据权利要求1所述的方法,其中,通过如下方式确定所述目标搜索请求:采用预设的样本模板从所述所有搜索请求中获取初始搜索请求;在对所述初始搜索请求进行回扫的过程中,采用情感倾向模型判定每个所述初始搜索请求的情感倾向;基于目标情感倾向扩充所述样本模板,以采用扩充后样本模板从所述所有搜索请求中再次获取所述初始搜索请求,并在迭代多次后得到所述目标搜索请求。4.根据权利要求1所述的方法,其中,所述确定目标搜索请求在所述所有搜索请求中的占比值,包括:确定所有搜索请求的第一搜索流量值,以及所述目标搜索请求的第二搜索流量值;依据所述第一搜索流量值和所述第二搜索流量值,计算得到所述目标搜索请求在所述所有搜索请求中的占比值。5.根据权利要求4所述的方法,其中,所述确定所有搜索请求的第一搜索流量值,以及所述目标搜索请求的第二搜索流量值,包括:计算所述所有搜索请求的流量总值,得到所述第一搜索流量值;计算所述目标搜索请求对应的搜索流量值,得到所述第二搜索流量值。6.根据权利要求1所述的方法,其中,所述确定与目标网页对...

【专利技术属性】
技术研发人员:雷谦万志文李鸿宇姚后清
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1