分类信息获取、分类方法、装置、电子设备和存储介质制造方法及图纸

技术编号:34046739 阅读:10 留言:0更新日期:2022-07-06 14:48
本公开提供了一种分类信息获取、分类方法、装置、电子设备和存储介质,涉及数据处理技术领域,具体为大数据和人工智能技术领域。具体实现方案为:获取第一词语;在查询语句中,确定与所述第一词语对应的第二词语,并建立所述第一词语与所述第二词语之间的相关关系;将所述相关关系、所述第一词语和所述第二词语,确定为查询分类信息,用于对查询语句进行分类。本公开实施例可以增加分类信息,提高分类准确性。性。性。

Classification information acquisition, classification method, device, electronic equipment and storage medium

【技术实现步骤摘要】
分类信息获取、分类方法、装置、电子设备和存储介质


[0001]本公开涉及数据处理
,具体为大数据和人工智能
,尤其涉及一种分类信息获取、分类方法、装置、电子设备和存储介质。

技术介绍

[0002]在搜索技术中,需要对查询语句进行意图识别,并基于识别的意图进行搜索,将搜索结果呈现给用户。
[0003]通常可以采用预先生成的词语对查询语句进行分类,以确定查询语句的意图。

技术实现思路

[0004]本公开提供了一种分类信息获取、分类方法、装置、电子设备和存储介质。
[0005]根据本公开的一方面,提供了一种分类信息获取方法,包括:
[0006]获取第一词语;
[0007]在查询语句中,确定与所述第一词语对应的第二词语,并建立所述第一词语与所述第二词语之间的相关关系;
[0008]将所述相关关系、所述第一词语和所述第二词语,确定为查询分类信息,用于对查询语句进行分类。
[0009]根据本公开的另一方面,提供了一种分类方法,包括:
[0010]获取用户输入的输入语句;
[0011]在查询分类信息中,查询与所述输入语句对应的目标词语以及所述目标词语相关的词语,确定所述输入语句的类型,所述查询分类信息根据如本公开任一实施例所述的分类信息获取方法获取。
[0012]根据本公开的一方面,提供了一种分类信息获取装置,包括:
[0013]第一词语获取模块,用于获取第一词语;
[0014]词语及关系确定模块,用于在查询语句中,确定与所述第一词语对应的第二词语,并建立所述第一词语与所述第二词语之间的相关关系;
[0015]查询分类信息生成模块,用于将所述相关关系、所述第一词语和所述第二词语,确定为查询分类信息,用于对查询语句进行分类。
[0016]根据本公开的另一方面,提供了一种分类装置,包括:
[0017]输入语句获取模块,用于获取用户输入的输入语句;
[0018]输入语句分类模块,用于在查询分类信息中,查询与所述输入语句对应的目标词语以及所述目标词语相关的词语,确定所述输入语句的类型,所述查询分类信息根据如本公开任一实施例所述的分类信息获取方法获取。
[0019]根据本公开的另一方面,提供了一种电子设备,包括:
[0020]至少一个处理器;以及
[0021]与所述至少一个处理器通信连接的存储器;其中,
[0022]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的分类信息获取方法,或本公开任一实施例所述的分类方法。
[0023]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任一实施例所述的分类信息获取方法,或本公开任一实施例所述的分类方法。
[0024]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任一实施例所述的分类信息获取方法,或本公开任一实施例所述的分类方法。
[0025]本公开实施例可以增加分类信息,提高分类准确性。
[0026]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0027]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0028]图1是根据本公开实施例公开的一种分类信息获取方法的流程图;
[0029]图2是根据本公开实施例公开的另一种分类信息获取方法的流程图;
[0030]图3是根据本公开实施例公开的一种分类方法的流程图;
[0031]图4是根据本公开实施例公开的另一种应用场景的示意图;
[0032]图5是根据本公开实施例公开的一种分类信息获取装置的结构图;
[0033]图6是根据本公开实施例公开的一种分类装置的结构图;
[0034]图7是用来实现本公开实施例的分类信息获取方法或分类方法的电子设备的框图。
具体实施方式
[0035]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0036]图1是根据本公开实施例公开的一种分类信息获取方法的流程图,本实施例可以适用于生成分类信息的情况。本实施例方法可以由分类信息获取装置来执行,该装置可采用软件和/或硬件的方式实现,并具体配置于具有一定数据运算能力的电子设备中,该电子设备可以是客户端设备或服务器设备,客户端设备例如手机、平板电脑、车载终端和台式电脑等。
[0037]S101,获取第一词语。
[0038]第一词语用于作为查询分类信息的基准分类词,扩展出更加细分领域的词语,以对查询语句进行更精准的分类。第一词语可以从查询语句中提取,也可以是用户输入。可选的,获取第一词语,包括下述至少一项:获取兴趣信息,并提取第一词语;和获取中长尾查询语句,并提取第一词语。兴趣信息可以是指用户的感兴趣的信息。中长尾查询语句是指搜索
量较少,但长时间都存在搜索量的查询语句。中长尾查询语句的搜索量少于热点查询语句的搜索量。长时间存在搜索量可以是指在预设时长的时间段内,都存在搜索量。具体的,可以多个用户的兴趣信息进行聚类,根据每类提取的代表该类型的词语,确定为第一词语。或者,对收集的中长尾查询语句进行筛选,得到没有产生点击且页面浏览量(Page View,PV)较大的中长尾查询语句,并从中进行分词或实体抽取,得到第一词语。其中,兴趣信息可以是企业用户输入的信息。中长尾查询语句可以在搜索系统中获取企业用户的查询语句中筛选。
[0039]S102,在查询语句中,确定与所述第一词语对应的第二词语,并建立所述第一词语与所述第二词语之间的相关关系。
[0040]查询语句(query)是指用户输入的需要进行查询的语句。其中,查询语句为个人用户输入的查询语句。可以预先收集大量的查询语句,并针对每个查询语句,确定第二词语。其中,需要说明的是,收集的查询语句是经过用户授权,并符合相关法律法规的规定,且不违背公序良俗。第二词语是指查询语句中与第一词语相关的词语,具体是对第一词语进行扩展并具有一定区分度的词语。第二词语用于对第一词语所代表的分类信息进一步进行分类。第一词语与第二词语匹配,可以是指第一词语与第二词语相似,但语义不同。相关关系可以是指第一词语和第二词语之间的关系。相关关系用于根据词语确定对应的另一个词语,例如,根据第二词语确定第一词语,或者是根据第一词语,进一步进行分类,确定第二词语。其中,第二词语可以理解为第一词语关联的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类信息获取方法,包括:获取第一词语;在查询语句中,确定与所述第一词语对应的第二词语,并建立所述第一词语与所述第二词语之间的相关关系;将所述相关关系、所述第一词语和所述第二词语,确定为查询分类信息,用于对查询语句进行分类。2.根据权利要求1所述的方法,其中,所述在查询语句中,确定与所述第一词语对应的第二词语,包括:在查询语句中识别第一实体;根据所述第一实体,获取与所述第一词语对应的目标关键词;根据所述目标关键词,确定第二词语。3.根据权利要求2所述的方法,其中,所述根据所述目标关键词,确定第二词语,包括:在所述查询语句中提取与所述目标关键词对应的第二实体;根据所述目标关键词和所述第二实体,确定第二词语。4.根据权利要求3所述的方法,其中,所述建立所述第一词语与所述第二词语之间的相关关系,包括:建立所述第一词语与所述目标关键词之间的第一级相关关系;建立所述目标关键词与对应的第二实体之间的第二级相关关系。5.根据权利要求2所述的方法,其中,所述根据所述第一实体,获取与所述第一词语对应的目标关键词,包括:对所述第一词语进行扩展,得到相似语句;分别对所述第一词语和所述相似语句进行特征提取,形成第一特征向量;根据各所述第一特征向量,得到平均特征向量;对所述第一实体进行特征提取,形成第二特征向量;根据所述平均特征向量与各所述第二特征向量,在各所述第一实体中,筛选得到与所述第一词语对应的目标关键词。6.一种分类方法,包括:获取用户输入的输入语句;在查询分类信息中,查询与所述输入语句对应的目标词语以及所述目标词语相关的词语,确定所述输入语句的类型,所述查询分类信息根据如权利要求1

5任一项所述的分类信息获取方法获取。7.根据权利要求6所述的方法,还包括:根据所述输入语句的类型,对所述用户进行分类。8.根据权利要求6所述的方法,其中,所述查询分类信息包括词语和词语之间的相关关系;所述查询与所述输入语句对应的目标词语以及所述目标词语相关的词语,包括:根据词语长短和词语语义,在所述查询分类信息包括的词语中确定待更新词语;根据所述词语之间的相关关系,在所述待更新词语中添加相关的词语,更新所述待更新词语;
将所述输入语句输入预先训练的分类模型中,并根据更新后的待更新词语输出所述输入语句对应的目标词语。9.一种分类信息获取装置,包括:第一词语获取模块,用于获取第一词语;词语及关系确定模块,用于在查询语句中,确定与所述第一词语对应的第二词语,并建立所述第一词语与所述第二词语之间的相关关系;查询分类信息生成模块,用于将所述相关关系、所述第一词语和所述第二词语,确定为查询分类信息,用于对查询语句进行分类。10.根据权利要求9所述的装置,其中,所述词语及关系确定模块,包括:第一实体获取单元,用于在查询语句中识别第一实体;关键词筛选单元,用于根据所述第一实体,获取与所述第一词语对应的目标关键词;第二词语确定单元,用于根据所述目标关键词,确定第二词语。11.根据权利要求10所述的装置,其中,所述...

【专利技术属性】
技术研发人员:韩钊王晓元姜杰李玉婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1