一种关键词分类方法及装置制造方法及图纸

技术编号:16153241 阅读:22 留言:0更新日期:2017-09-06 18:29
本发明专利技术提供一种关键词分类方法,对于任意一个关键词来说,可以从关键词所属的每个第N级分类下的产品数量、第N级分类下的产品的概要信息和每个第N级分类所属的第N‑M级分类出发,确定出关键词的默认分类,这样在基于关键词进行搜索时可以直接获取默认分类下的各个产品,提高搜索效率。并且从上述多个角度出发确定关键词的默认分类的方式相对于单一角度来说可以提高分类准确率,而相对于现有纠正方式来说无需一定数据积累,这样在数据积累未达到纠正要求时,仍可以通过准确率提高的默认分类进行搜索,提高搜索准确率。

【技术实现步骤摘要】
一种关键词分类方法及装置
本专利技术属于关键词处理
,更具体的说,尤其涉及一种关键词分类方法及装置。
技术介绍
当浏览器获取到关键词,并检测到浏览器的搜索功能被触发时,会触发后台服务器从上亿级别的产品数据中搜索与关键词匹配的产品,并确定关键词所属分类,这样在前台设备(如显示有浏览器的终端设备)上显示与关键词匹配的产品的同时还可以显示关键词所属分类。当关键词所属分类中任意一个分类被触发时,前台设备仅显示被触发的分类下的产品。目前基于关键词的搜索方法有相关搜索方法和纠偏搜索方法,其中相关搜索方法是:在通过关键词进行搜索时,由后台服务器通过大数据分析方式,确定接近搜索场景且满足搜索关键词需求的所有分类下的产品,但是这种方式需要对后台服务器中的所有产品数据进行分析,从而降低搜索效率。而纠偏搜索方式是:后台服务器从词库中调取与关键词相关(如语意相关)的词,根据调取的词对所述关键词进行纠正,再根据纠正后的关键词进行二次搜索,得到于纠正后的关键词相匹配的产品,但是这种方式需要有一定的数据积累,若后台服务器的数据分析能力不足或者数据量积累较小,后台服务器不能精准地对关键词进行纠正,得到更精准的关键词(即纠正后的关键词)进行搜索。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种关键词分类方法,通过改变关键词所属分类,提高搜索效率和搜索准确率。具体的,技术方案如下:本专利技术提供一种关键词分类方法,所述方法包括:获取关键词所属的每个第N级分类下的产品数量以及获取所述第N级分类下的产品的概要信息,所述N为自然数;确定每个第N级分类所属的第N-M级分类,所述M为自然数,且N-M的取值大于预设等级或等于预设等级;根据所述产品数量、所述概要信息和所述第N级分类所属的第N-M级分类,计算所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分;选取第二总得分大于其他第N级分类的第二总得分,且所选取的所有第N级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第N级分类为所述关键词的默认分类。优选地,所述根据所述产品数量、所述概要信息和所述第N级分类所属的第N-M级分类,计算所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分,包括:分别根据每个第N级分类下的产品数量,得到对应的第N级分类的产品得分;计算每个所述产品的概要信息与所述关键词的匹配得分以及计算每个第N-M级分类的分类得分;根据所述产品得分、所述匹配得分和所述分类得分,得到所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分。优选地,所述获取所述第N级分类下的产品的概要信息,包括:根据每个所述第N级分类的产品得分,从所获取的所有第N级分类中选取T个所述第N级分类,所述T为自然数;获取所述T个所述第N级分类下的产品的概要信息。优选地,所述分别根据每个第N级分类下的产品数量,得到对应的第N级分类的产品得分,包括:确定每个第N级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,第一级别高于第二级别;根据每个第N级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第N级分类的产品得分。优选地,所述选取第二总得分大于其他第N级分类的第二总得分,且所选取的所有第N级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第N级分类为所述关键词的默认分类,包括:根据每个所述第N级分类的第二总得分,对所有所述第N级分类进行排序,得到每个所述第N级分类在所有第N级分类中的排位;根据每个所述第N级分类在所有第N级分类中的排位,选取排位在预设排位前的多个第N级分类;判断所选取的多个第N级分类的第二总得分之和是否大于所述第一总得分与预设权重的乘积,若是,则将所选取的多个第N级分类确定为所述关键词的默认分类,若否,则增大所述预设排位的取值,返回执行所述根据每个所述第N级分类在所有第N级分类中的排位,选取排位在预设排位前的多个第N级分类。本专利技术还提供一种关键词分类装置,所述装置包括:获取单元,用于获取关键词所属的每个第N级分类下的产品数量以及获取所述第N级分类下的产品的概要信息,所述N为自然数;确定单元,用于确定每个第N级分类所属的第N-M级分类,所述M为自然数,且N-M的取值大于预设等级或等于预设等级;计算单元,用于根据所述产品数量、所述概要信息和所述第N级分类所属的第N-M级分类,计算所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分;选取单元,用于选取第二总得分大于其他第N级分类的第二总得分,且所选取的所有第N级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第N级分类为所述关键词的默认分类。优选地,所述计算单元包括:第一计算子单元,用于分别根据每个第N级分类下的产品数量,得到对应的第N级分类的产品得分;第二计算子单元,用于计算每个所述产品的概要信息与所述关键词的匹配得分以及计算每个第N-M级分类的分类得分;第三计算子单元,用于根据所述产品得分、所述匹配得分和所述分类得分,得到所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分。优选地,所述获取单元获取所述第N级分类下的产品的概要信息,包括:根据每个所述第N级分类的产品得分,从所获取的所有第N级分类中选取T个所述第N级分类,并获取所述T个所述第N级分类下的产品的概要信息,所述T为自然数。优选地,所述第一计算子单元,用于确定每个第N级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,并根据每个第N级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第N级分类的产品得分,第一级别高于第二级别。优选地,所述选取单元包括:排序子单元,用于根据每个所述第N级分类的第二总得分,对所有所述第N级分类进行排序,得到每个所述第N级分类在所有第N级分类中的排位;选取子单元,用于根据每个所述第N级分类在所有第N级分类中的排位,选取排位在预设排位前的多个第N级分类;判断子单元,用于判断所选取的多个第N级分类的第二总得分之和是否大于所述第一总得分与预设权重的乘积,若是,则触发所述选取子单元将所选取的多个第N级分类确定为所述关键词的默认分类,若否,则触发所述选取子单元增大所述预设排位的取值,并触发所述选取子单元所述根据每个所述第N级分类在所有第N级分类中的排位,选取排位在增大后的预设排位前的多个第N级分类。与现有技术相比,本专利技术提供的上述技术方案具有如下优点:藉由上述技术方案,对于任意一个关键词来说,可以从关键词所属的每个第N级分类下的产品数量、第N级分类下的产品的概要信息和每个第N级分类所属的第N-M级分类出发,确定出关键词的默认分类,这样在基于关键词进行搜索时可以直接获取默认分类下的各个产品,提高搜索效率。并且从上述多个角度出发确定关键词的默认分类的方式相对于单一角度来说可以提高分类准确率,而相对于现有纠正方式来说无需一定数据积累,这样在数据积累未达到纠正要求时,仍可以通过准确率提高的默认分类进行搜索,提高搜索准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前本文档来自技高网...
一种关键词分类方法及装置

【技术保护点】
一种关键词分类方法,其特征在于,所述方法包括:获取关键词所属的每个第N级分类下的产品数量以及获取所述第N级分类下的产品的概要信息,所述N为自然数;确定每个第N级分类所属的第N‑M级分类,所述M为自然数,且N‑M的取值大于预设等级或等于预设等级;根据所述产品数量、所述概要信息和所述第N级分类所属的第N‑M级分类,计算所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分;选取第二总得分大于其他第N级分类的第二总得分,且所选取的所有第N级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第N级分类为所述关键词的默认分类。

【技术特征摘要】
1.一种关键词分类方法,其特征在于,所述方法包括:获取关键词所属的每个第N级分类下的产品数量以及获取所述第N级分类下的产品的概要信息,所述N为自然数;确定每个第N级分类所属的第N-M级分类,所述M为自然数,且N-M的取值大于预设等级或等于预设等级;根据所述产品数量、所述概要信息和所述第N级分类所属的第N-M级分类,计算所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分;选取第二总得分大于其他第N级分类的第二总得分,且所选取的所有第N级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第N级分类为所述关键词的默认分类。2.根据权利要求1所述的方法,其特征在于,所述根据所述产品数量、所述概要信息和所述第N级分类所属的第N-M级分类,计算所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分,包括:分别根据每个第N级分类下的产品数量,得到对应的第N级分类的产品得分;计算每个所述产品的概要信息与所述关键词的匹配得分以及计算每个第N-M级分类的分类得分;根据所述产品得分、所述匹配得分和所述分类得分,得到所有所述第N级分类的第一总得分以及每个所述第N级分类的第二总得分。3.根据权利要求2所述的方法,其特征在于,所述获取所述第N级分类下的产品的概要信息,包括:根据每个所述第N级分类的产品得分,从所获取的所有第N级分类中选取T个所述第N级分类,所述T为自然数;获取所述T个所述第N级分类下的产品的概要信息。4.根据权利要求2所述的方法,其特征在于,所述分别根据每个第N级分类下的产品数量,得到对应的第N级分类的产品得分,包括:确定每个第N级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,第一级别高于第二级别;根据每个第N级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第N级分类的产品得分。5.根据权利要求1所述的方法,其特征在于,所述选取第二总得分大于其他第N级分类的第二总得分,且所选取的所有第N级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第N级分类为所述关键词的默认分类,包括:根据每个所述第N级分类的第二总得分,对所有所述第N级分类进行排序,得到每个所述第N级分类在所有第N级分类中的排位;根据每个所述第N级分类在所有第N级分类中的排位,选取排位在预设排位前的多个第N级分类;判断所选取的多个第N级分类的第二总得分之和是否大于所述第一总得分与预设权重的乘积,若是,则将所选取的多个第N级分类确定为所述关键词的默认分类,若否,则增大所述预设排位的取值,返回执行所述根据每个所述第N级分类在所有第N级分...

【专利技术属性】
技术研发人员:文帅营王路朱雨莹
申请(专利权)人:郑州悉知信息科技股份有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1