搜索引擎中商品标签的构建方法、系统及搜索方法和系统技术方案

技术编号:14416523 阅读:61 留言:0更新日期:2017-01-12 09:31
本发明专利技术公开了一种搜索引擎中商品标签的构建方法,该方法包括:S11:对商品进行分类,建立商品子类列表;S12:确定商品子类的多维度标签;S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。同时还提供搜索引擎中商品标签的构建系统、搜索方法和搜索系统。本实施例从多维度构建商品标签,提高搜索返回率,进而改善用户体验。

【技术实现步骤摘要】

本专利技术涉及电子商务领域,具体来说,涉及搜索引擎中商品标签的构建方法、系统及搜索方法和系统
技术介绍
当前电子商务网站的搜索技术是基于关键词完全匹配技术。如果商品目录的数据库不能完全匹配用户输入的所有关键词时,那么即使目标商品存在,搜索结果仍然为零或者返回率低。搜索结果为零和返回率低的情况,例如:当输入关键词“亚洲地图图书”搜索时,没有相关的结果显示。这是因为没有一件商品能够同时匹配这三个关键词。对于部分商品一物多名而出现的无搜索结果,现有技术采用在数据库里提供商品名称的同义词或近义词,并将此类词汇与商品名称联系起来。然而在现实搜索中,除去商品名称不同,用户对商品的需求可能停留在对某类商品的特性上。基于此,现有的商品标签的构建方法难以适应用户的需求。
技术实现思路
本专利技术实施例提供搜索引擎中商品标签的构建方法、构建系统及搜索方法和搜索系统,从多维度构建商品标签,提高搜索返回率,进而改善用户体验。为解决上述技术问题,第一方面,本专利技术实施例提供一种搜索引擎中商品标签的构建方法,该方法包括:S11:对商品进行分类,建立商品子类列表;S12:确定商品子类的多维度标签;S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。结合第一方面,作为第一种可能实现的方式,所述的S11中,商品子类列表包括大类、小类和商品子类。结合第一方面,作为第二种可能实现的方式,所述的S12中,利用实体识别方法和句子剖析方法自动提取商品的多维度标签;多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词和特征词。结合第一方面第二种可能实现的方式,作为第三种可能实现的方式,所述的S12具体包括:S21用模版化的智能网页爬虫获取外部公共资源;S22利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;S23从商品子类相关词条集合中提取备选标签;S24审阅备选标签,形成最终的标签。结合第一方面的第三种可能实现的方式,作为第四种可能实现的方式,所述的步骤S22中,从外部公共资源抓取与该商品子类相关联的词条的过程为:根据该词条在商品子类商品数据中的出现频率和评价数据中的出现频率,当该两种出现频率均大于或等于事先设定的阈值时,则将该词条视为与商品子类相关联的词条。第二方面,本专利技术实施例提供一种搜索引擎中商品标签的构建系统,该系统包括:分类模块:用于对商品进行分类,建立商品子类列表;确定模块:用于确定商品子类的多维度标签;构建模块:用于将确定的多维度标签,加入商品子类列表中,构建商品标签。结合第二方面,作为第一种可能实现的方式,所述的确定模块具体包括:获取子模块:用于用模版化的智能网页爬虫获取外部公共资源;生成子模块:用于利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;提取子模块:用于从商品子类相关词条集合中提取备选标签;审阅子模块:用于审阅备选标签,形成最终的标签。结合第二方面第一种可能实现的方式,作为第二种可能实现的方式,所述的生成子模块具体包括:统计单元:用于统计词条在商品子类商品数据中的出现频率和评价数据中的出现频率;判断单元:用于判断两种出现频率是否均大于或等于事先设定的阈值,如果是,则该词条为与商品子类相关联的词条。第三方面,本专利技术实施例提供一种商品搜索方法,该方法包括:S61:建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;S62:在商品子类列表中搜索用户在搜索引擎中输入的检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。第四方面,本专利技术实施例提供一种商品搜索系统,该系统包括:建立模块:用于建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;输入模块:用于在搜索引擎中输入检索词;搜索模块:用于在商品子类列表中搜索检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。本专利技术实施例搜索引擎中商品标签的构建方法、系统及搜索方法和系统,通过在商品子类列表中构建商品的多维度标签,提高了搜索结果召回率。多维度标签包括同义词、近义词、广义词、商品功能词以及特征词。设置多维度标签,使得用户在搜索时,系统根据检索词,在多维度标签中搜索该检索词,以及该检索词的同义词、近义词、广义词、商品功能词以及特征词,从而提高了搜索结果召回率。附图说明图1是本专利技术实施例中商品标签的构建方法的流程图;图2是本专利技术实施例中确定商品子类的同义词、近义词、广义词、商品功能词以及特征词的流程图;图3是本专利技术实施例中构建系统的结构框图;图4是本专利技术实施例确定模块的结构框图;图5是本专利技术实施例生成子模块的结构框图;图6是本专利技术实施例查找商品的方法的流程图;图7是本专利技术实施例查找商品的系统的结构框图。具体实施方式如图1所示,本实施例提供一种电子商务搜索引擎中商品标签的构建方法:S11:对商品进行分类,建立商品子类列表。整个商品子类列表包括大类、小类和商品子类。商品子类、小类和大类是依据电子商务平台的商品分类信息而定。如表1所示,按照商品的用途,对商品进行分类。商品子类对应待搜索的商品。小类是商品子类的上一层次的分类,大类是小类的上一层次的分类。在表1中,净水器为商品子类,净水器属于的小类为厨卫电器,净水器属于的大类为厨卫电器/生活电器。商品子类包含不同或相同企业生产销售的相同商品。表1S12:确定商品子类的多维度标签。多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词和特征词。利用实体识别方法和句子剖析方法自动提取商品的同义词、近义词、广义词、商品功能词以及特征词。S12进一步包括:S21用模版化的智能网页爬虫获取外部公共资源。外部公共资源如电子商务网站、社交网站、百度百科、互联百科等网站。这些网站中包含了商品的各类信息,例如商品属性、商品同义词、近义词、使用评价数据等。S22利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合。根据每个网站的数据结构等不同,网络机器人有所改进,形成定制化的网络机器人,以抓取最有效数据。在确定与该商品子类相关联的词条时,可以根据该词条在商品子类商品数据中的出现频率和评价数据中的出现频率而定。当两种出现频率均大于或等于事先设定的阈值时,则该词条为与商品子类相关联的词条;否则,则该词条为与商品子类不相关联的词条。S23从商品子类相关词条集合中提取备选标签。作为一种优选例,通过实体识别方法和句子剖析方法,对商品子类相关词条集合中的词条,进行聚类分析,词性过滤之后,生成备选标签。实体识别方法包括构建字典和词典、分析比较不同搜索词的用户点击方式、分析用户搜索期间搜索词的改写三种方法。通过分析商品数据,以及百度百科等互联网资源来建立各种词典,比如商品类别词典、品牌词典、型号词典等。通过实体识别方法查询待搜索商品的同义词、近义词、广义词、商品功能词以及特征词。例如,搜索净水器,在商品类本文档来自技高网...
搜索引擎中商品标签的构建方法、系统及搜索方法和系统

【技术保护点】
一种搜索引擎中商品标签的构建方法,其特征在于,该方法包括:S11:对商品进行分类,建立商品子类列表;S12:确定商品子类的多维度标签;S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。

【技术特征摘要】
1.一种搜索引擎中商品标签的构建方法,其特征在于,该方法包括:S11:对商品进行分类,建立商品子类列表;S12:确定商品子类的多维度标签;S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。2.按照权利要求1所述的构建方法,其特征在于,所述的S11中,商品子类列表包括大类、小类和商品子类。3.按照权利要求1所述的构建方法,其特征在于,所述的S12中,利用实体识别方法和句子剖析方法自动提取商品的多维度标签;多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词和特征词。4.按照权利要求3所述的构建方法,其特征在于,所述的S12具体包括:S21用模版化的智能网页爬虫获取外部公共资源;S22利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;S23从商品子类相关词条集合中提取备选标签;S24审阅备选标签,形成最终的标签。5.按照权利要求4所述的构建方法,其特征在于,所述的步骤S22中,从外部公共资源抓取与该商品子类相关联的词条的过程为:根据该词条在商品子类商品数据中的出现频率和评价数据中的出现频率,
\t当该两种出现频率均大于或等于事先设定的阈值时,则将该词条视为与商品子类相关联的词条。6.一种搜索引擎中商品标签的构建系统,其特征在于,该系统包括:分类模块:用于对商品进行分类,建立商品子类列表;确定模块:用于确定商品子类的多维度标签;构建模块:用于将确定的多维度标签,加入商品子类列表中,构建商品标签。7.按照权利要...

【专利技术属性】
技术研发人员:马沈郭成华程进兴王静玺
申请(专利权)人:苏宁云商集团股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1