【技术实现步骤摘要】
本专利技术涉及计算机数据分析领域,尤其涉及于商品数据检索,排序及商品推荐方法和支持系统。
技术介绍
目前搜索引擎用于排序的技术主要为相关度排序法,即通过建立模型对文档和查询词之间的相关度进行打分,相关度得分越高的文档排序越靠前。不同的搜索引擎使用了不同的相关度评分模型,主要有以下几类词频统计法,即文档中包含的查询词频率越高,则此文档相关度得分越高,排序越靠前;超链接分析法,即ー个网页被链接的次数越多而且链接的站点越权威就说明此网页的质量越高。此外,还有点击率法,即网页被点击的次数越多,相关度越高;付费竞价法,以网站付费的多少来决定排序前后。其中词频统计法和超链 引擎的主题框架。垂直捜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式。由于垂直搜索引擎的特殊性,绝大多数都以词频统计法来搭建搜索引擎的主题框架词频统计法,从名字上就能看出来词频是此算法中ー个相当重要的角色,它对相关度的大小起着举足轻重的作用。然而对于垂直搜索引擎而言,由于其数据所包含文档(注在搜索引擎中称一条数据为ー个文档)的结构化(注此处结构化的概念与非结构化相対。如邮件,word文档等全文数据位为非结构化数据;数据库数据,元数据则为结构化数据。)程度高,以及文档长度短小,词频并不能在排序中起到决定性的作用。虽然也可以通过ー些方式,如调整各个文档以及文档所包含域的权重大小来对排序进行优化,这样的做法就好比医 ...
【技术保护点】
一种商品数据检索排序方法,其特征在于,包括:步骤1,生成商品数据的数据库;步骤2,根据用户输入的查询词从数据库中取出匹配结果;步骤3,对该匹配结果的类别个数及所有类别名称进行统计,并对每个类别分别计算在匹配结果中的商品数据个数ni以及该类在整体商品数据中包含的商品数据个数mi;步骤4,计算类别名称的类别权重wi,找出类别权重最大的类所对应的类别权重wt;步骤5,将所有类别权重小于d*wt的类对应的所有商品数据从匹配结果中删除,其中,0<d<1,为可调参数;步骤6,将过滤后的类别按照其类别权重进行从大至小的排序。
【技术特征摘要】
1.ー种商品数据检索排序方法,其特征在于,包括 步骤I,生成商品数据的数据库; 步骤2,根据用户输入的查询词从数据库中取出匹配结果; 步骤3,对该匹配结果的类别个数及所有类别名称进行统计,并对每个类别分别计算在匹配结果中的商品数据个数Ili以及该类在整体商品数据中包含的商品数据个数Hli ; 步骤4,计算类别名称的类别权重Wi,找出类别权重最大的类所对应的类别权重Wt ; 步骤5,将所有类别权重小于d*wt的类对应的所有商品数据从匹配结果中删除,其中,O < d < I,为可调參数; 步骤6,将过滤后的类别按照其类别权重进行从大至小的排序。2.如权利要求I所述的商品数据检索排序方法,其特征在于,还包括计算物美价廉指数及推荐度步骤 物美价廉指数=商品价格/好评度*可信度,其中可信度=I-好评度/评价次数;3.如权利要求2所述的商品数据检索排序方法,其特征在于,还包括计算商品所在商家的价格在各个网上商城所卖价格的百分比,计算公式为 I-((某网上商城的价格-网上最低价)/(网上最高价-网上最低价))。4.如权利要求I所述的商品数据检索排序方法,其特征在于,所述对应类别权重Wi计...
【专利技术属性】
技术研发人员:郑茂林,陈爱洁,曾祥洪,
申请(专利权)人:北京国政通科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。