搜索排序的方法和装置制造方法及图纸

技术编号:24996043 阅读:34 留言:0更新日期:2020-07-24 17:58
本发明专利技术公开了一种搜索排序的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表;对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;基于倒排索引表获取当前搜索词对应的待选产品;根据类目权重值和特征权重值计算待选产品的排序得分,以对待选产品进行搜索排序。该实施方式能够根据语义优化搜索排序,实现热门产品的优先排序,从而提高了用户体验,进而提高了用户选购产品的选购率。

【技术实现步骤摘要】
搜索排序的方法和装置
本专利技术涉及计算机
,尤其涉及一种搜索排序的方法和装置。
技术介绍
随着计算机技术的发展,电子商务已深入人们的生活,每天都会有大量的产品信息在线,所以哪些产品排在前面是一个很关键的问题。现有的搜索排序方法:1)将所有产品名称、类目、品牌等信息录入数据库,并将这些信息进行分词,统计分词的频次,按词频通过TF/IDF计算进行排序;2)按运营人员的要求,对预售或者下架的产品,制定相应的排序规则,对排序结果进行干涉。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:1.无法实现搜索词的语义识别;2.无法按搜索词的语义识别结果对搜索结果进行排序;3.无法做到热门产品的优先排序。
技术实现思路
有鉴于此,本专利技术实施例提供一种搜索排序的方法和装置,能够根据语义优化搜索排序,实现热门产品的优先排序,从而提高了用户体验,进而提高了用户选购产品的选购率。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种搜索排序的方法。...

【技术保护点】
1.一种搜索排序的方法,其特征在于,包括:/n对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立所述搜索关键词的倒排索引表;/n对所述搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;/n基于所述倒排索引表获取当前搜索词对应的待选产品;/n根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分,以对所述待选产品进行搜索排序。/n

【技术特征摘要】
1.一种搜索排序的方法,其特征在于,包括:
对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立所述搜索关键词的倒排索引表;
对所述搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值;
基于所述倒排索引表获取当前搜索词对应的待选产品;
根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分,以对所述待选产品进行搜索排序。


2.根据权利要求1所述的方法,其特征在于,所述产品信息包括产品标题;以及
对历史搜索词对应的产品信息进行分词处理,得到搜索关键词和索引分词,并建立搜索关键词的倒排索引表包括:
对所述历史搜索词进行分词处理,得到搜索关键词;
获取所述搜索关键词对应的产品信息;
对所述搜索关键词对应的产品标题进行分词处理,得到索引分词;
建立搜索关键词的倒排索引表;其中,所述倒排索引表记录有所述搜索关键词与索引记录的映射,所述索引记录是所述索引分词与产品的对应关系。


3.根据权利要求2所述的方法,其特征在于,所述产品信息还包括产品类目和产品特征;以及
对搜索关键词对应的产品信息进行语义分析,得到产品的类目权重值和至少一个特征权重值包括:
从所述搜索关键词对应的产品信息中提取简化词;其中,简化词是描述产品特征的词语;
根据所述简化词对所述搜索关键词对应的产品进行分类统计;
基于以下公式计算产品的类目权重值:
C=N*L*Ki/K,其中,N是类目基值,L是类目级别,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量;
选取至少一个产品特征,并基于以下公式计算产品的特征权重值:
Fi=F*Ki/K,其中,F是产品特征基值,Ki是该类目级别中产品的数量,K是所述搜索关键词对应的产品的数量。


4.根据权利要求2所述的方法,其特征在于,基于所述倒排索引表获取当前搜索词对应的待选产品包括:
对当前搜索词进行分词处理,得到至少一个当前关键词;
在所述倒排索引表中检索所述当前关键词,以获取所述当前搜索词对应的待选产品。


5.根据权利要求4所述的方法,其特征在于,根据所述类目权重值和所述特征权重值计算所述待选产品的排序得分包括:
在所述倒排索引表中检索所述当前关键词,得到所述待选产品对应的索引分词;
根据所述待选产品对应的索引分词的数量确定所述待选产品的标题索引得分;
根据所述待选产品对应的当前关键词的数量确定所述待选产品的标题搜索得分;
计算所述当前搜索词的词频统计得分和逆向文档频率得分;
利用排序得分计算公式计算所述待选产品的排序得分;其中,所述排序得分计算公式是:

WI是所述标题索引得分,WS是所述标题搜索得分,C是所述类目权重值,Fi是所述特征权重值,Stf是所述词频统计得分,Sidf是所述逆向文档频率得分。


6.一种搜索排序的装置,其特征在于,包括:
分词模块,用于对历史搜索词对应的产品信息进行分词处理,得...

【专利技术属性】
技术研发人员:朱正义鲍宁天马俊何小锋
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1