一种应用于电子商务网站的信息匹配方法和系统技术方案

技术编号:5161908 阅读:200 留言:0更新日期:2012-04-11 18:40
本申请公开了一种应用于电子商务网站的信息匹配方法和系统,所述方法包括:搜索引擎服务器收集网络用户的每一类网络行为的特征数据,分别针对每一类网络行为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权重。接收某一特定网络用户的搜索请求,并根据所述搜索请求搜索获得若干条搜索结果。查询所述特定用户所属聚类中所有网络用户对所述每一条搜索结果的历史点选记录。根据所述所有网络用户的历史点选记录以及据以进行聚类的各类特征数据的权重计算获得所述若干条搜索结果的等级值。按照所述等级值由大到小对所述搜索结果进行排序,并将排序后的搜索结果返回给特定用户的用户终端。

【技术实现步骤摘要】

本申请涉及计算机数据处理
,特别是指一种应用于电子商务网站的信息 匹配方法和系统。
技术介绍
搜索引擎是一种寻找匹配信息的工具,其已经成为非常高效的信息发布、聚合和 展现平台,且在电子商务领域得到了广泛的应用。搜索引擎的工作原理是用户输入表明需 求的关键字,搜索引擎寻找与该关键字相匹配的信息,并将匹配的结果信息返回给该用户。 搜索引擎本身是根据关键字来识别用户需求的,而用户的需求千变万化,仅凭几个关键字 很难准确地表达出用户的真实意图。例如,用户输入“防水套”时,既可能是指“相机防水 套”,又可能是指“手机防水套”,用户既可能是想购买某种防水套,又可能只是想了解防水 套的相关信息。由于用户本身的生活方式、习惯、宗教信仰等个性化特征是各不相同的,而搜索引 擎无法识别用户的这种个性化差异,因此搜索引擎只能给不同的用户呈现千篇一律的搜索 结果;例如,同样是搜索“酒店”,预算充裕的用户可能需要了解的是豪华酒店,预算紧张的 用户可能需要了解的是经济酒店,向预算紧张的用户呈现豪华酒店的信息,只能浪费用户 过滤甄别信息的精力和时间,而且对于发布豪华酒店信息的商家而言也没有任何好处。再者,在手机等设备上,关键字的输入并不方便,而过短的关键字又不能表达清楚 用户想要的信息。例如用户搜索“审美理发”时,有那么多的连锁店,应该给用户呈现哪一 家店的信息?现在的搜索引擎只能要求用户反复精炼关键字进行调整,这样不但降低了搜 索效率,而且给用户的使用带来了极大的不便。可见,通过现有的搜索引擎实现的信息匹配,并不能保证所检索的到结果是用户最需要的信息。竞价排名也有信息发布、信息检索等功能。竞价排名的实质是按照信息发布者为 每次点击付费多少进行排序,将排序后靠前的结果展现在访问者面前,即,信息发布者通过 付费对展现的广告进行控制。可见,竞价排名所保证的是让付费更多的发布者的信息排在前面,而该排序最靠 前的信息是否是与用户需求最匹配的信息,并不是其关注的重点。因而,竞价排名更多的关 注了信息发布者即商家的利益,而忽略了信息接收者即用户的利益。传统广告也有信息发布等功能。互联网传统广告的发展已经历经了多代,从最开 始的选择主题栏目投放(例如在新浪的汽车频道投放汽车广告),到从页面提取关键字进 行关键字投放(例如Google的AdSense)再到对用户行为进行分析,通过聚类、路径分析等 方法,定向投放(例如doubleclick、腾迅),互联网广告效果越来越明显。然而,传统广告 的本质仍是“广告”,即,信息是按照广告主的意志而不是消费者的意志投放的。可见,传统广告并不是为用户提供其所需要的匹配信息,而是寻找潜在客户,将广 告的内容强行发送给其所认定的潜在客户。因而,其实质仍然是广告,无论如何改善,它仍然是在用户需要获取其它信息的时候出现,这必然会对用户的正常活动产生干扰。同样的, 传统广告也是更多的关注了信息发布者即商家的利益,而忽略了信息接收者即用户的利益。
技术实现思路
本申请实施例在于提供一种应用于电子商务网站的信息匹配方法和系统,通过为 信息接收者提供其最需要的信息,使得信息发布者和信息接收者之间实现双赢。本申请实施例提供了一种应用于电子商务网站的信息匹配方法,包括搜索引擎服务器收集网络用户的每一类网络行为的特征数据,分别针对每一类网 络行为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权 重;搜索引擎服务器接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得 若干条搜索结果;搜索引擎服务器查询所述特定用户所属聚类中所有网络用户对所述每一条搜索 结果的历史点选记录;搜索引擎服务器根据所述所有网络用户的历史点选记录以及据以进行聚类的各 类特征数据的权重计算获得所述若干条搜索结果的等级值;搜索引擎服务器按照所述等级值由大到小对所述搜索结果进行排序,并将排序后 的搜索结果返回给特定用户的用户终端。其中,所述网络行为包括网络交易行为或网络点评行为;所述网络行为的特征 数据包括网络交易记录或网络点评记录。其中,所述分别针对每一类网络行为按照所述特征数据对网络用户进行聚类的方 法包括首先将没有搜集到网络行为的特征数据的网络用户聚为一类;对于剩下的网络用户,根据所述网络行为的特征数据以及已配置的聚类数目进行 聚类;将聚类结果以数据表的形式保存在数据库中。其中,所述根据所述网络行为的特征数据以及已配置的聚类数目进行聚类的步骤 包括若所述网络行为的特征数据为网络交易记录,则根据所述网络交易记录中的商品 信息是否类似进行聚类,将购买过类似商品的网络用户聚为一类;聚类数达到已配置的数目时,聚类完成。其中,所述根据所述网络行为的特征数据以及已配置的聚类数目进行聚类的步骤 包括若所述网络行为的特征数据为网络点评记录,则根据网络用户点评的商家用户所 属的类目对网络用户进行聚类;或者,统计每两个商家用户的网络点评记录中相同的网络 用户的数量,根据所述网络用户的数量与对该商家用户进行网络点评的网络用户的总数量 的比值获得重叠比例,根据重叠比例计算商家用户之间的距离;根据所述距离对商家用户 进行聚类,再反过来根据商家用户的聚类对消费者用户进行聚类;聚类数达到已配置的数目时,聚类完成。其中,所述搜索引擎服务器收集网络用户的每一类网络行为的特征数据的方式包 括通过服务器日志分析系统收集、通过网络用户活动日志系统收集、通过地理信息系统收 集或通过第三方数据接口收集,或通过以上任意组合的方式收集。其中,所述方法还包括设置地理位置信息的权重;根据所述地理位置信息的权重和据以进行聚类的各类特征数据的权重,计算各条 检索结果的等级值,根据计算出的等级值按照从大到小的顺序对检索结果进行排序。其中,所述搜索引擎服务器接收某一特定网络用户的搜索请求,具体包括搜索引 擎服务器接收某一特定网络用户输入的搜索关键词,和/或搜索引擎服务器接收某一特定 网络用户的鼠标点击行为触发的搜索请求。本申请还提供了一种应用于电子商务网站的信息匹配系统,包括信息采集系统,收集网络用户的每一类网络行为的特征数据,分别针对每一类网 络行为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权 重;检索系统,接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干 条搜索结果,查询所述特定用户所属聚类中其他网络用户对所述每一条搜索结果的历史点 选记录,根据所述其他网络用户的历史点选记录以及据以进行聚类的各类特征数据的权重 计算获得所述若干条搜索结果的等级值,按照所述等级值由大到小对所述搜索结果进行排 序;结果页面生成系统,用于将所述排序后的检索结果显示给信息接收者。其中,所述检索系统具体包括搜索引擎,接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干 条搜索结果;排序系统,查询所述特定用户所属聚类中其他网络用户对所述每一条搜索结果的 历史点选记录,根据所述其他网络用户的历史点选记录以及据以进行聚类的各类特征数据 的权重计算获得所述若干条搜索结果的等级值,按照所述等级值由大到小对所述搜索结果 进行排序。其中,所述排序系统具体包括第一设置模块,用于设定据以进行聚类的各类特征数据的权重;查询模块,用于针对已获得的每一条检索结果,查询每一网络用户本文档来自技高网
...

【技术保护点】
一种应用于电子商务网站的信息匹配方法,其特征在于,包括:搜索引擎服务器收集网络用户的每一类网络行为的特征数据,分别针对每一类网络行为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权重;搜索引擎服务器接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干条搜索结果;搜索引擎服务器查询所述特定用户所属聚类中所有网络用户对所述每一条搜索结果的历史点选记录;搜索引擎服务器根据所述所有网络用户的历史点选记录以及据以进行聚类的各类特征数据的权重计算获得所述若干条搜索结果的等级值;搜索引擎服务器按照所述等级值由大到小对所述搜索结果进行排序,并将排序后的搜索结果返回给特定用户的用户终端。

【技术特征摘要】
1.一种应用于电子商务网站的信息匹配方法,其特征在于,包括搜索引擎服务器收集网络用户的每一类网络行为的特征数据,分别针对每一类网络行 为按照所述特征数据对网络用户进行聚类,设定据以进行聚类的各类特征数据的权重;搜索引擎服务器接收某一特定网络用户的搜索请求,并根据该搜索请求搜索获得若干 条搜索结果;搜索引擎服务器查询所述特定用户所属聚类中所有网络用户对所述每一条搜索结果 的历史点选记录;搜索引擎服务器根据所述所有网络用户的历史点选记录以及据以进行聚类的各类特 征数据的权重计算获得所述若干条搜索结果的等级值;搜索引擎服务器按照所述等级值由大到小对所述搜索结果进行排序,并将排序后的搜 索结果返回给特定用户的用户终端。2.根据权利要求1所述的方法,其特征在于,所述网络行为包括网络交易行为或网络 点评行为;所述网络行为的特征数据包括网络交易记录或网络点评记录。3.根据权利要求1所述的方法,其特征在于,所述分别针对每一类网络行为按照所述 特征数据对网络用户进行聚类的方法包括首先将没有搜集到网络行为的特征数据的网络用户聚为一类;对于剩下的网络用户,根据所述网络行为的特征数据以及已配置的聚类数目进行聚类;将聚类结果以数据表的形式保存在数据库中。4.根据权利要求3所述的方法,其特征在于,所述根据所述网络行为的特征数据以及 已配置的聚类数目进行聚类的步骤包括若所述网络行为的特征数据为网络交易记录,则根据所述网络交易记录中的商品信息 是否类似进行聚类,将购买过类似商品的网络用户聚为一类;聚类数达到已配置的数目时,聚类完成。5.根据权利要求3所述的方法,其特征在于,所述根据所述网络行为的特征数据以及 已配置的聚类数目进行聚类的步骤包括若所述网络行为的特征数据为网络点评记录,则根据网络用户点评的商家用户所属的 类目对网络用户进行聚类;或者,统计每两个商家用户的网络点评记录中相同的网络用户 的数量,根据所述网络用户的数量与对该商家用户进行网络点评的网络用户的总数量的比 值获得重叠比例,根据重叠比例计算商家用户之间的距离;根据所述距离对商家用户进行 聚类,再反过来根据商家用户的聚类对消费者用户进行聚类;聚类数达到已配置的数目时,聚类完成。6.根据权利要求1所述的方法,其特征在于,所述搜索引擎服务器收集网络用户的每 一类网络行为的特征数据的方式包括通过服务器日志分析系统收集、通过网络用户活动 日志系统收集、通过地理信息系统收集或通过第三方数据接口收集,或通过以上任意组合 的方式收集。7.根据权利要求1所述的方法,其特征在于,所述方法还包括设置地理位置信息的权重;根据所述地理位置信息的权重和据以进行聚类的各类特征数据的权重,计算各条检索结果的等级值,根据计算出的等级值按照从大到小的顺序对检索结果进行排序。8.根...

【专利技术属性】
技术研发人员:张旭刘青焱吴鹏松叶一火
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:KY[开曼群岛]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1