The present invention provides a processing method and device based on the data of the electronic commerce. The data processing method includes: acquiring data, the data including user search logs and logistics information; according to the data of the weight of keywords ranking based on regional value descending; according to the weight of keywords regional value descending rankings for keywords in value based on the characteristics of each region; according to the characteristic value of the corresponding annotation keywords hot region. The data processing method based on electronic commerce provided by this publication can dig out the regional features of keywords.
【技术实现步骤摘要】
基于电子商务的数据处理方法与装置
本公开涉及数据挖掘
,具体而言,涉及一种基于电子商务的数据处理方法与装置。
技术介绍
随着电商业务的发展,传统的“千人一面”搜索推荐系统已不能有效的满足用户需求,且我国幅员辽阔,各地域在气候、习俗、环境等方面存在较大的差异。目前电商的搜索系统主要根据商品与用户搜索关键词的文本相关性、商品本身信息质量等维度对商品进行展示排序,不涉及地域特征;商品推荐系统则主要依据用户过往行为、平台促销活动、人工运营等方式确定推荐商品,也没有将地域特征纳入推荐因子。因此,在现有的数据处理模式下,往往存在着搜索结果不能精准的贴近用户需求等问题。例如北方空调大部分需冷暖模式,而在华南地区大部分只需制冷模式,当华南地区的用户搜索空调时很难获取到精准贴合需求的搜索结果。此外,不纳入地域特征的推荐,也会导致流量转换损失,甚至引起用户反感,例如某个时期防雾霾口罩在北方热销,但推荐系统却将该类产品推荐给海南等地的用户。最后,在地方性传统节假日期间,地方特产、服饰等具有区域性的高销量,不纳入地域特征的搜索推荐系统对此“无能为力”。因此,需要一种能够对商品的地域特征进行挖掘的数据处理方法。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种基于电子商务的数据处理方法与装置,用于从用户的搜索行为日志以及商品的物流信息中,通过对数据进行清理、集成、计算等处理,输出关键词的地域特征画像,给搜索、推荐、广告系统提供基础数据支撑。根据本公开实施例的 ...
【技术保护点】
一种基于电子商务的数据处理方法,其特征在于,包括:获取数据,所述数据包括用户搜索日志和物流信息;根据所述数据获取基于地域的关键词权重值降序排名;根据所述基于地域的关键词权重值降序排名获取关键词在各地域的特征值;根据所述特征值标注关键词对应的热点地域。
【技术特征摘要】
1.一种基于电子商务的数据处理方法,其特征在于,包括:获取数据,所述数据包括用户搜索日志和物流信息;根据所述数据获取基于地域的关键词权重值降序排名;根据所述基于地域的关键词权重值降序排名获取关键词在各地域的特征值;根据所述特征值标注关键词对应的热点地域。2.如权利要求1所述的数据处理方法,其特征在于,所述获取基于地域的关键词权重值降序排名包括:根据所述搜索日志获取基于地域的关键词搜索PV;根据所述物流信息获取基于地域的关键词商品数;基于地域将所述关键词搜索PV与第一系数的乘积和所述关键词商品数与第二系数的乘积相加作为所述关键词在所述地域的权重值;去除权重值低于阈值的关键词,基于地域对关键词按所述权重值进行降序排名。3.如权利要求1所述的数据处理方法,其特征在于,根据所述基于地域的关键词权重值降序排名获取关键词在各地域的特征值包括:获取地域的总权重值降序排名;获取基于全部地域的关键词权重值降序排名;对于各地域,获取权重值既在地域排名前N又在全部地域排名前xN的关键词,N为自然数,x为扩展系数;基于每一关键词以及每一地域计算特征值:(一地域的一关键词的权重值/所述地域的总权重值)*(总地域数/所述关键词在地域排名前N的地域数)。4.如权利要求1所述的数据处理方法,其特征在于,所述标注关键词对应的热点地域包括:获取一关键词在各地域的特征值的方差;去除方差小于阈值的地域,获取剩余地域的方差降序排名;根据所述方差降序排名标注所述关键词对应的热点地域。5.如权利要求1所述的数据处理方法,其特征在于,所述获取数据包括去除所述数据中的爬虫数据、黑名单用户数据、黑名单IP数据、无法判断来源的数据以及长尾关键词。6.一种基于电子商务的数据处理装置,其特征在于,包括:数据清洗模块,设置为获取数据,所述数据包括用户搜索日志和物流信息;数据集成模块,设置为根据所述数据获取基于地域的关键词权...
【专利技术属性】
技术研发人员:陈贱辉,邵荣防,郝晖,史亚妮,谢文晶,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。