一种基于大数据的车货匹配方法及系统技术方案

技术编号:24331368 阅读:59 留言:0更新日期:2020-05-29 19:43
本发明专利技术提供了一种基于大数据的车货匹配方法及系统,其方法包括:首先,利用司机历史交易记录,分析得到车货匹配算法中的各指标的得分情况;然后,进行权重的计算,即根据司机过去喜欢什么样的货源来产生刻画此用户喜好的特征向量;最后,计算货源在这些指标下的匹配度,并将匹配度较高的前N个货源推荐给司机。本发明专利技术的有益效果是:通过推荐系统优选匹配度高的司机进行通知,以此提高成单率和叫车效率。

A vehicle cargo matching method and system based on big data

【技术实现步骤摘要】
一种基于大数据的车货匹配方法及系统
本专利技术涉及大宗商品物流领域,尤其涉及一种基于大数据的车货匹配方法及系统。
技术介绍
物流企业不定期的需要货车运力来运输自己的大宗商品。货车司机不会一直在线关注货源信息网站。货源和司机的匹配度不高,导致常规的广告手段效率低下,对司机造成骚扰,同时浪费企业资源。
技术实现思路
为了解决上述问题,本专利技术提供了一种基于大数据的车货匹配方法及系统,一种基于大数据的车货匹配方法,主要包括以下步骤:S101:获取多个司机的历史交易记录;S102:根据各司机的历史交易记录,获取各司机的偏好特征向量;S103:获取所有新货源的指标属性,并将各新货源的指标属性拆分为对应的属性标签;所述新货源有多个,每个新货源对应多个属性标签;S104:根据各司机的特征向量及各新货源的属性标签,获得各司机相对于每个新货源的偏好向量,进而采用余弦相似度计算公式,计算出各司机和各个新货源之间的相似度值;S105:对于每个司机,将其对应的多个新货源的相似度值从大到小进行排序,并选择前N个相似度值对应的新货源推荐给司机;其中,N为预设值,且N大于0。进一步地,步骤S101中,通过大数据平台,抽取线上系统的数据到数据仓库,进而提取司机历史交易记录;所述历史交易记录中包括对应司机交易过的所有历史货源集合;所述历史货源集合中包括多个货源,每个货源对应有多个属性标签。进一步地,步骤S102中,针对某个司机,根据所述历史交易记录,获取该司机的特征向量的方法如下:计算所述历史货源集合中每个货源下各属性标签的偏好情况,得出对应指标后,进行权重的计算,再得出该司机对某一具体标签的权重偏好,即根据司机过去喜欢什么样的货源来产生刻画此司机喜好的特征向量,把司机所有交易过的货源对应的向量的平均值作为此用户的特征向量;具体步骤如下:S201:将该司机的历史货源集合表示为D=[d1,d2,…,dj,…,dn];其中,dj表示第j个货源,j=1,2,…,n,n为历史货源集合中的货源总数;S202:将每个货源的属性标签集合表示为T=[t1,t2,…,ti,…,tm];其中,ti表示该货源的第i个属性标签;i=1,2,…,m,m为货源的属性标签总数;S203:结合S201和S202,将该用户对货源dj的喜好的特征向量表示为:dj=[w1j,w2j,…,wij,…,wnj];其中,wij表示第j个货源的第i个属性标签在货源dj中所占的权重大小;其中,wij的计算公式如公式(1)所示:S204:把司机与历史货源集合中所有货源对应的特征向量的平均值作为此司机的偏好特征向量W;即,W=[w1,w2,…,wi,…,wm];其中,表示司机对第i个属性标签的偏好值,将司机对所有历史货源的第i个属性标签的权重大小的平均值作为其对第i个属性标签的偏好值,即进一步地,步骤S104中,针对某个司机和某个新货源之间的偏好向量r,计算公式如式(2)所示:r=[x1,x2,…,xi,…,xm](2)上式中,xi为该司机对该货源的第i个属性标签的偏好值,xi的值等于该司机的偏好特征向量中的wi的值。进一步地,步骤S104中,采用余弦相似度计算公式,计算各司机和各个新货源之间的相似度值时;针对司机s和某个新货源A之间的相似度值RsA的计算公式如式(3)所示:上式中,Ai表示司机s对货源A的第i个属性标签的偏好值;Bi为新货源A对于第i个属性标签的权重定义值,为预设值。进一步地,一种基于大数据的车货匹配系统,其特征在于:包括以下模块:记录获取模块,用于获取多个司机的历史交易记录;偏好特征向量获取模块,用于根据各司机的历史交易记录,获取各司机的偏好特征向量;属性标签获取模块,用于获取所有新货源的指标属性,并将各新货源的指标属性拆分为对应的属性标签;所述新货源有多个,每个新货源对应多个属性标签;相似度计算模块,用于根据各司机的特征向量及各新货源的属性标签,获得各司机相对于每个新货源的偏好向量,进而采用余弦相似度计算公式,计算出各司机和各个新货源之间的相似度值;推荐模块,用于对于每个司机,将其对应的多个新货源的相似度值从大到小进行排序,并选择前N个相似度值对应的新货源推荐给司机;其中,N为预设值,且N大于0。进一步地,偏好特征向量获取模块中,通过大数据平台,抽取线上系统的数据到数据仓库,进而提取司机历史交易记录;所述历史交易记录中包括对应司机交易过的所有历史货源集合;所述历史货源集合中包括多个货源,每个货源对应有多个属性标签。进一步地,偏好特征向量获取模块中,针对某个司机,根据所述历史交易记录,获取该司机的特征向量的方法如下:计算所述历史货源集合中每个货源下各属性标签的偏好情况,得出对应指标后,进行权重的计算,再得出该司机对某一具体标签的权重偏好,即根据司机过去喜欢什么样的货源来产生刻画此司机喜好的特征向量,把司机所有交易过的货源对应的向量的平均值作为此用户的特征向量;具体包括如下单元:历史货源集合单元,用于将该司机的历史货源集合表示为D=[d1,d2,…,dj,…,dn];其中,dj表示第j个货源,j=1,2,…,n,n为历史货源集合中的货源总数;属性标签集合单元,用于将每个货源的属性标签集合表示为T=[t1,t2,…,ti,…,tm];其中,ti表示该货源的第i个属性标签;i=1,2,…,m,m为货源的属性标签总数;喜好特征向量获取单元,用于结合历史货源集合单元和属性标签集合单元,将该用户对货源dj的喜好的特征向量表示为:dj=[w1j,w2j,…,wij,…,wnj];其中,wij表示第j个货源的第i个属性标签在货源dj中所占的权重大小;其中,wij的计算公式如公式(4)所示:偏好特征向量获取单元,用于把司机与历史货源集合中所有货源对应的特征向量的平均值作为此司机的偏好特征向量W;即,W=[w1,w2,…,wi,…,wm];其中,表示司机对第i个属性标签的偏好值,将司机对所有历史货源的第i个属性标签的权重大小的平均值作为其对第i个属性标签的偏好值,即进一步地,相似度计算模块中,针对某个司机和某个新货源之间的偏好向量r,计算公式如式(5)所示:r=[x1,x2,…,xi,…,xm](5)上式中,xi为该司机对该货源的第i个属性标签的偏好值,xi的值等于该司机的偏好特征向量中的wi的值。进一步地,相似度计算模块中,采用余弦相似度计算公式,计算各司机和各个新货源之间的相似度值时;针对司机s和某个新货源A之间的相似度值RsA的计算公式如式(6)所示:上式中,Ai表示司机s对货源A的第i个属性标签的偏好值;Bi为新货源A对于第i个属性标签的权重定义值,为预设值。本专利技术提供的技术方案带来的有益效果是:本专利技术所提出的技术方案可以优选匹配度高的司机进行通知,以此提高成单率和叫车效率。附图说明...

【技术保护点】
1.一种基于大数据的车货匹配方法,其特征在于:包括以下步骤:/nS101:获取多个司机的历史交易记录;/nS102:根据各司机的历史交易记录,获取各司机的偏好特征向量;/nS103:获取所有新货源的指标属性,并将各新货源的指标属性拆分为对应的属性标签;所述新货源有多个,每个新货源对应多个属性标签;/nS104:根据各司机的特征向量及各新货源的属性标签,获得各司机相对于每个新货源的偏好向量,进而采用余弦相似度计算公式,计算出各司机和各个新货源之间的相似度值;/nS105:对于每个司机,将其对应的多个新货源的相似度值从大到小进行排序,并选择前N个相似度值对应的新货源推荐给司机;其中,N为预设值,且N大于0。/n

【技术特征摘要】
1.一种基于大数据的车货匹配方法,其特征在于:包括以下步骤:
S101:获取多个司机的历史交易记录;
S102:根据各司机的历史交易记录,获取各司机的偏好特征向量;
S103:获取所有新货源的指标属性,并将各新货源的指标属性拆分为对应的属性标签;所述新货源有多个,每个新货源对应多个属性标签;
S104:根据各司机的特征向量及各新货源的属性标签,获得各司机相对于每个新货源的偏好向量,进而采用余弦相似度计算公式,计算出各司机和各个新货源之间的相似度值;
S105:对于每个司机,将其对应的多个新货源的相似度值从大到小进行排序,并选择前N个相似度值对应的新货源推荐给司机;其中,N为预设值,且N大于0。


2.如权利要求1所述的一种基于大数据的车货匹配方法,其特征在于:步骤S101中,通过大数据平台,抽取线上系统的数据到数据仓库,进而提取司机历史交易记录;所述历史交易记录中包括对应司机交易过的所有历史货源集合;所述历史货源集合中包括多个货源,每个货源对应有多个属性标签。


3.如权利要求2所述的一种基于大数据的车货匹配方法,其特征在于:步骤S102中,针对某个司机,根据其历史交易记录,获取该司机的特征向量的方法如下:
S201:将该司机的历史货源集合表示为D=[d1,d2,...,dj,...,dn];其中,dj表示第j个货源,j=1,2,...,n,n为历史货源集合中的货源总数;
S202:将每个货源的属性标签集合表示为T=[t1,t2,...,ti,...,tm];其中,ti表示该货源的第i个属性标签;i=1,2,...,m,m为货源的属性标签总数;
S203:结合S201和S202,将该用户对货源dj的喜好的特征向量表示为:dj=[w1j,w2j,...,wij,...,wnj];其中,wij表示第j个货源的第i个属性标签在货源dj中所占的权重大小;其中,wij的计算公式如公式(1)所示:



S204:把该司机与历史货源集合中所有货源对应的特征向量的平均值作为此司机的偏好特征向量W;即,W=[w1,w2,...,wi,...,wm];其中,wi表示司机对第i个属性标签的偏好值,将司机对所有历史货源的第i个属性标签的权重大小的平均值作为其对第i个属性标签的偏好值,即


4.如权利要求3所述的一种基于大数据的车货匹配方法,其特征在于:步骤S104中,针对某个司机和某个新货源之间的偏好向量r,计算公式如式(2)所示:
r=[x1,x2,…,xi,…,xm](2)
上式中,xi为该司机对该货源的第i个属性标签的偏好值,xi的值等于该司机的偏好特征向量中的wi的值。


5.如权利要求4所述的一种基于大数据的车货匹配方法,其特征在于:步骤S104中,采用余弦相似度计算公式,计算各司机和各个新货源之间的相似度值时;针对司机s和某个新货源A之间的相似度值RSA的计算公式如式(3)所示:



上式中,Ai表示司机s对货源A的第i个属性标签的偏好值;Bi为新货源A对于第i个属性标签的权重定义值,为预设值。


6.一种基于大数据的车货匹配系统,其特征在于:包括以下模块:...

【专利技术属性】
技术研发人员:王义聂磊彭寅冬刘鑫帮吴凡
申请(专利权)人:武汉物易云通网络科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1