一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统技术方案

技术编号:38538984 阅读:11 留言:0更新日期:2023-08-19 17:07
一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,包括产品信息数据库模块、产品大数据分析模块和多平台信息对比模块,针对目前同一种跨境电商产品在跨国交易中存在原料差异难以追踪和使用功能不统一等问题,利用信息溯源数据库结合大数据分析算法实时分析对比同一产品的信息对比使得买家获取更为透明的产品权益,标记跨境电商产品在购买时的动态信息。其应用层面广,经济成本低,可以推广至国际社会应用,带来良好的社会和经济效益。效益。效益。

【技术实现步骤摘要】
一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统


[0001]本专利技术涉及跨境电商交易领域,具体地说,涉及一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统。

技术介绍

[0002]跨境电子商务是指分属不同关境的交易主体,通过电子商务平台达成交易、进行电子支付结算,并通过跨境电商物流及异地仓储送达商品,从而完成交易的一种国际商业活动。延续和完善跨境电子商务零售进口政策并扩大适用范围,扩大开放更大激发消费潜力;部署推进物流枢纽布局建设,促进提高国民经济运行质量和效率。跨境电子商务作为推动经济一体化、贸易全球化的技术基础,具有非常重要的战略意义。跨境电子商务不仅冲破了国家间的障碍,使国际贸易走向无国界贸易,同时它也正在引起世界经济贸易的巨大变革。对企业来说,跨境电子商务构建的开放、多维、立体的多边经贸合作模式,极大地拓宽了进入国际市场的路径,大大促进了多边资源的优化配置与企业间的互利共赢;对于消费者来说,跨境电子商务使他们非常容易地获取其他国家的信息并买到物美价廉的商品。但目前同一种跨境电商产品在跨国交易中存在原料差异难以追踪和使用功能不统一等问题仍然存在,本专利技术利用信息溯源数据库结合大数据分析算法实时分析对比同一产品的信息对比使得买家获取更为透明的产品权益,标记跨境电商产品在购买时的动态信息。其应用层面广,经济成本低,可以推广至国际社会应用,带来良好的社会和经济效益。

技术实现思路

[0003]本专利技术的目的在于提供一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,提供了一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,包括产品信息数据库模块、产品大数据分析模块和多平台信息对比模块;具体过程描述如下:
[0005]S1.将同一种跨境产品成批制地记录原始的属性信息,并且标记相对于跨境电商中不同平台内的所属信息;
[0006]S2.基于产品属性信息构建其在数据库中的索引方式,利用哈希算法压缩数据库存储容量和精准信息摘要,在此基础上,构建服务于同一跨境电商系统中不同平台搭载的系统数据库;
[0007]S3.利用大数据分析算法在系统数据库中提取同一产品在不同平台中出售信息的关键特征和所属类别,并将特征信息以控制变量的形式更新至系统数据库中,对产品信息进行分类和特征分析;
[0008]S4.将系统数据库作为驱动跨境电商平台的关联性基础数据库,同一类产品根据数据库的索引标记获取分析好的特征信息;
[0009]S5.在特征分析结果的基础上,利用对比分析算法,得到买家在购买产品时所关注产品属性的购买推荐和信息对比,提供购买引导。
[0010]进一步的,所述S1中同一种跨境产品成批制地记录原始的属性信息,包括:产品原产地,材料组成,用量和价格信息的组合。
[0011]进一步的,所述S2中基于产品属性信息构建其在数据库中的索引方式,详细过程如下:创建索引前,统计组件汇总和记录与信息特征对应的统计数据,然后利用这些数据根据排序算法和检索模型确定用户希望获取的数据:
[0012](1)分析查询以及文档:将查询的分析和处理与文档的处理步骤相对应,即将查询中的单词转换为与处理文档文本时生成单词相同的形式,分析主要包括词法分析,即对文本内容所包含的语素信息、词汇信息和短语信息进行识别,文件分析的结果是文件对应的结构和相关内容的表示;(2)去除停用词:停用词是一些高频词,或者是文本信息、文档文件中使用的介词,文档中的介词对句子结构有帮助,有助于描述产品信息的主题,去掉介词既可以减小索引的大小,又能够减少相应的内存空间占用,还可以提高索引的速度和效果;(3)提取词干:在检索过程中,词干提取能使信息检索与相关语义匹配。若一词有形变,或源自多种形式,则可将其简化为同一词干;(4)语义匹配:根据同一词干的同音字和同义错别字的识别匹配系统数据库中的信息数据;(5)结果反馈:查询结果以UI界面的形式反馈给用户。
[0013]进一步的,所述S2中利用哈希算法压缩数据库存储容量和精准信息摘要,详细过程如下:
[0014]对数据进行标准化滤波处理,数据预处理的定义为:
[0015][0016]其中,Q(a,b)为哈希处理时数据在a行b列的数据模板,Q
(x)
(a
i
,b
j
)表示x类别数据的a类储存量中b类精准信息的第(i,j)个数据;Q
(1)
(a,b)是带入实际的常数后的数据,其计算方式为:
[0017][0018]Q
(1)
(a
i
,b
j
)表示第一类别数据的a类储存量中b类精准信息的第(1,1)个数据,在进行资源负载均衡调节的时候,数据的个数发生一定的改变。因此需要对数据的格式进行转化,且进行图像数据的预处理,在数据的预处理过程中,采用单指令多数据流进行数据的处理,多个数据的处理器连接在同一个控制器上,可以进行数据的并行处理,采用哈希算法的低秩表达进行数据的去噪,将数据的低秩表达最小化处理:
[0019][0020]其中,R表示低秩表达最小化处理的处理结果,‖R‖为处理矩阵,n为矩阵中的数据个数,数据J的低秩表达方式设置为I,则存在:
[0021]min‖J‖+α‖I‖=tr[JI][0022]其中,α表示拉格朗日乘数,在哈希算法的低秩表达方式中,tr[JI]表示输入的数据J,I为该数据的哈希码;使用改进的哈希算法,主要改进了哈希处理数据模板以及数据去噪时的低秩表达最小化处理方法,通过对哈希算法进行改进,改进后可针对本专利技术中的数据量级进行针对性更强的去噪处理,去噪效果更好,同时使数据信息更加精准。
[0023]进一步的,所述S2中系统数据库结合SQL结构型与NoSQL非结构型的特点,主要以MongoDB数据库为基础方式。
[0024]进一步的,所述S3中利用大数据分析算法在系统数据库中提取同一产品在不同平台中出售信息的关键特征和所属类别,详细过程如下:
[0025]引入K

Means聚类分析方法对产品出售信息的关键特征和所属类别进行处理,将出售信息的关键特征和所属类别聚类成集,并使用聚类中心点作为该类数据的代表,K

Means聚类分析方法是一种无监督分类算法,假设有n个样本的数据集:
[0026]X={x1,x2,

,x
n
}
[0027]算法目标为将数据集聚类到k个簇C={c1,c2,

,c
k
},使得样本点到簇中心的误差平方和最小,首先需要在样本中随机选取k个初始质心,对比计算样本点到各个质心的距离d
i
=‖x

μ
i
‖2,然后将样本点划到最近的簇中;再根据各簇中划入的样本点,重新计算簇中心μ
i
,并重本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,包括产品信息数据库模块、产品大数据分析模块和多平台信息对比模块;具体过程描述如下:S1.将同一种跨境产品成批制地记录原始的属性信息,并且标记相对于跨境电商中不同平台内的所属信息;S2.基于产品属性信息构建其在数据库中的索引方式,利用哈希算法压缩数据库存储容量和精准信息摘要,在此基础上,构建服务于同一跨境电商系统中不同平台搭载的系统数据库;S3.利用大数据分析算法在系统数据库中提取同一产品在不同平台中出售信息的关键特征和所属类别,并将特征信息以控制变量的形式更新至系统数据库中,对产品信息进行分类和特征分析;S4.将系统数据库作为驱动跨境电商平台的关联性基础数据库,同一类产品根据数据库的索引标记获取分析好的特征信息;S5.在特征分析结果的基础上,利用对比分析算法,得到买家在购买产品时所关注产品属性的购买推荐和信息对比,提供购买引导。2.根据权利要求1所述一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,其特征在于,所述S1中同一种跨境产品成批制地记录原始的属性信息,包括:产品原产地,材料组成,用量和价格信息的组合。3.根据权利要求1所述一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,其特征在于,所述S2中基于产品属性信息构建其在数据库中的索引方式,详细过程如下:创建索引前,统计组件汇总和记录与信息特征对应的统计数据,然后利用这些数据根据排序和检索模型确定用户希望获取的数据:(1)分析查询关键词:将查询关键词的分析和处理与文档的分析和处理步骤相对应,即将查询中的数字,单词转换为与处理文档文本时生成单词相同的形式,分析主要包括词法分析,即对文本内容所包含的语素信息、词汇信息和短语信息进行识别,文件分析的结果是文件对应的结构和相关内容的表示;(2)去除停用词:停用词是一些高频词,或者是文本信息、文档文件中使用的介词,文档中的介词对句子结构有帮助,有助于描述产品信息的主题,去掉介词既可以减小索引的大小,又能够减少相应的内存空间占用,还可以提高索引的速度和效果;(3)提取词干:在检索过程中,词干提取能使信息检索与相关语义匹配,若一词有形变,或源自多种形式,则可将其简化为同一词干;(4)语义匹配:根据同一词干的同音字和同义错别字的识别匹配系统数据库中的信息数据;(5)结果反馈:查询结果以UI界面的形式反馈给用户。4.根据权利要求1所述一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,其特征在于,所述S2中利用改进的哈希算法压缩数据库存储容量和精准信息摘要,详细过程如下:对数据进行标准化滤波处理,数据预处理的定义为:其中,Q(a,b)为哈希处理时数据在a行b列的数据模板,Q
(x)
(a
i
,b
j
)表示x类别数据的a类
储存量中b类精准信息的第(i,j)个数据;Q
(0)
(a,b)是带入实际的常数后的数据,其计算方式为:Q
(1)
(a,b)表示第一类别数据的a类储存量中b类精准信息的数据,在进行资源负载均衡调节的时候,数据的个数发生一定的改变,在数据的预处理过程中,采用单指令多数据流进行数据的处理,多个数据的处理器连接在同一个控制器上,进行数据的并行处理,采用哈希算法的低秩表达进行数据的去噪,将数据的低秩表达最小化处理:其中,R表示低秩表达最小化处理的处理结果,||R||为处理矩阵,n为矩阵中的数据个数,数据J的低秩表达方式设置为I,则存在:min‖J‖+α‖I‖=tr[JI]其中,α表示拉格朗日乘数,在哈希算法的低秩表达方式中,tr[JI]表示输入的数据J,I为该数据的哈希码。5.根据权利要求1所述一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统,其特征在于,所述S2中系统数据库结合SQL结构型与NoSQL非结构型的特点,主要以MongoDB数据库为基础方式进行搭建。6.根据权利要求1所述一种基...

【专利技术属性】
技术研发人员:聂放明王洪平
申请(专利权)人:广东德澳智慧医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1