一种精确的注塑机选型方法技术

技术编号:15725364 阅读:113 留言:0更新日期:2017-06-29 13:59
本发明专利技术公开了一种精确的注塑机选型方法,包括将终端采集的用户的大量关于注塑机选型和购买行为和数据发送至服务器端;将采集到的数据进行除噪过滤、归一化处理和注塑机用户的特征提取;在服务器端执行基于皮尔逊相关系数和最小二乘法的注塑机选型算法,从用户的大量关于注塑机选型和购买行为和数据中计算用户对于注塑机的选型偏好,进行注塑机的个性化选型;从服务器端返回注塑机选型结果至终端并显示。相较于传统的注塑机选型方法,本发明专利技术公开的注塑机选型方法根据不同用户在注塑机选型和电商平台上的历史行为数据进行个性化的注塑机选型,充分体现了在大数据时代中智能化推荐引擎在传统行业改造中的作用。

【技术实现步骤摘要】
一种精确的注塑机选型方法
本专利技术涉及大数据信息推荐领域,尤其涉及到注塑机电商平台中的信息流推荐方法和注塑机选型服务平台的选型方法,具体涉及一种精确的注塑机选型方法。
技术介绍
塑料超过了钢铁,成为全世界的第一大工业材料,而我国如今成为全球塑料消费量级最大的国家,规模达2.6万亿。但是,由于注塑机器械的智能化正处于起步阶段,整个注塑行业的信息化水平较低和行业资源缺乏统一的规划,导致注塑机上下游产业出现人力成本高、效率低、产品附加值低等问题,严重制约了中国制造2025的整体发展。当前,传统注塑行业对注塑机的选型还停留在人工主观分析,即消耗人员和技术人员当面和客户沟通,根据客户需求通过人为的经验和主观分析从而给客户进行注塑机的选型并进行销售。这样的注塑机选型方式不仅效率低、耗费大量的资源(人力、物力和时间资源),同时没办法根据用户的个性化需求进行个性化注塑机的选型,严重制约了传统注塑行业和中国制造2025的整体发展。
技术实现思路
本专利技术的目的是为了解决在传统注塑行业在注塑机选型上现有技术中的上述缺陷,提供一种精确的注塑机选型方法。本专利技术的目的可以通过采取如下技术方案达到:一种精确的注塑机选型方法,所述方法包括以下步骤:将终端采集的用户的大量关于注塑机选型和购买行为和数据发送至服务器端;将采集到的注塑机用户数据进行除噪、过滤;将采集到的注塑机用户数据进行归一化处理;对注塑机用户数据进行选型特征偏好提取;在服务器端通过基于Spark大数据平台执行基于皮尔逊相关系数和最小二乘法的注塑机选型方法进行个性化的注塑机选型;从服务器端返回注塑机选型结果至终端并显示。进一步地,所述的将采集到的注塑机用户数据进行除噪、过滤的具体过程包括:以注塑机用户为键,对应用户关于注塑机选型系统和商城行为记录数为值,进行统计;将注塑机用户提取出来,u的大小代表数据记录的用户个数,利用SparkMllib的user.filter(line=>line.contains(a))函数方法将原始数据中的所有关于注塑机用户a的记录筛选出来,并构造关于用户a的键值对;移除注塑机行为数据记录中的噪声数据,所述噪声数据包括用户的恶意刷单、失误操作。进一步地,所述的将采集到的注塑机用户数据进行归一化处理额具体过程包括:采用Z-score标准化方法对不同注塑机选型行为和注塑机商城购买行为的数值取值进行归一化处理,具体方法为:其中,u为所有样本数据的均值,σ为所有样本数据的标准差。进一步地,所述的对注塑机用户数据进行选型特征偏好提取的具体过程包括:将原始数据中的所有关于用户a的注塑机行为记录筛选出来,并构造关于用户a的键值对;将用户选型参数中选择、浏览、收藏、加购物车、与购买的基础评分分别设置为1、2、3、4、5;对用户的关于注塑机行为基础评分分别在其基础上加上不同适当权值分数加成,最后得到所有与用户a相关注塑机商品的评价;循环上述步骤流程,将其他剩余用户的内容提取出来。进一步地,所述的在服务器端通过基于Spark大数据平台执行基于皮尔逊相关系数和最小二乘法的注塑机选型方法进行个性化的注塑机选型的具体过程包括:采用皮尔逊相关系数计算注塑机用户之间的相似度;描述用户对注塑机选型需求问题;采用交替最小二乘法预测用户的注塑机选型需求;在Spark大数据平台实现基于采用交替最小二乘法预测用户的注塑机选型需求。进一步地,所述的采用皮尔逊相关系数计算注塑机用户之间的相似度的具体过程如下:利用两个注塑机用户之间的协方差和标准差计算皮尔逊相关系数:其中,Cov(Xuser1,Xuser2)代表两个注塑机用户之间的协方差,σXuser1和σXuser2分别代表两个注塑机用户的标准差;若需要对样本的协方差和标准差进行估算,可得到样本相关系数,即样本皮尔逊系数:其中:是Xi样本的标准分数,是Yi样本的标准分数;是Xi的样本平均数,是Yi的样本平均数;σx是Xi的样本标准差,σy是Yi的样本标准差。进一步地,所述的描述用户对注塑机选型需求问题的具体过程如下:用户u对商品i的兴趣偏好可以表示为:其中Xu,k是用户u的兴趣和第k个隐类的关系,而Yi,k是第i个物品和第k个隐类直接的关系;求解X和Y的过程可以转化为求损失函数最小的问题:其中λ是正则化项的系数,式中右边两项的引入是为了防止过拟合。进一步地,所述的采用交替最小二乘法预测用户的注塑机选型需求的具体过程如下:利用最小二乘法求解X,然后固定X,求解Y,如此交替往复直至收敛,即所谓交替最小二乘法;先固定Y,将Y带入损失函数L(X,Y)并对Xu求偏导,令导数=0,得到:Xu=(YTY+λI)-1YTru,同理固定X,可得:Yu=(XTX+λI)-1XTri,迭代步骤,首先随机选取Y,利用固定Y的公式更新得到X,然后利用固定X的公式更新Y,直到均方根误差很小或达到迭代次数:进一步地,所述的在Spark大数据平台实现基于采用交替最小二乘法预测用户的注塑机选型需求具体过程如下:定义参数rank:模型中隐语义因子的个数;定义参数iterations:迭代的次数,所述参数iterations的取值范围为:10-20;定义参数lambda:惩罚函数的因数,是ALS的正则化参数,所述参数lambda的取值范围为:0.005-0.02;通过调整上述参数,从而优化注塑机商品的选型算法,使注塑机选型结果的均方差逐渐变小。进一步地,所述的在Spark大数据平台实现基于采用交替最小二乘法预测用户的注塑机选型需求在SparkMLlib中实现步骤如下:使用ALS训练的注塑机行为数据通过函数方法ALS.train()建立注塑机选型模型;通过model.predict()方法使用注塑机选型模型对用户对注塑机进行预测评分,得到预测评分的数据集;使用ratings.map{caseRating(user,item,rate)}方法将真实注塑机评分数据集与注塑机预测评分数据集进行合并;利用ratesAndPreds.map()计算均方差;注塑机选型的结果可以以用户id为key,结果为value存入hbase中;使用predictions.collect.sortB()对注塑机预测选型的结果按预测的评分排序;对注塑机预测结果按用户进行分组,然后合并选型结果。本专利技术相对于现有技术具有如下的优点及效果:1、本专利技术运用皮尔逊相关系数聚类算法计算用户的相似度,有效提高了用户相似度的准确性,同时用户的注塑机需求挖掘能力强,不但保留了用户的感兴趣的注塑机,还能通过用户在注塑选型和注塑商城过程中产生的行为数据挖掘潜在注塑机需求。2、本专利技术运用交替最小二乘法计算用户对注塑机的评分和最小均方误差,从而对注塑机选型进行有效的预测,大大提高的预测的准确性和有效性。3、本专利技术结合运用Spark并行计算框架,结合当前大数据趋势与技术特点,大大提高注塑机选型的选型效率。附图说明图1是本专利技术公开的精确的注塑机选型方法的原理图;图2是本专利技术公开的精确的注塑机选型方法的流程步骤图;图3是本专利技术中基于皮尔逊相关系数和最小二乘法的注塑机选型算法的流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然本文档来自技高网...
一种精确的注塑机选型方法

【技术保护点】
一种精确的注塑机选型方法,其特征在于,所述方法包括以下步骤:将终端采集的用户的大量关于注塑机选型和购买行为和数据发送至服务器端;将采集到的注塑机用户数据进行除噪、过滤;将采集到的注塑机用户数据进行归一化处理;对注塑机用户数据进行选型特征偏好提取;在服务器端通过基于Spark大数据平台执行基于皮尔逊相关系数和最小二乘法的注塑机选型方法进行个性化的注塑机选型;从服务器端返回注塑机选型结果至终端并显示。

【技术特征摘要】
1.一种精确的注塑机选型方法,其特征在于,所述方法包括以下步骤:将终端采集的用户的大量关于注塑机选型和购买行为和数据发送至服务器端;将采集到的注塑机用户数据进行除噪、过滤;将采集到的注塑机用户数据进行归一化处理;对注塑机用户数据进行选型特征偏好提取;在服务器端通过基于Spark大数据平台执行基于皮尔逊相关系数和最小二乘法的注塑机选型方法进行个性化的注塑机选型;从服务器端返回注塑机选型结果至终端并显示。2.根据权利要求1所述的一种精确的注塑机选型方法,其特征在于,所述的将采集到的注塑机用户数据进行除噪、过滤的具体过程包括:以注塑机用户为键,对应用户关于注塑机选型系统和商城行为记录数为值,进行统计;将注塑机用户提取出来,u的大小代表数据记录的用户个数,利用SparkMllib的user.filter(line=>line.contains(a))函数方法将原始数据中的所有关于注塑机用户a的记录筛选出来,并构造关于用户a的键值对;移除注塑机行为数据记录中的噪声数据,所述噪声数据包括用户的恶意刷单、失误操作。3.根据权利要求1所述的一种精确的注塑机选型方法,其特征在于,所述的将采集到的注塑机用户数据进行归一化处理额具体过程包括:采用Z-score标准化方法对不同注塑机选型行为和注塑机商城购买行为的数值取值进行归一化处理,具体方法为:其中,u为所有样本数据的均值,σ为所有样本数据的标准差。4.根据权利要求1所述的一种精确的注塑机选型方法,其特征在于,所述的对注塑机用户数据进行选型特征偏好提取的具体过程包括:将原始数据中的所有关于用户a的注塑机行为记录筛选出来,并构造关于用户a的键值对;将用户选型参数中选择、浏览、收藏、加购物车、与购买的基础评分分别设置为1、2、3、4、5;对用户的关于注塑机行为基础评分分别在其基础上加上不同适当权值分数加成,最后得到所有与用户a相关注塑机商品的评价;循环上述步骤流程,将其他剩余用户的内容提取出来。5.根据权利要求1所述的一种精确的注塑机选型方法,其特征在于,所述的在服务器端通过基于Spark大数据平台执行基于皮尔逊相关系数和最小二乘法的注塑机选型方法进行个性化的注塑机选型的具体过程包括:采用皮尔逊相关系数计算注塑机用户之间的相似度;描述用户对注塑机选型需求问题;采用交替最小二乘法预测用户的注塑机选型需求;在Spark大数据平台实现基于采用交替最小二乘法预测用户的注塑机选型需求。6.根据权利要求5所述的一种精确的注塑机选型方法,其特征在于,所述的采用皮尔逊相关系数计算注塑机用户之间的相似度的具体过程如下:利用两个注塑机用户之间的协方差和标准差计算皮尔逊相关系数:其中,Cov(Xuser1,Xuser2)代表两个注塑机用户之间的协方差,σXuser1和σXuser2分别代表两个注塑机用户的标准差;若需要对样本的协方差和标准差进行估算,可得到样本相关系数,即样本皮尔逊系数:

【专利技术属性】
技术研发人员:向友君何家成吴宗泽谢胜利张勰苏春晨何煦张莉婷李凯鑫
申请(专利权)人:华南理工大学广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1