一种基于大数据技术的中药生产工艺参数分析系统技术方案

技术编号:27315774 阅读:17 留言:0更新日期:2021-02-10 09:47
一种基于大数据技术的中药生产工艺参数分析系统,包括参数确定模块、数据收集模块、数据预处理模块和生产质量指标预测模块,所述参数确定模块用于确定中药生产的生产工艺参数和质量指标参数,所述数据收集模块用于收集所述生产工艺参数数据以及所述生产工艺参数对应的质量指标参数数据,所述数据预处理模块用于对收集到的生产工艺参数进行预处理,所述质量指标预测模块建立根据生产工艺参数数据对中药生产的质量指标进行预测的模型。本发明专利技术的有益效果:基于大数据技术和数据挖掘方法对中药生产的历史数据进行分析,利用BP神经网络建立生产质量指标预测模型进行中药生产质量的预测,实现了生产工艺参数的优化和质量指标的提高。提高。提高。

【技术实现步骤摘要】
一种基于大数据技术的中药生产工艺参数分析系统


[0001]本专利技术创造涉及大数据领域,具体涉及一种基于大数据技术的中药生产工艺参数分析系统。

技术介绍

[0002]在中药的智能生产中,为了提高中药生产的质量指标就需要对中药生产过程中的生产工艺参数不断的优化,以此保证生产工艺的稳定性和产品质量的可靠性。目前对于生产工艺的优化还处于初始阶段,常用方法是在实验环境下通过设计对比实验,得到最优的生产工艺参数方案呢,然后移植到生产环境中,为了完成对比实验,往往需要巨大的人力物力投入。随着中药智能制造的发展,目前可以获取大规模生产数据,而且这些实际生产数据与实验室的实验数据相比拥有更多的实际意义,里面包含了大量生产过程中遇到的极端情况。利用生产数据经由数据挖掘建立质量指标预测模型优化工艺,代替通过实际对比实验优化工艺的方法,是未来的一个趋势,也是一个待解决的问题。

技术实现思路

[0003]针对上述问题,本专利技术旨在提供一种基于大数据技术的中药生产工艺参数分析系统。
[0004]本专利技术创造的目的通过以下技术方案实现:
[0005]一种基于大数据技术的中药生产工艺参数分析系统,包括参数确定模块、数据收集模块、数据预处理模块和质量指标预测模块,所述参数确定模块包括质量指标确定单元和生产工艺参数确定单元,所述质量指标确定单元用于确定中药生产规定的质量指标参数,所述生产工艺参数确定单元用于确定影响所述质量指标参数的生产工艺参数,所述数据收集模块用于收集所述生产工艺参数数据以及所述生产工艺参数数据对应的质量指标参数数据,所述数据预处理模块用于对收集到的生产工艺参数数据进行预处理,去除生产工艺参数数据中的噪声数据,所述质量指标预测模块利用预处理后的生产工艺参数数据和其所对应的质量指标参数数据对BP神经网络进行训练,从而建立根据生产工艺参数数据对中药生产的质量指标参数数据进行预测的BP神经网络模型。
[0006]优选地,所述数据预处理模块用于对收集到的生产工艺参数数据进行聚类,并根据聚类结果去除所述生产工艺参数数据中的噪声数据,具体为:
[0007]将收集的生产工艺参数数据组成的数据集表示为X,设R(X)表示数据集X中数据对应的局部邻域半径,采用迭代的方式确定R(X)的值,具体为:
[0008]设R(X,r)表示数据集X中的数据在第r次迭代时对应的邻域半径,且R(X,r)=R(X,0)+r,其中,r表示当前的迭代次数,且r的初始取值为0,r的增长步长设置为1,R(X,0)表示数据集X中的数据的初始邻域半径,设x
i
表示数据集X中的第i个数据,且x
i
为D维数据,D为生产工艺参数确定单元确定的生产工艺参数的种类数,d
min
(x
i
)表示数据x
i
和数据集X中的数
据之间的最小欧式距离值,即则其中,max表示取最大值,mid表示取中值,x
j
表示数据集X中的第j个数据,|x
j-x
i
|表示数据x
i
和数据x
j
之间的欧式距离,定义表示数据集X在第r次迭代时的统计系数,且的表达式为:
[0009][0010]其中,设Ω(x
i
,r)表示数据x
i
在第r次迭代时的邻域,且Ω(x
i
,r)为以数据x
i
为中心、以R(X,r 为半径的球形区域,定义δ(x
i
,r)表示数据x
i
在邻域Ω(x
i
,r)中的邻域统一系数,且数,且其中,表示邻域Ω(x
i
,r)中的第e个数据,M(x
i
,r)表示邻域Ω(x
i
,r)中的数据量,表示数据x
i
和数据对应的判断函数,且其中,d(X)为给定的距离检测阈值,且ρ(x
i
,r)表示邻域统一系数δ(x
i
,r)对应的邻域统计系数,M(X)表示数据集X中的数据量;
[0011]当数据集X在第r次迭代时的统计系数满足时,令r=r+1,继续按照上述方法计算数据集X在新的迭代次数时的统计系数;当数据集X在第r次迭代时的统计系数满足且时,选取第(r-1)次迭代时的邻域半径R(X,r-1)的值作为局部邻域半径R(X)的值。
[0012]优选地,设Ω(x
i
)表示数据x
i
的局部邻域,且Ω(x
i
)为以数据x
i
为中心、以R(X)为半径的球形区域,设置第一数据子集N1(X)和第二数据子集N2(X),设δ(x
i
)表示数据x
i
在局部邻域Ω(x
i
)中的邻域统一系数,且其中,x
i,a
表示局部邻域Ω(x
i
)中的第a个数据,κ(x
i
,x
i,a
)表示数据x
i
和数据x
i,a
对应的判断函数,且M(x
i
)表示局部邻域Ω(x
i
)中的数据量,当数据x
i
满足δ(x
i
)=1时,则将数据x
i
加入到第一数据子集N1(X)中,当数据x
i
满足δ(x
i
)<1时,则将数据x
i
加入到第二数据子集N2(X)中;
[0013]在第一数据子集N1(X)中选取局部邻域内具有最多数据量的数据为第一个聚类参量数据,设x
l
表示第一数据子集N1(X)中的第l个数据,且即x
l
为在第一数据子集N1(X)中选取的第一个聚类参量数据,将所述聚类参量数据x
l
所在的类记为c1,并将聚类参量数据x
l
在第一数据子集N1(X)和数据集X中都删除,其中,x
b
表示第一数据子集N1(X)中的第b个数据,设Ω(x
b
)表示数据x
b
的局部邻域,且Ω(x
b
)为以数据x
b
为中心、以R(X)
为半径的球形区域,M(x
b
)表示局部邻域Ω(x
b
)中的数据量;根据选取的聚类参量数据x
l
在数据集X中采用迭代的方式筛选出属于类c1的数据,具体为:
[0014]设Ω

(x
l
,t)表示聚类参量数据x
l
在第t次筛选时对应的筛选邻域,且Ω

(x
l
,t)为以聚类参量数据x
l
为中心、以R

(x
l
,t)为半径的球形区域,其中,R

(x
l
,t)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据技术的中药生产工艺参数分析系统,其特征是,包括参数确定模块、数据收集模块、数据预处理模块和质量指标预测模块,所述参数确定模块包括质量指标确定单元和生产工艺参数确定单元,所述质量指标确定单元用于确定中药生产规定的质量指标参数,所述生产工艺参数确定单元用于确定影响所述质量指标参数的生产工艺参数,所述数据收集模块用于收集所述生产工艺参数数据以及所述生产工艺参数数据对应的质量指标参数数据,所述数据预处理模块用于对收集到的生产工艺参数数据进行预处理,去除生产工艺参数数据中的噪声数据,所述质量指标预测模块利用预处理后的生产工艺参数数据和其所对应的质量指标参数数据对BP神经网络进行训练,从而建立根据生产工艺参数数据对中药生产的质量指标参数数据进行预测的BP神经网络模型。2.根据权利要求1所述的一种基于大数据技术的中药生产工艺参数分析系统,其特征是,所述数据预处理模块用于对收集到的生产工艺参数数据进行聚类,并根据聚类结果去除所述生产工艺参数数据中的噪声数据,具体为:将收集的生产工艺参数数据组成的数据集表示为X,设R(X)表示数据集X中数据对应的局部邻域半径,采用迭代的方式确定R(X)的值,具体为:设R(X,r)表示数据集X中的数据在第r次迭代时对应的邻域半径,且R(X,r)=R(X,0)+r,其中,r表示当前的迭代次数,且r的初始取值为0,r的增长步长设置为1,R(X,0)表示数据集X中数据的初始邻域半径,设x
i
表示数据集X中的第i个数据,且x
i
为D维数据,D为生产工艺参数确定单元确定的生产工艺参数的种类数,d
min
(x
i
)表示数据x
i
和数据集X中的数据之间的最小欧式距离值,即则其中,max表示取最大值,mid表示取中值,x
j
表示数据集X中的第j个数据,|x
j-x
i
|表示数据x
i
和数据x
j
之间的欧式距离,定义表示数据集X在第r次迭代时的统计系数,且的表达式为:其中,设Ω(x
i
,r)表示数据x
i
在第r次迭代时的邻域,且Ω(x
i
,r)为以数据x
i
为中心、以R(X,r)为半径的球形区域,定义δ(x
i
,r)表示数据x
i
在邻域Ω(x
i
,r)中的邻域统一系数,且δ(x
i
,r)=其中,表示邻域Ω(x
i
,r)中的第e个数据,M(x
i
,r)表示邻域Ω(x
i
,r)中的数据量,表示数据x
i
和数据对应的判断函数,且其中,d(X)为给定的距离检测阈值,且ρ(x
i
,r)表示邻域统一系数δ(x
i
,r)对应的邻域统计系数,M(X)表示数据集X中的数据量;当数据集X在第r次迭代时的统计系数满足时,令r=r+1,继续按照上述方法计算数据集X在新的迭代次数时的统计系数;当数据集X在第r次迭代时的统计系数
满足且时,选取第(r-1)次迭代时的邻域半径R(X,r-1)的值作为局部邻域半径R(X)的值。3.根据权利要求2所述的一种基于大数据技术的中药生产工艺参数分析系统,其特征是,设Ω(x
i
)表示数据x
i
的局部邻域,且Ω(x
i
)为以数据x
i
为中心、以R(X)为半径的球形区域,设置第一数据子集N1(X)和第二数据子集N2(X),设δ(x
i
)表示数据x
i
在局部邻域Ω(x
i
)中的邻域统一系数,且其中,x
i,a
表示局部邻域Ω(x
i
)中的第a个数据,κ(x
i
,x
i,a
)表示数据x
i
和数据x
i,a
对应的判断函数,且M(x
i
)表示局部邻域Ω(x
i
)中的数据量,当数据x
i
满足δ(x
i
)=1时,则将数据x
i
加入到第一数据子集N1(X)中,当数据x
i
满足δ(x
i
)<1时,则将数据x
i
加入到第二数据子集N2(X)中;在第一数据子集N1(X)中选取局部邻域内具有最多数据量的数据为第一个聚类参量数据,设x
l
表示第一数据子集N1(X)中的第l个数据,且即x
l
为在第一数据子集N1(X)中选取的第一个聚类参量数据,将所述聚类参量数据x
l
所在的类记为c1,并将聚类参量数据x
l
在第一数据子集N1(X)和数据集X中都删除,其中,x
b
表示第一数据子集N1(X)中的第b个数据,设Ω(x
b
)表示数据x
b
的局部邻域,且Ω(x
b
)为以数据x
b
为中心、以R(X)为半径的球形区域,M(x
b
)表示局部邻域Ω(x
b
)中的数据量;根据选取的聚类参量数据x
l
在数据集X中采用迭代的方式筛选出属于类c1的数据,具体为:设Ω

【专利技术属性】
技术研发人员:谢志坚张敬海王珍玉赵飞飞张贺
申请(专利权)人:华润三九枣庄药业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1