一种数据处理方法和相关装置制造方法及图纸

技术编号:37561118 阅读:8 留言:0更新日期:2023-05-15 07:43
本申请公开了一种数据处理方法和相关装置,获取包括目标用户标识的数据分析请求,根据用户标识与因变量指标的对应关系,确定目标用户标识对应的n个因变量指标。获取目标因变量指标对应的i个待定自变量指标、目标因变量指标对应的目标因变量数据集合,以及i个待定自变量指标对应的待定自变量数据集合。根据目标因变量数据集合和i个待定自变量数据集合间的相关性,从i个待定自变量指标中确定j个待定自变量指标,即从可能与目标因变量指标相关的i个待定自变量指标中确定出与目标因变量指标相关性较大的j个待定自变量指标,实现了无关指标的筛除,从而有针对性的根据j个待定自变量指标确定针对目标因变量指标的调整策略。量指标确定针对目标因变量指标的调整策略。量指标确定针对目标因变量指标的调整策略。

【技术实现步骤摘要】
一种数据处理方法和相关装置


[0001]本专利技术涉及大数据处理
,尤其是涉及一种数据处理方法和相关装置。

技术介绍

[0002]质量管理贯穿于药物的整个生命周期,制药企业需要不断对药物生产工艺过程中的质量问题进行汇总和分析,以保证药品质量的可靠性。
[0003]相关技术中,当制药企业需要进行质量回顾时,可以对上半年出现的质量问题进行汇总分类,医药专家对问题进行归因,并根据原因对下半年企业的生产进行调整。
[0004]但是,上述方式过度依赖医药专家的专业性,普适性较低。

技术实现思路

[0005]针对上述问题,本申请提供一种数据处理方法和相关装置,无需人工参与,在保证分析的准确性的同时,扩大了适用范围。
[0006]基于此,本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供一种数据处理方法,所述方法包括:
[0008]获取数据分析请求,所述数据分析请求包括目标用户标识;
[0009]根据用户标识和因变量指标的对应关系,获取所述目标用户标识对应的n个因变量指标,n为大于1的整数;
[0010]获取目标因变量指标对应的i个待定自变量指标,所述目标因变量指标为所述n个因变量指标中的一个因变量指标,i为大于1的整数;
[0011]获取所述目标因变量指标对应的目标因变量数据集合,以及获取所述i个待定自变量指标分别对应的i个待定自变量数据集合;
[0012]根据所述目标因变量数据集合和所述i个待定自变量数据集合间的相关性,从i个待定自变量指标中确定j个待定自变量指标,所述j个待定自变量指标分别对应的j个待定自变量数据集合与所述目标因变量数据集合间的相关性大于相关性阈值,j为小于或等于i的正整数;
[0013]根据所述j个待定自变量指标,确定针对所述目标因变量指标的调整策略。
[0014]可选的,所述根据所述j个待定自变量指标,确定针对所述目标因变量指标的调整策略,包括:
[0015]获取所述j个待定自变量指标对应的历史自变量数据,以及所述目标因变量指标对应的历史因变量数据;
[0016]根据所述历史自变量数据和所述历史因变量数据,预测所述目标因变量指标的变化趋势;
[0017]根据所述变化趋势,确定针对所述目标因变量指标的调整策略。
[0018]可选的,所述根据所述j个待定自变量指标,确定针对所述目标因变量指标的调整策略,包括:
[0019]根据所述j个待定自变量指标确定k个自变量指标组合,所述自变量指标组合包括所述j个待定自变量指标中的至少一个待定自变量指标,k为大于1的正整数;
[0020]建立所述k个自变量指标组合分别和所述目标因变量指标间的关联关系,得到k个所述关联关系分别对应的拟合优度和显著程度;
[0021]根据k个所述拟合优度和所述显著程度,从所述k个自变量指标组合中确定最优自变量指标组合,所述最优自变量指标组合的拟合优度符合预设优度条件;
[0022]根据所述最优自变量指标组合包括的待定自变量指标,确定针对所述目标因变量指标的调整策略。
[0023]可选的,所述获取所述目标因变量指标对应的目标因变量数据集合,包括:
[0024]获取所述目标因变量指标对应的全量因变量数据集合;
[0025]若确定所述全量因变量数据集合不符合正态分布,则将所述n个因变量指标中另一个因变量指标作为所述目标因变量指标。
[0026]可选的,所述获取目标因变量指标对应的i个待定自变量指标,包括:
[0027]获取目标因变量指标对应的x个全量自变量指标;
[0028]根据所述x个全量自变量指标获取x个全量自变量数据集合;
[0029]若确定所述x个全量自变量数据集合中存在不符合正态分布的异常自变量数据集合,从所述x个全量自变量指标去掉所述异常自变量数据集合对应的全量自变量指标,得到i个待定自变量指标。
[0030]可选的,所述得到所述i个待定自变量数据集合之后,所述方法还包括:
[0031]确定所述i个待定自变量数据集合分别对应的i个时间分布;
[0032]根据所述i个时间分布的连续性,从所述i个待定自变量数据集合中确定连续性异常的p个第三异常数据,p为小于i且大于或等于0的整数;
[0033]确定所述p个第三异常数据分别对应的p个待定自变量指标;
[0034]从所述i个待定自变量数据集合中去除所述p个待定自变量指标分别对应的待定自变量数据集合,得到i

p个待定自变量数据集合;
[0035]所述根据所述目标因变量数据集合和所述i个待定自变量数据集合间的相关性,从i个待定自变量指标中确定j个待定自变量指标,包括:
[0036]根据所述目标因变量数据集合和所述i

p个待定自变量数据集合间的相关性,从i

p个待定自变量指标中确定j个待定自变量指标。
[0037]可选的,所述方法还包括:
[0038]获取用户标识创建请求;
[0039]获取从因变量指标集合中确定的所述n个因变量指标,所述因变量指标集合中包括m个因变量指标,m为大于n的整数;
[0040]建立所述n个因变量指标和所述目标用户标识间的对应关系,并返回所述用户创建请求对应的创建结果,所述创建结果包括所述目标用户标识。
[0041]另一方面,本申请提供了一种数据处理装置,所述装置包括:获取单元、确定单元和调整单元;
[0042]所述获取单元,用于获取数据分析请求,所述数据分析请求包括目标用户标识;
[0043]所述获取单元,还用于根据用户标识和因变量指标的对应关系,获取所述目标用
户标识对应的n个因变量指标,n为大于1的整数;
[0044]所述获取单元,还用于获取目标因变量指标对应的i个待定自变量指标,所述目标因变量指标为所述n个因变量指标中的一个因变量指标,i为大于1的整数;
[0045]所述获取单元,还用于获取所述目标因变量指标对应的目标因变量数据集合,以及获取所述i个待定自变量指标分别对应的i个待定自变量数据集合;
[0046]所述确定单元,用于根据所述目标因变量数据集合和所述i个待定自变量数据集合间的相关性,从i个待定自变量指标中确定j个待定自变量指标,所述j个待定自变量指标分别对应的j个待定自变量数据集合与所述目标因变量数据集合间的相关性大于相关性阈值,j为小于或等于i的正整数;
[0047]所述调整单元,用于根据所述j个待定自变量指标,对所述目标因变量指标进行调整。
[0048]可选的,所述调整单元,具体用于:
[0049]获取所述j个待定自变量指标对应的历史自变量数据,以及所述目标因变量指标对应的历史因变量数据;
[0050]根据所述历史自变量数据和所述历史因变量数据,预测所述目标因变量指标的变化趋势;
[0051]根据所述变本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取数据分析请求,所述数据分析请求包括目标用户标识;根据用户标识和因变量指标的对应关系,获取所述目标用户标识对应的n个因变量指标,n为大于1的整数;获取目标因变量指标对应的i个待定自变量指标,所述目标因变量指标为所述n个因变量指标中的一个因变量指标,i为大于1的整数;获取所述目标因变量指标对应的目标因变量数据集合,以及获取所述i个待定自变量指标分别对应的i个待定自变量数据集合;根据所述目标因变量数据集合和所述i个待定自变量数据集合间的相关性,从i个待定自变量指标中确定j个待定自变量指标,所述j个待定自变量指标分别对应的j个待定自变量数据集合与所述目标因变量数据集合间的相关性大于相关性阈值,j为小于或等于i的正整数;根据所述j个待定自变量指标,确定针对所述目标因变量指标的调整策略。2.根据权利要求1所述的方法,其特征在于,所述根据所述j个待定自变量指标,确定针对所述目标因变量指标的调整策略,包括:获取所述j个待定自变量指标对应的历史自变量数据,以及所述目标因变量指标对应的历史因变量数据;根据所述历史自变量数据和所述历史因变量数据,预测所述目标因变量指标的变化趋势;根据所述变化趋势,确定针对所述目标因变量指标的调整策略。3.根据权利要求1所述的方法,其特征在于,所述根据所述j个待定自变量指标,确定针对所述目标因变量指标的调整策略,包括:根据所述j个待定自变量指标确定k个自变量指标组合,所述自变量指标组合包括所述j个待定自变量指标中的至少一个待定自变量指标,k为大于1的正整数;建立所述k个自变量指标组合分别和所述目标因变量指标间的关联关系,得到k个所述关联关系分别对应的拟合优度和显著程度;根据k个所述拟合优度和所述显著程度,从所述k个自变量指标组合中确定最优自变量指标组合,所述最优自变量指标组合的拟合优度符合预设优度条件;根据所述最优自变量指标组合包括的待定自变量指标,确定针对所述目标因变量指标的调整策略。4.根据权利要求1所述的方法,其特征在于,所述获取所述目标因变量指标对应的目标因变量数据集合,包括:获取所述目标因变量指标对应的全量因变量数据集合;若确定所述全量因变量数据集合不符合正态分布,则将所述n个因变量指标中另一个因变量指标作为所述目标因变量指标。5.根据权利要求1所述的方法,其特征在于,所述获取目标因变量指标对应的i个待定自变量指标,包括:获取目标因变量指标对应的x个全量自变量指标;根据所述x个全量自变量指标获取x个全量自变量数据集合;
若确定所述x个全量自变量数据集合中存在不符合正态分布的异常自变量数据集合,从所述x个全量自变量指标去掉所述异常自变量数据集合对应的全量自变量指标,得到i个待定自变量指标。6.根据权利要求5所述的方法,...

【专利技术属性】
技术研发人员:王国旭
申请(专利权)人:北京尚质合规科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1