【技术实现步骤摘要】
基于用户数据建模的分析方法、系统、介质及设备
本专利技术属于机器模型数据分析的
,涉及一种用户数据建模的分析方法,特别是涉及一种基于用户数据建模的分析方法、系统、介质及设备。
技术介绍
当前有一些自动化行机器学习模实验的系统,可以实现整个过程只需要配置参数,不需要太多人工的参与以及对机器学习底层原理的理解,也能完成建模工作。做到降低机器学习建模的专业门槛。例如阿里云提供的机器学习自动化服务,实现了数据预处理,算法建模(含自动调参),模型评估等环节的自动化工作。但是,目前的auto-ml(AutomatedMachineLearning,自动机器学习)工具对于生产一个可靠的机器学习模型,流程和环节上存在很多缺失和不足。凭借现有的计算和分析工具,对于产出一个可靠的机器学习模型是不充分的。以下是一现有的automl(AutomatedMachineLearning,自动机器学习)系统常见的问题:(1)流程的自动化程度不足。例如只提供了模型训练的自动化环节,但是没有将建模特征筛选环节进行自动化。(2)业务人员不能获得足 ...
【技术保护点】
1.一种基于用户数据建模的分析方法,其特征在于,所述基于用户数据建模的分析方法包括:/n对用户数据进行特征分析,生成特征分析结果;/n对所述特征分析结果进行随时间变化的稳定性检验,以检测异常数据,并根据异常数据检测结果判断所述特征分析结果是否可靠;若是,执行下一步骤,若否,返回上一步骤;/n将所述特征分析结果进行预处理后,结合预处理数据对所述用户数据建模时所需的特征进行筛选;/n利用筛选后的特征进行用户数据建模,生成用户数据模型;/n对所述用户数据模型进行模型分析,以得到所述用户数据模型的可靠性分析结果,所述可靠性分析结果用于至少向业务人员呈现所述用户数据模型的判断依据的合 ...
【技术特征摘要】
1.一种基于用户数据建模的分析方法,其特征在于,所述基于用户数据建模的分析方法包括:
对用户数据进行特征分析,生成特征分析结果;
对所述特征分析结果进行随时间变化的稳定性检验,以检测异常数据,并根据异常数据检测结果判断所述特征分析结果是否可靠;若是,执行下一步骤,若否,返回上一步骤;
将所述特征分析结果进行预处理后,结合预处理数据对所述用户数据建模时所需的特征进行筛选;
利用筛选后的特征进行用户数据建模,生成用户数据模型;
对所述用户数据模型进行模型分析,以得到所述用户数据模型的可靠性分析结果,所述可靠性分析结果用于至少向业务人员呈现所述用户数据模型的判断依据的合理性和用户数据建模时所用的每个特征对预测结果的影响程度。
2.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于,对用户数据进行特征分析,生成特征分析结果的步骤包括:
对所述用户数据进行出现频率指标分析,生成出现频率分析结果;
对所述用户数据进行数值型指标分析,生成数值型分析结果;
对所述用户数据进行逻辑型指标分析,生成逻辑型分析结果。
3.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于,将所述特征分析结果进行预处理的步骤包括:
对所述特征分析结果中数值特征数据进行缩放映射和主成分分析;
对所述特征分析结果中分类型数据进行独热编码和独立成分分析。
4.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于,将所述特征分析结果进行预处理后,结合预处理数据对所述用户数据建模时所需的特征进行筛选的步骤包括:
通过缺失率、信息值和证据权重相关性的技术指标对所述用户数据建模时所需的特征进行筛选,以自动选择出对所述用户数据建模帮助最大的特征组集合。
5.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于,所述可靠性分析结果包括模型效果分析结果、入模特征分析结果和模型可解释性分析结果;
对所述用户数据模型进行模型效果分析,生成所述模型效果分析结果;
所述模型效果分析包括计算所述用户数据模型的准确率、精...
【专利技术属性】
技术研发人员:薛颜波,蔡俊杰,
申请(专利权)人:上海森亿医疗科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。