System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据分析,具体为一种基于机器学习的统一纳管数据管理系统及方法。
技术介绍
1、现如今大数据云平台技术飞快发展,取代了以前人工进行记录的方法,统一纳管云平台已经运用在大部分公司中,统一纳管云平台是一个集成化的云管理解决方案,旨在通过统一界面和管理工具对多种云资源进行集中管理和监控。通过使用统一纳管云平台,企业可以更加高效地管理和监控云资源,优化资源使用,并确保云环境的安全性和合规性。
2、在纳管数据云平台中,有一个自动化分类系统,是对多种资源数据进行自动化分类汇总,用户将资源数据上传到云平台过程中,通过自动化分类系统对资源数据进行自动化分类,将资源数据放置其所属的类型中,但是由于资源数据会随着时间变化而发生变化,自动化分类系统没有及时更新,会导致自动化分类系统在分类判断时出现错误,把该属于这一类的资源数据放到了其他类中,需要工作人员重新审核将资源数据放置正确位置,这一操作影响了人工审核的时间,对工作人员的工作效率产生了影响,因此需要一种基于机器学习的统一纳管数据管理系统及方法,能够得到更新间隔时长,根据更新间隔时长对自动化分类系统及时更新,减少发生错误情况。
技术实现思路
1、本专利技术的目的在于提供一种基于机器学习的统一纳管数据管理系统及方法,以解决上述
技术介绍
中提出的问题。
2、为了解决上述技术问题,本专利技术提供如下技术方案:一种基于机器学习的统一纳管数据管理系统及方法,方法包括:
3、步骤s100:在纳管数据云平台中,对经过自
4、步骤s200:根据若干个时间间隔,对各种资源数据的错误数量建立最优预测模型;
5、步骤s300:根据工作人员审查错误数据所花费总时间的阈值,得到各种资源数据的若干种错误数量组合和若干种错误数量组合所花费时长集合;
6、步骤s400:根据若干种错误数量组合所花费时长集合,计算得到所述花费时长的最优等级,根据所述最优等级的范围,对自动化分类系统进行更新分析。
7、进一步的,步骤s100包括:
8、步骤s101:将第i种资源数据进行人工审核,对审查结果为错误的错误数量进行采集,将第i种资源数据的错误数量绘制曲线图;
9、步骤s102:对所述曲线图进行计算,得到第i种资源数据的变化周期,将纳管数据云平台中各种资源数据的变化周期进行汇总计算,得到资源数据变化周期的平均数a和中位数b;
10、步骤s103:根据所述平均数和中位数计算,得到审核资源数据的时间间隔,根据时间间隔公式:gn=a+n×b,其中,gn表示为第n个时间间隔,n表示为时间间隔的权值,对n在规定范围内进行随机取值,将随机取值输入到时间间隔公式中,得到若干个时间间隔。
11、上述步骤中,对审查结果为错误的错误数量进行采集,是根据不同时间点,对各种资源数据新出现的错误数量进行采集,因为每次审核发现错误后,都会将错误的资源数据放回到其正确的分类中;
12、由于人为设定的时间间隔,容易出现数据冗余或者预测准确性下降等情况,所以根据资源数据的错误数量汇总曲线图,找到更为合适的时间间隔;
13、曲线图的横坐标为采集的时间点,纵坐标为资源数据的错误数量,根据所述曲线图分析,从曲线图原点开始,斜率值的正负每变化两次的时间段,计算得到资源数据的变化周期;
14、对变化周期取平均数和中位数,带入时间间隔公式,对时间间隔的权值在范围内进行随机取值,得到若干个随机时间间隔,这样可以使时间间隔更为丰富,得到更合适的时间间隔,如果不对时间间隔的权值随机取值,则会导致时间间隔过于单一,容易使后续分析出现误差。
15、进一步的,步骤s200包括:
16、步骤s201:以gn为时间间隔,对第i种资源数据的错误数量进行采集,建立以gn为时间间隔,第i种资源数据的错误数量预测模型,对所述预测模型进行测试,得到以gn为时间间隔,第i种资源数据的错误数量预测模型的误差值,将以gn为时间间隔,各种资源数据的错误数量预测模型的误差值相加,得到以gn为时间间隔的总误差值;
17、步骤s202:调取若干个时间间隔,将各个时间间隔的总误差值进行汇总,按照从小到大进行排序,将最小值所对应的时间间隔为最优时间间隔,将最优时间间隔所对应的各种资源数据的错误数量预测模型,作为各种资源数据的错误数量最优预测模型。
18、上述步骤中,根据时间间隔和采集得到的错误数量,通过使用线性回归模型,建立预测模型;
19、根据若干个时间间隔对资源数据的错误数量进行采集,建立资源数据的错误数量预测模型,判断不同时间间隔得到的预测模型的误差值,得到最优的预测模型,如果不用多个时间间隔对资源数据的错误数量进行采集,会导致预测模型准确度过低,对后续分析起到影响。
20、进一步的,步骤s300包括:
21、步骤s301:采集工作人员对资源数据进行人工审核所花费的时间,计算得到工作人员对资源数据进行人工审核所花费的平均时间为tp,根据所述平均时间,设定工作人员审查错误数据所花费总时间的阈值t;
22、步骤s302:采集工作人员对第i种资源数据的错误数据审查所花费的平均时间,计算得到各种资源数据的错误数量,根据错误数量公式:t=t1×s1+t2×s2+...+ti×si,其中,t1、t2、...、ti分别表示为第1、2...、i种资源数据的错误数据审查所花费的平均时间,s1、s2、...、si分别表示为第1、2...、i种资源数据的错误数量;
23、步骤s303:满足错误数量公式的第j种错误数量组合为s1j、s2j、...、sij,其中,s1j、s2j、...、sij分别表示为第j种错误数量组合中第1、2...、i种资源数据的错误数量;
24、步骤s304:将sij输入到第i种资源数据的错误数量最优预测模型中,得到第i种资源数据的错误数量达到sij所花费的时长,将各种资源数据的错误数量达到第j种错误数量组合中各种资源数据的错误数量,所花费的时长进行汇总,得到第j种错误数量组合所花费时长集合。
25、由于工作人员每天审查经过分类后的资源数据所花费的时间不一样,所以要计算工作人员所花费的平均时间,进而得到工作人员审查错误数据所花费总时间的阈值,所述阈值可以根据工作人员审查错误数据所花费的时间权值进行调整,得到更合适的阈值,若m越大t也越大,则工作人员可以接受花费在审查错误数据的总时间越多,若m越小t也越小,则工作人员可以接受花费在审查错误数据的总时间越少,根据不同情况对m进行赋值,得到合适的审查错误数据所花费总时间的阈值;
26、根据工作人员审查错误数据所花费总时间的阈值和审查每种资源数据的错误数据所花费的平均时间进行计算,由于有若干种资源数据,审核每个资源数据的平均时间不同,会导致满足错误数量公式本文档来自技高网...
【技术保护点】
1.一种基于机器学习的统一纳管数据管理方法,其特征在于:方法包括:
2.根据权利要求1所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤S100对各种审查结果为错误的错误数量分析得到若干个时间间隔的过程,包括以下步骤:
3.根据权利要求2所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤S200对各种资源数据的错误数量建立最优预测模型的过程,包括以下步骤:
4.根据权利要求3所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤S300对得到若干种各种资源数据的错误数量组合和若干种错误数量组合所花费时长集合的过程,包括以下步骤:
5.根据权利要求4所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤S400对得到更新间隔时长的过程,包括以下步骤:
6.一种基于机器学习的统一纳管数据管理系统,用于实现权利要求1-5中任一项所述一种基于机器学习的统一纳管数据管理方法,其特征在于,时间间隔模块、预测模型模块、数量组合模块和更新时长模块;
7.根据权利要求6所述的一种基于机器
8.根据权利要求6所述的一种基于机器学习的统一纳管数据管理系统,其特征在于,所述预测模型模块包括建立预测模型单元和分析最优预测模型单元;
9.根据权利要求6所述的一种基于机器学习的统一纳管数据管理系统,其特征在于,所述数量组合模块包括分析错误时间单元和错误数量组合单元;
10.根据权利要求6所述的一种基于机器学习的统一纳管数据管理系统,其特征在于,所述更新时长模块包括分析更新时长单元和更新提醒单元;
...【技术特征摘要】
1.一种基于机器学习的统一纳管数据管理方法,其特征在于:方法包括:
2.根据权利要求1所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤s100对各种审查结果为错误的错误数量分析得到若干个时间间隔的过程,包括以下步骤:
3.根据权利要求2所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤s200对各种资源数据的错误数量建立最优预测模型的过程,包括以下步骤:
4.根据权利要求3所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤s300对得到若干种各种资源数据的错误数量组合和若干种错误数量组合所花费时长集合的过程,包括以下步骤:
5.根据权利要求4所述的一种基于机器学习的统一纳管数据管理方法,其特征在于,步骤s400对得到更新间隔时长的过程,包括以下步骤:
6.一种...
【专利技术属性】
技术研发人员:张向飞,王轶,方海宾,滕天宇,王栋梁,顾琦,
申请(专利权)人:上海市大数据中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。