【技术实现步骤摘要】
在线云服务环境下的大数据处理方法及云计算服务器
本申请涉及大数据和云服务
,特别涉及一种在线云服务环境下的大数据处理方法及云计算服务器。
技术介绍
大数据(bigdata)和云计算(cloudcomputing)是数字经济时代最显著的两大标志性技术,大数据技术和云计算技术相辅相成,为现代社会的发展作出了巨大的贡献。现目前,依附于云计算,许多业务服务可以在云端处理,不仅提高了业务办理效率,还降低了业务办理成本。而大数据挖掘能够使得各类线上业务不断地进行优化和更新,以满足社会快速发展所带来的各类业务需求。大数据挖掘(bigdatamining)是指从大量的数据中通过算法搜索隐藏于其中信息的过程,大数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。大数据挖掘可以应用于用户画像分析和设备状态分析等业务领域,在进行相关大数据挖掘业务之前,需要获得对应的大数据,但现目前的大数据大多携带噪声数据,为了确保大数据挖掘的精准性,需 ...
【技术保护点】
1.一种在线云服务环境下的大数据处理方法,其特征在于,应用于云计算服务器,所述方法包括:/n获取携带有噪声的目标服务项目内容;/n基于预先训练的噪声过滤线程确定与所述目标服务项目内容对应的服务项目指示信息;/n根据所述服务项目指示信息得到与所述目标服务项目内容对应的已标记的项目内容生产数据,并结合所述噪声过滤线程实现对目标服务项目内容的去噪处理。/n
【技术特征摘要】
1.一种在线云服务环境下的大数据处理方法,其特征在于,应用于云计算服务器,所述方法包括:
获取携带有噪声的目标服务项目内容;
基于预先训练的噪声过滤线程确定与所述目标服务项目内容对应的服务项目指示信息;
根据所述服务项目指示信息得到与所述目标服务项目内容对应的已标记的项目内容生产数据,并结合所述噪声过滤线程实现对目标服务项目内容的去噪处理。
2.根据权利要求1所述的方法,其特征在于,
基于预先训练的噪声过滤线程确定与所述目标服务项目内容对应的服务项目指示信息,包括:将所述目标服务项目内容输入至基于平衡样本配置文件配置的噪声过滤线程;所述噪声过滤线程包括多个互相关联的业务环境检测模块;通过所述业务环境检测模块的数据分类策略,得到所述目标服务项目内容的各内容块类别的项目内容生产数据,所述项目内容生产数据作为该业务环境检测模块中信息识别策略的输入;通过所述信息识别策略得到各内容块类别的文档数字化信息,对所述文档数字化信息进行识别得到所述各内容块类别的服务项目指示信息;
根据所述服务项目指示信息得到与所述目标服务项目内容对应的已标记的项目内容生产数据,并结合所述噪声过滤线程实现对目标服务项目内容的去噪处理,包括:通过所述业务环境检测模块的数据标记策略,根据所述服务项目指示信息分别对所述各内容块类别的项目内容生产数据进行标记处理,得到已标记的项目内容生产数据;通过所述噪声过滤线程以及所述已标记的项目内容生产数据,得到与所述目标服务项目内容对应的去噪声服务项目内容。
3.根据权利要求2所述的方法,其特征在于,配置所述噪声过滤线程的方式,包括:
获取由携带有噪声的待配置服务项目内容形成的第一配置样本文件集和由未携带噪声的待配置服务项目内容形成的第二配置样本文件集;
将所述第一配置样本文件集输入至平衡样本配置文件对应的包括多个互相关联的业务环境检测模块的数据处理线程,得到过滤噪声后的过渡样本文件集;
分别将所述过渡样本文件集和所述第二配置样本文件集输入至所述平衡样本配置文件对应的性能检测线程,根据所述性能检测线程的输出得到当前性能状态信息;
根据所述当前性能状态信息更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程,并返回至所述将所述第一配置样本文件集输入至平衡样本配置文件对应的包括多个互相关联的业务环境检测模块的数据处理线程得到过滤噪声的过渡样本文件集,直至满足迭代终止条件,将所述更新后的数据处理线程作为噪声过滤线程。
4.根据权利要求3所述的方法,其特征在于,所述分别将所述过渡样本文件集和所述第二配置样本文件集输入至所述平衡样本配置文件对应的性能检测线程,根据所述性能检测线程的输出得到当前性能状态信息,包括:
分别将所述过渡样本文件集和所述第二配置样本文件集输入至所述平衡样本配置文件对应的性能检测线程,根据所述性能检测线程的输出得到去噪性能状态信息;
根据所述去噪性能状态信息更新所述性能检测线程的线程配置数据,得到更新后的性能检测线程;
将所述过渡样本文件集输入至所述更新后的性能检测线程,根据所述更新后的性能检测线程的输出得到当前性能状态信息;
所述分别将所述过渡样本文件集和所述第二配置样本文件集输入至所述平衡样本配置文件对应的性能检测线程,根据所述性能检测线程的输出得到去噪性能状态信息,包括:
分别将所述过渡样本文件集和所述第二配置样本文件集输入至性能检测线程,得到所述过渡样本文件集对应的第一性能检测结果和所述第二配置样本文件集的第二性能检测结果;
根据所述第一性能检测结果和所述第二性能检测结果,并结合除噪线程映射关系,得到去噪性能状态信息;
所述将所述过渡样本文件集输入至所述更新后的性能检测线程,根据所述更新后的性能检测线程的输出得到当前性能状态信息,包括:
将所述过渡样本文件集输入至所述更新后的性能检测线程,得到所述过渡样本文件集对应的第三性能检测结果;
根据所述第三性能检测结果,并结合平衡样本映射关系,得到当前性能状态信息。
5.根据权利要求3所述的方法,其特征在于,
所述根据所述当前性能状态信息更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程之前,还包括:分别将所述过渡样本文件集和所述第二配置样本文件集输入至内容块比较线程,得到所述过渡样本文件集和所述第二配置样本文件集之间的内容块比较结果;
所述根据所述当前性能状态信息更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程,包括:根据所述当前性能状态信息和所述内容块比较结果更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程。
6.根据权利要求3所述的方法,其特征在于,
所述根据所述当前性能状态信息更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程之前,还包括:对所述过渡样本文件集和所述第二配置样本文件集的内容元素进行分析,得到所述过渡样本文件集和所述第二配置样本文件集之间的内容元素比较结果;
所述根据所述当前性能状态信息更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程,包括:根据所述当前性能状态信息和所述内容元素比较结果更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程;
其中,所述根据所述当前性能状态信息更新所述数据处理线程的线程配置数据,得到更新后的数据处理线程,并返回至所述将所述第一配置样本文件集输入至平衡样本配置文件对应的包括多个互相关联的业务环境检测模块的数据处理线程得到过滤噪声的过渡样本文件集,直至满足...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。