基于机器学习的企业行政处罚数据分类方法及系统技术方案

技术编号：35589753 阅读：11 留言：0更新日期：2022-11-16 15:06

本发明专利技术公开了基于机器学习的企业行政处罚数据分类方法及系统，包括：数据处理模块，用于对现有处罚数据进行人工标注；并将标注后的数据进行向量化；模型搭建模块，用于搭建深度学习模型；模型调优模块，用于对模型进行调优，手动介入线性层为其设置概率阈值，并进行分类判断；外部交互模块，用于模型保存，部署服务器，通过flask框架为外部提供服务。本发明专利技术通过搭建模型，模型调优，通过预设的准确率评价指标对模型进行学习率调整；并进行特征工程修改，为数据进行定性分类，能够体现出数据价值让使用者对数据进行快捷索引。让使用者对数据进行快捷索引。让使用者对数据进行快捷索引。

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习的企业行政处罚数据分类方法及系统

[0001]本专利技术涉及企业行政处罚数据分类领域，尤其涉及基于机器学习的企业行政处罚数据分类方法及系统。

技术介绍

[0002]行政数据描述的是某一个社会群体的特征，而企业作为目前社会上一个数量巨大的群体，其对应的企业行政数据对一个企业来说是至关重要的，且企业行政数据的数据类型较多、数据规模较大。征信一个人的信用评价指标，很多事情都建立在征信基础上开展的，对于公司来说，特别是建筑企业从个人的不良信息就可以饰选出来是否是一个优质企业。市面上都是将信息揉在一起没有具体的分类和定性，就让这些数据的价值变低降低。

技术实现思路

[0003]针对上述问题，本专利技术提供基于机器学习的企业行政处罚数据分类方法及系统。
[0004]本专利技术通过以下技术方案实现：基于机器学习的企业行政处罚数据分类方法，包括以下步骤：S1. 对现有处罚数据进行人工标注；并将标注后的处罚数据进行向量化；S2. 搭建深度学习模型；S3. 进行模型调优，手动介入线性层为其设置概率阈值，并进行分类判断；S4. 模型保存，部署服务器，通过flask框架为外部提供服务。
[0005]进一步的，所述步骤S1具体包括以下子步骤：S101. 对已有的处罚数据进行人工标注；S102. 管理员对数据进行验证分析，提取特征，进行特征工程；S103. 将数据进行向量化。
[0006]进一步的，所述步骤S101具体为：对现有处罚数据进行进行高频词统计，并对高频词进行文本删减，所述文本删减具...

【技术保护点】

【技术特征摘要】
1.基于机器学习的企业行政处罚数据分类方法，其特征在于，包括以下步骤：S1. 对现有处罚数据进行人工标注；并将标注后的处罚数据进行向量化；S2. 搭建深度学习模型；S3. 进行模型调优，手动介入线性层为其设置概率阈值，并进行分类判断；S4. 模型保存，部署服务器，通过flask框架为外部提供服务。2.根据权利要求1所述的基于机器学习的企业行政处罚数据分类方法，其特征在于，所述步骤S1具体包括以下子步骤：S101. 对已有的处罚数据进行人工标注；S102. 管理员对数据进行验证分析，提取特征，进行特征工程；S103. 将数据进行向量化。3.根据权利要求1所述的基于机器学习的企业行政处罚数据分类方法，其特征在于，所述步骤S101具体为：对现有处罚数据进行进行高频词统计，并对高频词进行文本删减，所述文本删减具体为对文本中多余的词句进行删减。4.根据权利要求1所述的基于机器学习的企业行政处罚数据分类方法，其特征在于，所述步骤S3具体包括以下子步骤：S301. 通过预设的准确率评价指标对模型进行学习率调整；S302. 特征工程修改；S303. 手动介入线性层为其设置概率阈值；S304. 进行分类判断；其中，所述准确率评价指标通过测试集合的数据：正确数量/总数，进行计算。5.根据权利要求1所述的基于机器学习的企业行政处罚数据分类方法，其特征在于，所述深度学习...

【专利技术属性】
技术研发人员：陈锋，廖泽丽，周剑洪，赵航翊，谭寒月，任毅，吴林健，
申请(专利权)人：重庆大司空信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人