目标数据的分类方法、装置、存储介质及电子装置制造方法及图纸

技术编号：18554296 阅读：27 留言：0更新日期：2018-07-28 11:11

本发明专利技术公开了一种目标数据的分类方法、装置、存储介质及电子装置。其中，该方法包括：获取模型文件，其中，模型文件为用于存储目标模型的文件，目标模型为使用样本数据进行训练得到的用于执行分类任务的模型；从模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果，并将多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数，生成目标脚本文件；基于目标脚本文件对目标数据进行分类。本发明专利技术解决了相关技术中分类模型处理大规模数据分类任务时复杂度较高的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
目标数据的分类方法、装置、存储介质及电子装置
本专利技术涉及计算机领域，具体而言，涉及一种目标数据的分类方法、装置、存储介质及电子装置。
技术介绍
现有的对数据进行分类的方式中通常是利用建模工具对样本数据进行训练得到模型，其后将模型备份到本地计算机上生成本地模型文件，利用模型文件中的预测函数对未分类的数据进行分类。这种方式虽然解决了一部分的数据分类问题，但由于训练出的模型文件的运行依赖于模型训练搭建的运行环境，如果需要将该模型文件应用于其他设备，则需要在其他设备上重新搭建复杂的运行环境，这就导致了训练好的分类模型只适合对本地数据进行分类，而无法进行大规模的分类任务。针对上述的问题，目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种目标数据的分类方法、装置、存储介质及电子装置，以至少解决相关技术中分类模型处理大规模数据分类任务时复杂度较高的技术问题。根据本专利技术实施例的一个方面，提供了一种目标数据的分类方法，包括：获取模型文件，其中，所述模型文件为用于存储目标模型的文件，所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模型；从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果，并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数，生成目标脚本文件；基于所述目标脚本文件对目标数据进行分类。根据本专利技术实施例的另一方面，还提供了一种目标数据的分类装置，包括：获取模块，用于获取模型文件，其中，所述模型文件为用于存储目标模型的文件，所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模...

【技术保护点】
1.一种目标数据的分类方法，其特征在于，包括：获取模型文件，其中，所述模型文件为用于存储目标模型的文件，所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模型；从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果，并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数，生成目标脚本文件；基于所述目标脚本文件对目标数据进行分类。

【技术特征摘要】
1.一种目标数据的分类方法，其特征在于，包括：获取模型文件，其中，所述模型文件为用于存储目标模型的文件，所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模型；从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果，并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数，生成目标脚本文件；基于所述目标脚本文件对目标数据进行分类。2.根据权利要求1所述的方法，其特征在于，基于所述目标脚本文件对所述目标数据进行分类包括：从所述目标数据中提取目标数据特征；调用所述目标脚本文件，并将所述目标数据特征输入所述目标脚本文件，得到多个目标分类结果；对所述多个目标分类结果执行目标运算，得到目标运算结果；确定所述目标运算结果在多个阈值范围中所落入的目标阈值范围；将所述目标阈值范围对应的目标类别标签确定为所述目标数据的标签，其中，所述多个阈值范围与多个类别标签一一对应。3.根据权利要求2所述的方法，其特征在于，对所述多个目标分类结果执行目标运算，得到所述目标运算结果包括：对所述多个目标分类结果进行求和运算，得到求和结果；使用sigmoid函数将所述求和结果转换为目标概率值，并将所述目标概率值确定为所述目标运算结果。4.根据权利要求1所述的方法，其特征在于，从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果，并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数，生成目标脚本文件包括：从所述模型文件中查找所述分类结果；从所述模型文件中提取查找到的分类结果对应的分类条件以及分类条件中包括的数据特征；建立所述数据特征、所述分类条件和所述分类结果之间的对应关系，得到所述具有对应关系的数据特征、分类条件和分类结果；将所述具有对应关系的数据特征、分类条件和分类结果转换为目标机器语言的脚本文件，得到所述目标脚本文件。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述模型文件包括xgboost模型文件，所述目标脚本文件包括python脚本文件。6.一种目标数据的分类装置，其特征在于，包括：获取模块，用于获取模型文件，其中，所述模型文件为用于存储目标模型的文件，所述目标模型为使用样本数...

【专利技术属性】
技术研发人员：王世伟，韩萌，龙锦就，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人