目标数据的分类方法、装置、存储介质及电子装置制造方法及图纸

技术编号:18554296 阅读:27 留言:0更新日期:2018-07-28 11:11
本发明专利技术公开了一种目标数据的分类方法、装置、存储介质及电子装置。其中,该方法包括:获取模型文件,其中,模型文件为用于存储目标模型的文件,目标模型为使用样本数据进行训练得到的用于执行分类任务的模型;从模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件;基于目标脚本文件对目标数据进行分类。本发明专利技术解决了相关技术中分类模型处理大规模数据分类任务时复杂度较高的技术问题。

【技术实现步骤摘要】
目标数据的分类方法、装置、存储介质及电子装置
本专利技术涉及计算机领域,具体而言,涉及一种目标数据的分类方法、装置、存储介质及电子装置。
技术介绍
现有的对数据进行分类的方式中通常是利用建模工具对样本数据进行训练得到模型,其后将模型备份到本地计算机上生成本地模型文件,利用模型文件中的预测函数对未分类的数据进行分类。这种方式虽然解决了一部分的数据分类问题,但由于训练出的模型文件的运行依赖于模型训练搭建的运行环境,如果需要将该模型文件应用于其他设备,则需要在其他设备上重新搭建复杂的运行环境,这就导致了训练好的分类模型只适合对本地数据进行分类,而无法进行大规模的分类任务。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种目标数据的分类方法、装置、存储介质及电子装置,以至少解决相关技术中分类模型处理大规模数据分类任务时复杂度较高的技术问题。根据本专利技术实施例的一个方面,提供了一种目标数据的分类方法,包括:获取模型文件,其中,所述模型文件为用于存储目标模型的文件,所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模型;从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件;基于所述目标脚本文件对目标数据进行分类。根据本专利技术实施例的另一方面,还提供了一种目标数据的分类装置,包括:获取模块,用于获取模型文件,其中,所述模型文件为用于存储目标模型的文件,所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模型;处理模块,用于从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件;分类模块,用于基于所述目标脚本文件对目标数据进行分类。根据本专利技术实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述任一项中所述的方法。根据本专利技术实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器通过所述计算机程序执行上述任一项中所述的方法。在本专利技术实施例中,获取模型文件,其中,模型文件为用于存储目标模型的文件,目标模型为使用样本数据进行训练得到的用于执行分类任务的模型;从模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件;基于目标脚本文件对目标数据进行分类。也就是说,将模型文件中的多个具有对应关系的数据特征、分类条件和分类结果从模型文件中提取出来,并将该对应关系转换成符合目标格式的函数,得到目标脚本文件,从而使得模型文件中的分类条件和分类结果均由规则的函数进行记录,当分类模型需要在多台设备上安装从而对大规模数据进行分类处理时,只需将生成的目标脚本文件转移到各个设备,并基于该目标脚本文件对目标数据进行分类即可,避免了分类模型的复杂运行环境的重新搭建,从而降低了分类模型处理大规模数据分类任务时的复杂度,进而克服相关技术中分类模型处理大规模数据分类任务时复杂度较高的问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的目标数据的分类方法的应用环境示意图;图2是根据本专利技术实施例的一种可选的目标数据的分类方法的示意图;图3是根据本专利技术可选的实施方式的一种目标数据的分类方法中目标数据分类的示意图;图4是根据本专利技术可选的实施方式的一种目标数据的分类方法中模型解析的示意图;图5是根据本专利技术实施例的一种可选的目标数据的分类装置的示意图;图6是根据本专利技术实施例的一种可选的目标数据的分类方法的应用场景示意图一;图7是根据本专利技术实施例的一种可选的目标数据的分类方法的应用场景示意图二;图8是根据本专利技术实施例的一种可选的目标数据的分类方法的应用场景示意图三;图9是根据本专利技术实施例的一种可选的目标数据的分类方法的应用场景示意图四;图10是根据本专利技术实施例的一种可选的目标数据的分类方法的应用场景示意图五;以及图11是根据本专利技术实施例的一种可选的电子装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在本专利技术实施例中,提供了一种上述目标数据的分类方法的实施例。作为一种可选的实施方式,该目标数据的分类方法可以但不限于应用于如图1所示的应用环境中,设备102通过网络106与设备104连接,设备102用于通过网络106从设备104获取模型文件,其中,模型文件为用于存储目标模型的文件,目标模型为使用样本数据进行训练得到的用于执行分类任务的模型;从模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件;基于目标脚本文件对目标数据进行分类;设备104,用于存储目标模型对应的模型文件。在本实施例中,设备102将设备104中存储的模型文件中的多个具有对应关系的数据特征、分类条件和分类结果从模型文件中提取出来,并将该对应关系转换成符合目标格式的函数,得到目标脚本文件,从而使得模型文件中的分类条件和分类结果均由规则的函数进行记录,当分类模型需要在多台设备上安装从而对大规模数据进行分类处理时,只需将生成的目标脚本文件转移到各个设备,并基于该目标脚本文件对目标数据进行分类即可,避免了分类模型的复杂运行环境的重新搭建,从而降低了分类模型处理大规模数据分类任务时的复杂度,进而克服相关技术中分类模型处理大规模数据分类任务时复杂度较高的问题。可选地,在本实施例中,上述设备可以包括但不限于以下至少之一:手机、平板电脑、笔记本电脑、台式PC机、数字电视及其他进行区域共享的硬件设备。上述网络可以包括但不限于以下至少之一:广域网、城域网、局域网。上述只是一种示例,本实施例对此不做任何限定。根据本专利技术实施例,提供了一种目标数据的分类方法,如图2所示,该方法包括:S202,获取模型文件,其中,模型文件本文档来自技高网
...

【技术保护点】
1.一种目标数据的分类方法,其特征在于,包括:获取模型文件,其中,所述模型文件为用于存储目标模型的文件,所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模型;从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件;基于所述目标脚本文件对目标数据进行分类。

【技术特征摘要】
1.一种目标数据的分类方法,其特征在于,包括:获取模型文件,其中,所述模型文件为用于存储目标模型的文件,所述目标模型为使用样本数据进行训练得到的用于执行分类任务的模型;从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件;基于所述目标脚本文件对目标数据进行分类。2.根据权利要求1所述的方法,其特征在于,基于所述目标脚本文件对所述目标数据进行分类包括:从所述目标数据中提取目标数据特征;调用所述目标脚本文件,并将所述目标数据特征输入所述目标脚本文件,得到多个目标分类结果;对所述多个目标分类结果执行目标运算,得到目标运算结果;确定所述目标运算结果在多个阈值范围中所落入的目标阈值范围;将所述目标阈值范围对应的目标类别标签确定为所述目标数据的标签,其中,所述多个阈值范围与多个类别标签一一对应。3.根据权利要求2所述的方法,其特征在于,对所述多个目标分类结果执行目标运算,得到所述目标运算结果包括:对所述多个目标分类结果进行求和运算,得到求和结果;使用sigmoid函数将所述求和结果转换为目标概率值,并将所述目标概率值确定为所述目标运算结果。4.根据权利要求1所述的方法,其特征在于,从所述模型文件中提取出多个具有对应关系的数据特征、分类条件和分类结果,并将所述多个具有对应关系的数据特征、分类条件和分类结果转换为符合目标格式的多个函数,生成目标脚本文件包括:从所述模型文件中查找所述分类结果;从所述模型文件中提取查找到的分类结果对应的分类条件以及分类条件中包括的数据特征;建立所述数据特征、所述分类条件和所述分类结果之间的对应关系,得到所述具有对应关系的数据特征、分类条件和分类结果;将所述具有对应关系的数据特征、分类条件和分类结果转换为目标机器语言的脚本文件,得到所述目标脚本文件。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述模型文件包括xgboost模型文件,所述目标脚本文件包括python脚本文件。6.一种目标数据的分类装置,其特征在于,包括:获取模块,用于获取模型文件,其中,所述模型文件为用于存储目标模型的文件,所述目标模型为使用样本数...

【专利技术属性】
技术研发人员:王世伟韩萌龙锦就
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1