类别识别方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:17796963 阅读:46 留言:0更新日期:2018-04-25 20:28
本公开实施例公开了一种类别识别方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取系统对象类别训练数据集,所述系统对象类别训练数据集中的系统对象数据具有评价类别;对所述系统对象类别训练数据集进行训练,得到系统对象类别识别模型;根据所述系统对象类别识别模型对测试对象进行类别识别。本公开实施例提供的技术方案,脱离了对于人工标注的依赖,能够对于系统对象进行自动类别识别,且能够取得较高的类别识别准确率,该方案省时省力,维护成本低,准确率高,能够实现为用户提供精准服务的目标,进而增强用户体验。

Class recognition method, device, electronic device and computer readable storage medium

The present disclosure embodiment discloses a class identification method, device, electronic device and a computer readable storage medium. The method includes: obtaining the training data set of the system object class, the system object data of the system object class training data set has the evaluation category; the data set is trained on the system object category. After training, we get the system object classification recognition model, and classify the test objects according to the system object category recognition model. The technical scheme provided by the public implementation is detached from the dependence on manual annotation, can automatically identify the system objects, and can obtain higher classification accuracy. The scheme saves time and labor, has low maintenance cost, high accuracy rate, and can achieve the target of providing accurate service for users, and then increase the target of precision service. Strong user experience.

【技术实现步骤摘要】
类别识别方法、装置、电子设备及计算机可读存储介质
本公开涉及信息处理
,具体涉及一种类别识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展,越来越多的商户或者服务提供商通过互联网渠道来推广产品和服务,并力求在推广产品和服务的基础上争取更多的用户订单,以提升现有资源的利用率,为商户或者服务提供商创造更多的价值。为了能够为用户提供更为精准的服务,互联网平台对于其能够提供的服务均进行了分类,但目前,这些分类基本都是依靠人工标注完成,在数据量巨大且呈迅速增长趋势的情况下,这样人工分类的方式不仅耗时耗力、维护成本高,而且还存在准确率低下的缺陷,这样就不能够实现为用户提供精准服务的目标,进而还会削弱用户体验。
技术实现思路
本公开实施例提供一种类别识别方法、装置、电子设备及计算机可读存储介质。第一方面,本公开实施例中提供了一种类别识别方法。具体的,所述类别识别方法,包括:获取系统对象类别训练数据集,所述系统对象类别训练数据集中的系统对象数据具有评价类别;对所述系统对象类别训练数据集进行训练,得到系统对象类别识别模型;根据所述系统对象类别识别模型对测试对象进行类别识别。结合第一方面,本公开在第一方面的第一种实现方式中,所述获取系统对象类别训练数据集,包括:获取第一预设历史时间段内已分类系统对象数据,其中,所述系统对象数据包括:对象名称、对象类别、源属性、产品名称、产品产出量中的一种或多种;对具有同一源属性的系统对象的类别进行评价,将评价分值高于预设评价阈值的类别作为该源属性所有系统对象的评价类别;将具有评价类别的系统对象数据作为系统对象类别训练数据,生成所述系统对象类别训练数据集。结合第一方面,本公开在第一方面的第一种实现方式中,所述对具有同一源属性的系统对象的类别进行评价,将评价分值高于预设评价阈值的类别作为该源属性所有系统对象的评价类别,包括:统计具有同一源属性且具有同一类别的系统对象的数量;按照数量的大小确定相应类别的评价分值;将评价分值高于预设评价阈值的类别确定为该源属性所有系统对象的评价类别。结合第一方面,本公开在第一方面的第一种实现方式中,所述对系统对象类别训练数据集进行训练,得到系统对象类别识别模型,包括:提取系统对象类别训练数据的训练特征;根据训练数据的类型和识别结果目标类型确定分类函数;基于训练数据训练确定所述分类函数的参数,得到所述系统对象类别识别模型。结合第一方面,本公开在第一方面的第一种实现方式中,所述提取系统对象类别训练数据的训练特征,包括:基于系统对象类别训练数据确定系统对象产出词典,其中,所述系统对象产出词典包括每一系统对象每一产品的产出数量;从所述系统对象产出词典中提取某一系统对象所有产品的产出数量作为训练特征向量;基于所有系统对象对应的训练特征向量生成所述训练特征。结合第一方面,本公开在第一方面的第一种实现方式中,所述根据所述系统对象类别识别模型对测试对象进行类别识别,包括:获取测试对象的特征数据;将所述测试对象的特征数据输入至所述系统对象类别识别模型,得到对于测试对象的类别识别结果。结合第一方面,本公开在第一方面的第一种实现方式中,所述测试对象包括:第二预设历史时间段内产品产出数量高于预设数量阈值的系统对象。结合第一方面,本公开在第一方面的第一种实现方式中,所述获取测试对象的特征数据,包括:基于测试对象数据确定系统对象产出词典,其中,所述系统对象产出词典包括每一系统对象每一产品的产出数量;从所述系统对象产出词典中提取某一系统对象所有产品的产出数量作为测试特征向量;基于所有系统对象对应的测试特征向量生成所述测试对象的特征数据。第二方面,本公开实施例中提供了一种类别识别装置。具体的,所述类别识别装置,包括:获取模块,被配置为获取系统对象类别训练数据集,所述系统对象类别训练数据集中的系统对象数据具有评价类别;训练模块,被配置为对所述系统对象类别训练数据集进行训练,得到系统对象类别识别模型;识别模块,被配置为根据所述系统对象类别识别模型对测试对象进行类别识别。结合第二方面,本公开在第二方面的第一种实现方式中,所述获取模块包括:第一获取子模块,被配置为获取第一预设历史时间段内已分类系统对象数据,其中,所述系统对象数据包括:对象名称、对象类别、源属性、产品名称、产品产出量中的一种或多种;评价子模块,被配置为对具有同一源属性的系统对象的类别进行评价,将评价分值高于预设评价阈值的类别作为该源属性所有系统对象的评价类别;生成子模块,被配置为将具有评价类别的系统对象数据作为系统对象类别训练数据,生成所述系统对象类别训练数据集。结合第二方面,本公开在第二方面的第一种实现方式中,所述评价子模块包括:统计单元,被配置为统计具有同一源属性且具有同一类别的系统对象的数量;第一确定单元,被配置为按照数量的大小确定相应类别的评价分值;第二确定单元,被配置为将评价分值高于预设评价阈值的类别确定为该源属性所有系统对象的评价类别。结合第二方面,本公开在第二方面的第一种实现方式中,所述训练模块包括:提取子模块,被配置为提取系统对象类别训练数据的训练特征;第一确定子模块,被配置为根据训练数据的类型和识别结果目标类型确定分类函数;第二确定子模块,被配置为基于训练数据训练确定所述分类函数的参数,得到所述系统对象类别识别模型。结合第二方面,本公开在第二方面的第一种实现方式中,所述提取子模块包括:第三确定单元,被配置为基于系统对象类别训练数据确定系统对象产出词典,其中,所述系统对象产出词典包括每一系统对象每一产品的产出数量;第一提取单元,被配置为从所述系统对象产出词典中提取某一系统对象所有产品的产出数量作为训练特征向量;第一生成单元,被配置为基于所有系统对象对应的训练特征向量生成所述训练特征。结合第二方面,本公开在第二方面的第一种实现方式中,所述识别模块包括:第二获取子模块,被配置为获取测试对象的特征数据;识别子模块,被配置为将所述测试对象的特征数据输入至所述系统对象类别识别模型,得到对于测试对象的类别识别结果。结合第二方面,本公开在第二方面的第一种实现方式中,所述测试对象包括:第二预设历史时间段内产品产出数量高于预设数量阈值的系统对象。结合第二方面,本公开在第二方面的第一种实现方式中,所述第二获取子模块包括:第四确定单元,被配置为基于测试对象数据确定系统对象产出词典,其中,所述系统对象产出词典包括每一系统对象每一产品的产出数量;第二提取单元,被配置为从所述系统对象产出词典中提取某一系统对象所有产品的产出数量作为测试特征向量;第二生成单元,被配置为基于所有系统对象对应的测试特征向量生成所述测试对象的特征数据。第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条支持类别识别装置执行上述第一方面中类别识别方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述类别识别装置还可以包括通信接口,用于类别识别装置与其他设备或通信网络通信。第四方面,本公开实施例提供了一种计算机可读存储介质,用于存储类别识别装置所用的计算机指令,其包含用于执行上述第一方面中类别识别方法为类别识别装置所涉及的计算机指令。本公开实施例提供的技术方案可以包括以下有本文档来自技高网...
类别识别方法、装置、电子设备及计算机可读存储介质

【技术保护点】
一种类别识别方法,其特征在于,所述方法包括:获取系统对象类别训练数据集,所述系统对象类别训练数据集中的系统对象数据具有评价类别;对所述系统对象类别训练数据集进行训练,得到系统对象类别识别模型;根据所述系统对象类别识别模型对测试对象进行类别识别。

【技术特征摘要】
1.一种类别识别方法,其特征在于,所述方法包括:获取系统对象类别训练数据集,所述系统对象类别训练数据集中的系统对象数据具有评价类别;对所述系统对象类别训练数据集进行训练,得到系统对象类别识别模型;根据所述系统对象类别识别模型对测试对象进行类别识别。2.根据权利要求1所述的方法,其特征在于,所述获取系统对象类别训练数据集,包括:获取第一预设历史时间段内已分类系统对象数据,其中,所述系统对象数据包括:对象名称、对象类别、源属性、产品名称、产品产出量中的一种或多种;对具有同一源属性的系统对象的类别进行评价,将评价分值高于预设评价阈值的类别作为该源属性所有系统对象的评价类别;将具有评价类别的系统对象数据作为系统对象类别训练数据,生成所述系统对象类别训练数据集。3.根据权利要求2所述的方法,其特征在于,所述对具有同一源属性的系统对象的类别进行评价,将评价分值高于预设评价阈值的类别作为该源属性所有系统对象的评价类别,包括:统计具有同一源属性且具有同一类别的系统对象的数量;按照数量的大小确定相应类别的评价分值;将评价分值高于预设评价阈值的类别确定为该源属性所有系统对象的评价类别。4.根据权利要求1所述的方法,其特征在于,所述对系统对象类别训练数据集进行训练,得到系统对象类别识别模型,包括:提取系统对象类别训练数据的训练特征;根据训练数据的类型和识别结果目标类型确定分类函数;基于训练数据训练确定所述分类函数的参数,得到所述系统对象类别识别模型。5.根据权利要求...

【专利技术属性】
技术研发人员:郁延书龚建
申请(专利权)人:北京小度信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1