【技术实现步骤摘要】
一种任务执行方法、装置、设备及计算机可读存储介质
本申请涉及人工智能领域中的信息处理技术,尤其涉及一种任务执行方法、装置、设备及计算机可读存储介质。
技术介绍
随着人工智能的快速发展,网络模型在各个行业都得到了广泛应用。通过网络模型能够提升各个行业中功能应用的智能性和效率;因此,网络模型的训练是各个行业快速发展的重要部分。一般来说,针对指定行业的模型训练,通常是利用指定行业标签对各个行业的用户行为信息进行硬过滤,得到指定行业的用户行为信息,再对指定行业的用户行为信息依次进行特征提取和聚类,得到指定行业特征,最后利用指定行业特征训练指定行业的预测模型。然而,上述预测模型的训练过程中,每个指定行业特征的获取都需要通过筛选各个行业的用户行为信息并进行模型训练等处理实现,处理流程较多,且筛选和模型训练等处理均需要人工参与,从而指定行业特征的获取效率较低,进而预测模型训练的效率较低。
技术实现思路
本申请实施例提供一种任务执行方法、装置、设备及计算机可读存储介质,能够提升预测模型训练的效率。本申请实施例的技 ...
【技术保护点】
1.一种任务执行方法,其特征在于,包括:/n获取目标行业的目标行业标签,所述目标行业标签为所述目标行业的表征信息;/n提取所述目标行业标签的特征,得到行业标签特征;/n依据类簇集合,确定与所述行业标签特征对应的目标类簇标识,所述类簇集合为多个行业的行业特征对应的各个类簇信息构成的集合,所述类簇集合是依据语料数据对所述多个行业的行为数据进行聚类得到的;/n从特征与类簇标识的对应关系中,确定与所述目标类簇标识对应的目标行业特征,所述特征与类簇标识的对应关系为所述行业特征中的每个子行业特征与所述预设类簇集合中的一个类簇标识的对应关系构成的集合;/n其中,所述特征与类簇标识的对应关 ...
【技术特征摘要】
1.一种任务执行方法,其特征在于,包括:
获取目标行业的目标行业标签,所述目标行业标签为所述目标行业的表征信息;
提取所述目标行业标签的特征,得到行业标签特征;
依据类簇集合,确定与所述行业标签特征对应的目标类簇标识,所述类簇集合为多个行业的行业特征对应的各个类簇信息构成的集合,所述类簇集合是依据语料数据对所述多个行业的行为数据进行聚类得到的;
从特征与类簇标识的对应关系中,确定与所述目标类簇标识对应的目标行业特征,所述特征与类簇标识的对应关系为所述行业特征中的每个子行业特征与所述预设类簇集合中的一个类簇标识的对应关系构成的集合;
其中,所述特征与类簇标识的对应关系是依据所述语料数据对所述多个行业的行为数据进行聚类得到的;
利用所述目标行业特征,训练所述目标行业对应的预测模型,以利用训练后的预测模型执行预测任务。
2.根据权利要求1所述的方法,其特征在于,所述提取所述目标行业标签的特征,得到行业标签特征之前,所述方法还包括:
获取所述语料数据;
利用各个行业标签,对所述语料数据进行分类,得到标签与语料的对应关系;
将所述标签与语料的对应关系中的标签和语料进行交错组合,得到负样本;
利用所述负样本,以及所述标签与语料的对应关系,训练初始特征提取模型,得到特征提取模型;
所述提取所述目标行业标签的特征,得到行业标签特征,包括:
利用所述特征提取模型,提取所述目标行业标签的特征,得到所述行业标签特征。
3.根据权利要求1所述的方法,其特征在于,所述依据类簇集合,确定与所述行业标签特征对应的目标类簇标识之前,所述方法还包括:
获取行业操作数据,所述行业操作数据为多个行业的行为数据;
从所述行业操作数据中提取文本信息,得到行业关键文本;
提取所述行业关键文本的特征,得到所述行业特征;
依据所述多个行业对应的行业数量,对所述行业特征进行聚类,得到所述类簇集合,以及所述特征与类簇标识的对应关系。
4.根据权利要求3所述的方法,其特征在于,所述依据所述多个行业对应的行业数量,对所述行业特征进行聚类,得到所述类簇集合,以及所述特征与类簇标识的对应关系,包括:
依据所述多个行业对应的所述行业数量,确定类簇数量,所述类簇数量大于所述行业数量;
依据所述类簇数量,对所述行业特征进行聚类,得到分别包括类簇标识、类簇中心特征和类簇特征的各个类簇;
将所述各个类簇中分别对应的类簇标识和类簇中心特征,构成所述类簇集合,所述各个类簇信息中的每个类簇信息包含类簇标识和类簇中心特征;
基于所述各个类簇中分别对应的类簇标识和类簇特征,确定所述特征与类簇标识的对应关系。
5.根据权利要求4所述的方法,其特征在于,所述基于所述各个类簇中分别对应的类簇标识和类簇特征,确定所述特征与类簇标识的对应关系,包括:
从所述行业特征中,获取与当前类簇的类簇特征中的每个子类簇特征匹配的目标子行业特征,所述当前类簇为所述各个类簇中的任一类簇;
基于所述目标子行业特征和所述当前类簇,确定所述特征与类簇标识的对应关系;
其中,所述特征与类簇标识的对应关系,与所述各个类簇对应;所述目标子行业特征和所述当前类簇之间的对应关系,为所述特征与类簇标识的对应关系中的一个子对应关系。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述依据类簇集合,确定与所述行业标签特征对应的目标类簇标识,包括:
将当前子行业标签特征,与所述类簇集合中的每个类簇中心特征进行比较,得到当前距离集合,所述当前子行业标签特征为所述行业标签特征中的任一子行业标签特征;
将所述类簇集合中,与所述当前距离集合中的最小当前距离所对应的类簇标识,确定为所述当前子行业标签特征对应的当前类簇标识,从而得到与所述行业标签特征对应的各个当前类簇标识;
基于所述各个当前类簇标识,得到所述目标类簇标识。
7.根据权利要求6所述的方法,其特征在于,所述基于所述各个当前类簇标识,得到所述目标类簇标识,包括:
对所述各个当前类簇标识进行整合,得到各个子目标类簇标识以及所述各个子目标类簇标识对应的各个出现频次,所述各个子目标类簇标识与所述各个出现频次一一对应;
依据所述各个出现频次,对所...
【专利技术属性】
技术研发人员:尹程果,宋亚娟,董泽波,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。