【技术实现步骤摘要】
预测模型的样本确定方法及装置、介质和设备
本公开涉及数据处理
,具体而言,涉及一种预测模型的样本确定方法及装置,以及实现上述预测模型的样本确定方法的计算机存储介质和电子设备。
技术介绍
随着大数据和人工智能技术的发展,机器学习算法越来越多的运用到各种预测类方案中。例如,对广告受众特征的预测,风控场景中对恶意账号标识的预测等。在训练或测试机器学习算法的过程中,样本处理是关键的步骤。其中,若样本的向量表示所表达的特征越丰富(多),则通过该样本训练或测试机器学习算法的预测准确率越高。反之,若样本的向量表示所表达的特征越匮乏(少),则通过该样本训练或测试机器学习算法的预测准确率越低。需要说明的是,上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解。
技术实现思路
本公开的目的在于提供一种预测模型的样本确定方法及装置,以及实现上述预测模型的样本确定方法的计算机存储介质和电子设备,进而至少在一定程度上提升样本所表达的特征越丰富程度,有利于提升通过该样本训练或测试机器学习算法的预测准确率。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种预测模型的样本确定方法,包括:获取节点的离散型特征和连续型特征;根据所述离散型特征和所述连续型特征,计算目标节点与其他节点之间的相似度;根据所述相似度确定所述目标节点和其他节点之间的关联权重矩阵;对所述关联权重矩阵进行降维处理,得到所述目标 ...
【技术保护点】
1.一种预测模型的样本确定方法,其特征在于,所述方法包括:/n获取节点的离散型特征和连续型特征;/n根据所述离散型特征和所述连续型特征,计算目标节点与其他节点之间的相似度;/n根据所述相似度确定所述目标节点和其他节点之间的关联权重矩阵;/n对所述关联权重矩阵进行降维处理,得到所述目标节点的低维向量表示,并确定所述目标节点的低维向量表示为预测模型的样本。/n
【技术特征摘要】 【专利技术属性】
1.一种预测模型的样本确定方法,其特征在于,所述方法包括:
获取节点的离散型特征和连续型特征;
根据所述离散型特征和所述连续型特征,计算目标节点与其他节点之间的相似度;
根据所述相似度确定所述目标节点和其他节点之间的关联权重矩阵;
对所述关联权重矩阵进行降维处理,得到所述目标节点的低维向量表示,并确定所述目标节点的低维向量表示为预测模型的样本。
2.根据权利要求1所述的预测模型的样本确定方法,其特征在于,所述根据所述离散型特征和所述连续型特征,计算目标节点与其他节点之间的相似度,包括:
计算所述目标节点的离散型特征,与其他节点中当前节点的离散型特征之间的第一相似度;
计算所述目标节点的连续型特征,与所述当前节点的连续型特征之间的第二相似度;
根据所述第一相似度和所述第二相似度确定所述目标节点和所述当前节点之间的相似度。
3.根据权利要求2所述的预测模型的样本确定方法,其特征在于,所述计算所述目标节点的离散型特征,与其他节点中当前节点的离散型特征之间的第一相似度,包括:
获取所述目标节点的第一离散型特征集,以及所述当前节点的第二离散型特征集;
计算所述第一离散型特征集与所述第二离散型特征集的特征重合度;
根据所述重合度确定所述第一相似度。
4.根据权利要求2所述的预测模型的样本确定方法,其特征在于,所述计算所述目标节点的离散型特征,与其他节点中当前节点的离散型特征之间的第一相似度,包括:
获取所述目标节点的第一离散型特征,以及获取所述当前节点的第二离散型特征;
计算所述第一离散型特征与所述第二离散型特征的编辑距离;
根据所述编辑距离确定所述第一相似度。
5.根据权利要求2所述的预测模型的样本确定方法,其特征在于,所述计算所述目标节点的连续型特征,与所述当前节点的连续型特征之间的第二相似度,包括:
获取所述目标节点的第一连续型特征集,以及获取其他节点中所述当前节点的第二连续型特征集;
根据动态时间规整算法,计算所述第一连续型特征集与所述第二连续型特征集的序列特征相似度;
根据所述序列特征相似度确定所述第二相似度。
6.根据权利要求1至5中任意一项所述的预测模型的样本确定方法,其特征在于,所述根据所述相似度确定所述目标节点和其他节点之间的关联权重矩阵,包括:
归一化或标准化所述目标节点和其他节点之间的相似度,得到所述目标节点和其他节点之间的权重值;
根据所述权重值确定所述目标节点和其他节点之间的关联权重矩阵。
7.根据权利要求1至5中任意一项所述的预测模型的样本确定方法,其特征在于,在所述确定所述目标节点和其他节点之间的关联权重矩阵之后,所述方法还包括:
根据所述目标节点和其他节点之间的关联权重矩阵,确定所述目标节点和其他节点之间的关联距离;
根据所述关联距离构造关于所述目标节点和其他节点的有权无向图,以根据所述有权无向图确定所述目标节点的低维向量表示。
技术研发人员:陈辉亮,金欢,
申请(专利权)人:深圳市腾讯计算机系统有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。