一种标签预测方法、电子设备及存储介质技术

技术编号：35590839 阅读：12 留言：0更新日期：2022-11-16 15:08

本申请涉及智慧化技术领域，具体涉及一种标签预测方法、电子设备及存储介质。该方法包括：获取用户选择的样本数据检索词和特征关键词；基于所述样本数据检索词从预设的样本数据库中检索出用于训练用户所需的标签预测模型的样本人群数据，并基于所述特征关键词从检索出的所述样本人群数据中提取出所述特征关键词对应类型的人群特征；基于所述检索到的样本人群数据和所述特征关键词对应类型的人群特征，训练用户所需的标签预测模型，减少了开发人员的工作量；实现了无代码进行模型训练和预测；实现了标签预测模型的一站式生成，并提高了标签预测效率。了标签预测效率。了标签预测效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种标签预测方法、电子设备及存储介质
[0001]本申请要求于2022年02月27日提交中国专利局、申请号为202210115751.2、专利技术名称为“一种生成预测类用户标签的方法及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

[0002]本申请涉及智慧化
，尤其涉及一种标签预测方法、电子设备及存储介质。

技术介绍

[0003]用户画像，指通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据，进而对用户或者产品特征属性进行刻画，并对这些特征进行分析、统计，挖掘潜在价值信息，从而抽象出用户的信息全貌。用户画像可以由众多的用户标签构成，用户标签在营销、广告、人群洞察以及用户产品优化升级等方面能够起到重要作用。
[0004]当前业界已有一些用户标签的开发平台，例如一些标签工厂、EasyTag、标签平台等，可以为一些需要定制用户标签的企业等提供数据源接入、标签建模服务以及标签管理等服务。然而，目前的用户标签开发平台，在生成用户标签方面涉及机器学习/深度学习算法等，需要标签开发人员具备较深的算法知识积累，并且需要标签开发人员投入较多的代码开发工作量，开发门槛高，实现难度大。并且，开发人员在开发不同的用户标签预测模型时所使用的样本数据、人群特征数据等可能存在重复，但由于平台提供给开发人员的开发环境是孤立的，开发人员的开发过程完全分开，从而导致不同的开发人员可能会就相同的原始用户数据进行特征提取，即导致重复性工作，因此开发效率也比较低。

技术实现思路

[0005...

【技术保护点】

【技术特征摘要】
1.一种标签预测方法，应用于电子设备，其特征在于，包括：获取用户选择的样本数据检索词和特征关键词；基于所述样本数据检索词从预设的样本数据库中检索出用于训练用户所需的标签预测模型的样本人群数据，并基于所述特征关键词从检索出的所述样本人群数据中提取出所述特征关键词对应类型的人群特征；基于所述检索到的样本人群数据和所述特征关键词对应类型的人群特征，训练用户所需的标签预测模型。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取待预测数据；采用训练出的所述标签预测模型对所述待预测数据进行人群分类预测，得到目标标签对应标记的目标人群。3.根据权利要求2所述的方法，其特征在于，基于所述样本数据检索词检索出的所述样本人群数据与所述目标人群对应的人群数据包括至少一项等同的人群特征，其中，所述等同的人群特征包括特征向量相同、或者特征向量欧式距离小于距离阈值、或者特征向量的余弦相似度大于相似度阈值的人群特征；并且，所述特征关键词对应类型的人群特征包括所述等同的人群特征。4.根据权利要求2所述的方法，其特征在于，所述基于所述检索到的样本人群数据和所述特征关键词对应类型的人群特征，训练用户所需的标签预测模型，包括：基于所述检索到的样本人群数据和所述特征关键词对应类型的人群特征，生成样本人群特征数据集；将所述样本人群特征数据集输入预设分类算法并执行运算，训练用户所需的标签预测模型。5.根据权利要求4所述的方法，其特征在于，所述基于所述检索到的样本人群数据和所述特征关键词对应类型的人群特征，生成样本人群特征数据集，还包括：获取所述样本人群数据中各样本数据的ID识别信息和正负样本标识信息；将所述ID识别信息和所述正负样本识别信息与提取出的所述特征关键词对应类型的人群特征进行数据拼接，以使所述样本人群数据中各样本数据与所述特征关键词对应类型的人群特征之间建立对应关系；将拼接得到的数据集合作为所述样本人群特征数据集。6.根据权利要求4所述的方法，其特征在于，所述将所述样本人群特征数据集输入预设分类算法并执行运算，包括：检查所述样本人群特征数据集是否缺失特征数据；若所述样本人群特征数据集缺失所述样本人群数据中第一样本的第一特征数据，则将所述第一特征数据所对应的第一人群特征的多个特征数据中的众数，确定为缺失的所述第一特征数据的补全数据；将加入所述补全数据后的样本人群特征数据集输入预设分类算法并执行运算。7.根据权利要求6所述的方法，其特征在于，所述预设分类算法包括预设在算法库中的算法框架，并且，所述将...

【专利技术属性】
技术研发人员：徐萍，胡昱，肖刘林，
申请(专利权)人：花瓣云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人