用户行为标签的丰富方法、相关装置及计算机存储介质制造方法及图纸

技术编号:33294322 阅读:22 留言:0更新日期:2022-05-01 00:20
本申请提供一种用户行为标签的丰富方法、相关装置及计算机存储介质,该方法包括:首先,针对每一个第三方需求平台返回的广告素材,对广告素材进行清洗,得到目标广告素材;然后,对目标广告素材的文本信息进行关键词提取,得到至少一个目标关键词;再针对每一个目标关键词,将目标关键词与词库中的预设词语进行匹配,得到匹配结果;其中,词库中的预设词语对应一个第一用户行为标签;若匹配结果表明目标关键词在词库中,则对用户返回的第一用户行为标签的频率进行统计;若用户返回的第一用户行为标签的频率大于第一阈值,则将第一用户行为标签标识为有效的用户行为标签。从而实现精准、高效地对丰富用户行为标签的目的。高效地对丰富用户行为标签的目的。高效地对丰富用户行为标签的目的。

【技术实现步骤摘要】
用户行为标签的丰富方法、相关装置及计算机存储介质


[0001]本申请涉及计算机
,特别涉及一种用户行为标签的丰富方法、相关装置及计算机存储介质。

技术介绍

[0002]目前,在广告投放领域,数据管理平台(DataManagementPlatform,DMP)是广告投放的重要基础设施,客户可以根据自己的需求进行定向投放,如定向男,女标签。DMP是把分散的多方数据进行整合纳入统一的技术平台,并对这些数据进行标准化和细分,让用户可以把这些细分结果推向现有的互动营销环境里的平台。标签系统是DMP的重要组成元素之一,其中用户标签尤为重要,用户标签又包括用户画像,用户行为标签等。
[0003]在标签数据挖掘领域,常用的打数据标签的方法有人工打标签,规则提取和基于机器学习算法的标签提取方法。
[0004]人工打标签一般试用于数据量较小的标签,如app的分类,对于一般的程序化交易平台adx,会接入大量的第三方dsp,而第三方dsp会有海量的素材数据,所以通过人工打标签对全量用户和素材进行人工标识代价太大。
[0005]规则提取标签是人工制定一系列的规则用户标签的提取,如针对用户的活跃分成高活跃,低活跃和沉默用户,可以根据用户的平均启动app次数进行制定,缺点是标签提取的规则制定必须可以容易量化。

技术实现思路

[0006]有鉴于此,本申请提供一种用户行为标签的丰富方法、相关装置及计算机存储介质,可以精准、高效地对丰富用户行为标签。
[0007]本申请第一方面提供了一种用户行为标签的丰富方法,包括:
[0008]针对每一个第三方需求平台返回的广告素材,对所述广告素材进行清洗,得到目标广告素材;
[0009]对所述目标广告素材的文本信息进行关键词提取,得到至少一个目标关键词;
[0010]针对每一个所述目标关键词,将所述目标关键词与词库中的预设词语进行匹配,得到匹配结果;其中,所述词库中的预设词语对应一个第一用户行为标签;
[0011]若匹配结果表明所述目标关键词在所述词库中,则对用户返回的第一用户行为标签的频率进行统计;
[0012]若所述用户返回的第一用户行为标签的频率大于第一阈值,则将所述第一用户行为标签标识为有效的用户行为标签。
[0013]可选的,所述用户行为标签的丰富方法,还包括:
[0014]若匹配结果表明所述目标关键词不在所述词库中,则所述目标关键词过滤。
[0015]可选的,所述词库的构建方法,包括:
[0016]对每一个所述目标广告素材的文本信息进行分词处理,得到多个词语;
[0017]针对每一个词语,确定所述词语所属的预设类别,得到预设词语;其中,所述预设词语为所述词语打上所述词语所属的预设类别的标签的词语;
[0018]根据所述预设词语构建得到词库。
[0019]可选的,所述用户行为标签的丰富方法,还包括:
[0020]对所述目标广告素材的域名进行提取,基于所述域名的归属公司,为所述目标广告素材的域名设置第二用户行为标签;其中,在用户点击所述域名或点击所述域名的次数超过第二阈值时,为所述用户添加第二用户行为标签。
[0021]可选的,所述用户行为标签的丰富方法,还包括:
[0022]在广告投放过程中,根据所述有效的用户行为标签进行投放;
[0023]根据投放反馈结果判断所述有效的用户行为标签是否满足预设的要求;
[0024]若判断出所述有效的用户行为标签不满足预设的要求,则对所述词库以及所述第一阈值进行调整。
[0025]可选的,所述用户行为标签的丰富方法,还包括:
[0026]将所述有效的用户行为标签,应用于点击率预估的特征工程;
[0027]根据所述点击率预估的特征工程的实际应用情况,判断所述有效的用户行为标签是否满足预设的要求;
[0028]若判断出所述有效的用户行为标签不满足预设的要求,则对所述词库以及所述第一阈值进行调整。
[0029]本申请第二方面提供了一种用户行为标签的丰富装置,包括:
[0030]预处理单元,用于针对每一个第三方需求平台返回的广告素材,对所述广告素材进行清洗,得到目标广告素材;
[0031]提取单元,用于对所述目标广告素材的文本信息进行关键词提取,得到至少一个目标关键词;
[0032]匹配单元,用于针对每一个所述目标关键词,将所述目标关键词与词库中的预设词语进行匹配,得到匹配结果;其中,所述词库中的预设词语对应一个第一用户行为标签;
[0033]统计单元,用于若匹配结果表明所述目标关键词在所述词库中,则对用户返回的第一用户行为标签的频率进行统计;
[0034]确定单元,用于若所述用户返回的第一用户行为标签的频率大于第一阈值,则将所述第一用户行为标签标识为有效的用户行为标签。
[0035]可选的,所述用户行为标签的丰富装置,还包括:
[0036]过滤单元,用于若匹配结果表明所述目标关键词不在所述词库中,则所述目标关键词过滤。
[0037]可选的,所述词库的构建单元,包括:
[0038]分词单元,用于对每一个所述目标广告素材的文本信息进行分词处理,得到多个词语;
[0039]标签单元,用于针对每一个词语,确定所述词语所属的预设类别,得到预设词语;其中,所述预设词语为所述词语打上所述词语所属的预设类别的标签的词语;
[0040]词库构建子单元,用于根据所述预设词语构建得到词库。
[0041]可选的,所述用户行为标签的丰富装置,还包括:
[0042]设置单元,用于对所述目标广告素材的域名进行提取,基于所述域名的归属公司,为所述目标广告素材的域名设置第二用户行为标签;其中,在用户点击所述域名或点击所述域名的次数超过第二阈值时,为所述用户添加第二用户行为标签。
[0043]可选的,所述用户行为标签的丰富装置,还包括:
[0044]投放单元,用于在广告投放过程中,根据所述有效的用户行为标签进行投放;
[0045]第一判断单元,用于根据投放反馈结果判断所述有效的用户行为标签是否满足预设的要求;
[0046]第一调整单元,用于若所述第一判断单元判断出,所述有效的用户行为标签不满足预设的要求,则对所述词库以及所述第一阈值进行调整。
[0047]可选的,所述用户行为标签的丰富装置,还包括:
[0048]应用单元,用于将所述有效的用户行为标签,应用于点击率预估的特征工程;
[0049]第二判断单元,用于根据所述点击率预估的特征工程的实际应用情况,判断所述有效的用户行为标签是否满足预设的要求;
[0050]第二调整单元,用于若所述第二判断单元判断出,所述有效的用户行为标签不满足预设的要求,则对所述词库以及所述第一阈值进行调整。
[0051]本申请第三方面提供了一种电子设备,包括:
[0052]一个或多个处理器;
[0053]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户行为标签的丰富方法,其特征在于,包括:针对每一个第三方需求平台返回的广告素材,对所述广告素材进行清洗,得到目标广告素材;对所述目标广告素材的文本信息进行关键词提取,得到至少一个目标关键词;针对每一个所述目标关键词,将所述目标关键词与词库中的预设词语进行匹配,得到匹配结果;其中,所述词库中的预设词语对应一个第一用户行为标签;若匹配结果表明所述目标关键词在所述词库中,则对用户返回的第一用户行为标签的频率进行统计;若所述用户返回的第一用户行为标签的频率大于第一阈值,则将所述第一用户行为标签标识为有效的用户行为标签。2.根据权利要求1所述的丰富方法,其特征在于,还包括:若匹配结果表明所述目标关键词不在所述词库中,则所述目标关键词过滤。3.根据权利要求1所述的丰富方法,其特征在于,所述词库的构建方法,包括:对每一个所述目标广告素材的文本信息进行分词处理,得到多个词语;针对每一个词语,确定所述词语所属的预设类别,得到预设词语;其中,所述预设词语为所述词语打上所述词语所属的预设类别的标签的词语;根据所述预设词语构建得到词库。4.根据权利要求1所述的丰富方法,其特征在于,还包括:对所述目标广告素材的域名进行提取,基于所述域名的归属公司,为所述目标广告素材的域名设置第二用户行为标签;其中,在用户点击所述域名或点击所述域名的次数超过第二阈值时,为所述用户添加第二用户行为标签。5.根据权利要求1所述的丰富方法,其特征在于,还包括:在广告投放过程中,根据所述有效的用户行为标签进行投放;根据投放反馈结果判断所述有效的用户行为标签是否满足预设的要求;若判断出所述有效的用户行为标签不满足预设的要求,则对所述词库以及所述第一...

【专利技术属性】
技术研发人员:杨运超张雄虎何亮姜昆鹏李迅
申请(专利权)人:湖南快乐阳光互动娱乐传媒有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1