【技术实现步骤摘要】
用户时空相似度的生成方法、装置、电子设备及介质
[0001]本专利技术涉及人工智能
,尤其是涉及一种用户时空相似度的生成方法
、
装置
、
电子设备及介质
。
技术介绍
[0002]随着互联网的普及和广告投放的增加,用户营销已成为业务运营中至关重要的一环
。
主动营销旨在对目标用户进行营销和干扰动作,但其面临的核心问题是如何选择适当的投放受众
。
通常将广告主圈定的少量用户称为“种子用户”或“seed users”,而需要额外获取的类似用户则被称为“相似用户”或“look
‑
alike users”。
这种基于种子用户进行相似人群扩展的过程被称为“look
‑
alike modeling”。
当前,相似用户发现技术方案主要可分为四大类:第一种是
TGI
指数标签扩散,通过利用数学统计和用户画像标签,寻找具有相似属性或更高偏好度的用户,例如同年龄段
、
同品牌偏好或共 ...
【技术保护点】
【技术特征摘要】
1.
一种用户时空相似度的生成方法,其特征在于,包括:获取用户的位置信息
、
浏览时间信息
、
用户画像特征和用户行为特征;基于所述用户的位置信息
、
浏览时间信息和用户行为特征构建用户图,并对所述用户图进行采样得到用户序列;其中,所述用户图包括:用户有向图或用户无向图;将所述用户序列
、
所述用户画像特征和所述用户行为特征输入到图神经网络模型中得到用户嵌入向量;基于所述用户嵌入向量确定所述用户的时空相似度
。2.
根据权利要求1所述的方法,其特征在于,基于所述用户的位置信息
、
浏览时间信息和用户行为特征构建用户图,包括:对所述用户的位置信息进行编码得到
Geohash
值;基于预设的时间标准将所述用户的浏览时间信息划分为多个访问时段;其中,所述预设的时间标准包括:等长时间划分标准和区分热门潮汐标准;基于所述
Geohash
值和所述访问时段生成每个所述用户的
ID
列表;基于每个所述用户的
ID
列表和所述用户行为特征,确定同一会话中有相同行为的用户,并构建每个所述会话的初始用户图;其中,所述会话为指定的
Geohash
范围和时间段内;将不同会话的所述初始用户图进行合并得到用户图
。3.
根据权利要求2所述的方法,其特征在于,将不同会话的所述初始用户图进行合并得到用户图之后,所述方法包括:根据每两个用户在同一会话中出现相同行为的次数,确定所述两个用户对应的节点在所述用户图中的边权重;剔除所述边权重小于权重阈值的边,得到优化后的用户图
。4.
根据权利要求1所述的方法,其特征在于,基于所述用户的位置信息
、
浏览时间信息和用户行为特征构建用户图之前,所述方法还包括:对所述用户的位置信息和浏览时间信息进行过滤,去除不符合预设规则的数据
。5.
根据权利要求3所述的方法,其特征在于,对所述用户图进行采样得到用户序列,包括:基于所述用户图的边权重,将每个节点的邻居节点的边权重进行归一化处理,得到每个节点和邻居节点之间的节点转移概率矩阵;基于所述节点转移概率矩阵,采用
Node2vec
算法对所述用户图进行采样得到用户序列
。6.
根据权利要求1所述的方法,其特征在于,所述图神经网络模型采用基于带权重的类
【专利技术属性】
技术研发人员:陈东,
申请(专利权)人:同程网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。