【技术实现步骤摘要】
一种信息向量确定方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种信息向量确定方法、装置、设备及存储介质。
技术介绍
在信息推荐领域,通常利用模型将用户的特征和网络上各类信息的特征转化为向量,通过计算用户向量与信息向量之间的相似度,衡量用户与该信息之间的相关程度,从而将相关程度较高的信息推荐给用户。但是对于网络上新出现的信息,由于模型并未获取该信息的特征,无法得到该信息的向量。现有技术的解决方法通常是将网络上新出现的信息分发给一部分用户,对点击该信息的用户的向量取平均值,将向量平均值作为该新信息的向量。但这种获取新信息向量的实现方式的准确度不高。
技术实现思路
本专利技术提供一种信息向量确定方法、装置、设备及存储介质,能够全面地确定新信息的向量,提高获取新信息向量的准确度。第一方面,本专利技术实施例提供了一种信息向量确定方法,该方法包括:从数据库中获取正样本用户的特征和负样本用户的特征,正样本用户为访问数据库中新信息的用户,负样本为未访问数据库中新信 ...
【技术保护点】
1.一种信息向量确定方法,其特征在于,包括:/n从数据库中获取正样本用户的特征和负样本用户的特征,所述正样本用户为访问数据库中新信息的用户,所述负样本为未访问数据库中新信息的用户;/n根据所述正样本用户的特征和负样本用户的特征获取正样本用户的特征向量和负样本用户的特征向量;/n根据所述正样本用户的特征向量、所述负样本用户的特征向量以及所述新信息的向量构造第一损失函数;/n对所述第一损失函数进行处理,得到最小化的第一损失函数;/n根据所述最小化的第一损失函数确定所述新信息的向量。/n
【技术特征摘要】
1.一种信息向量确定方法,其特征在于,包括:
从数据库中获取正样本用户的特征和负样本用户的特征,所述正样本用户为访问数据库中新信息的用户,所述负样本为未访问数据库中新信息的用户;
根据所述正样本用户的特征和负样本用户的特征获取正样本用户的特征向量和负样本用户的特征向量;
根据所述正样本用户的特征向量、所述负样本用户的特征向量以及所述新信息的向量构造第一损失函数;
对所述第一损失函数进行处理,得到最小化的第一损失函数;
根据所述最小化的第一损失函数确定所述新信息的向量。
2.根据权利要求1所述的方法,其特征在于,根据所述正样本用户的特征和负样本用户的特征获取正样本用户的特征向量和负样本用户的特征向量,包括:
将所述正样本用户的特征和负样本用户的特征输入第一网络模型,所述第一网络模型包括有将用户和信息转化为向量的网络结构;
根据所述第一网络模型生成正样本用户的特征向量和负样本用户的特征向量。
3.根据权利要求1或2所述的方法,其特征在于,所述第一损失函数为L,其中,M为所述正样本用户的特征向量的个数,N为所述负样本用户的特征向量的个数,Ui为第i个正样本用户的特征向量,Uj为第j个负样本用户的特征向量,A为所述新信息的向量。
4.根据权利要求3所述的方法,其特征在于,对所述第一损失函数进行处理,得到最小化的第一损失函数,包括:
根据最小化方法对所述第一损失函数进行最小化处理;
当所述第一损失函数的数值小于预设阈值时,将所述第一损失函数确定为所述最小化的第一损失函数。
5.一种信息向量确定装置,其特征在于,包括:
获取模块,用于从数据库中获取正样本用户的特征和负样本用户的特征,所述正样本用户为访问数...
【专利技术属性】
技术研发人员:成梭宇,
申请(专利权)人:喜丈上海网络科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。