【技术实现步骤摘要】
一种基于众包的用户需求主动预测方法及系统
本专利技术涉及计算机
,具体来说是一种基于众包的用户需求主动预测方法及系统。
技术介绍
随着互联网、大数据技术的发展,信息过载问题日益严重,推荐系统根据用户的需求信息为其提供感兴趣的商品或服务可以帮助用户进行有效的信息处理。因此,能否准确、全面、主动的预测用户需求,成为提高服务商推荐性能从而实现商业收益最大化的关键。(1)异质信息网络推荐现有的推荐技术主要基于用户的网络行为数据进行用户需求分析,大数据时代背景下的用户网络行为数据常具有多源异构性。异质信息网络可以整合不同类型的对象和对象之间复杂的交互关系,其作为有效的信息融合方法已被广泛应用于推荐领域。如申请号CN106503028A涉及一种推荐方法,所述推荐方法包括:将推荐数据集中的对象和对象之间的关系建模为异质信息网络;获取所述异质信息网络中连接两个对象的元路径;根据连接两个对象的元路径计算对象之间的相似度数据;根据对象之间的相似度数据构建目标函数,通过目标函数对所述推荐数据集进行训练,得到用户对物品的预测评分;根据所述用户对物品的预测评分将物品推荐给用户。该方法利用异质信息网络对推荐数据进行建模,有效缓解了数据稀疏问题从而提高推荐效果,该方法数据主要来源于互联网上的用户历史行为数据,但对于新注册服务平台的用户,因缺乏历史行为数据而无法捕捉到其实际需求。(2)众包推荐众包是采用某种机制使群体共同参与某件事情,达到某个目标,是一种分布式的问题解决和生产模式。众包通过群体的智慧解决机器难解 ...
【技术保护点】
1.一种基于众包的用户需求主动预测方法,其特征在于:包括以下步骤:/nS1:确定参与众包任务的标注者,设计众包任务并发布到众包任务平台上,标注者接收到众包任务并完成任务;/nS2:根据用户社交关系、历史行为数据以及众包模式采集的用户偏好信息构建异质信息网络;/nS3:对异质信息网络中不同类型的实体进行统一表征,生成用户需求数据空间;/nS4:利用异质信息网络中的元路径提取用户与需求对象的交互语义,分别学习用户和需求对象的表示向量;/nS5:根据异质信息网络中用户社交关系聚合目标用户的邻居信息,得到目标用户的表示向量并进行需求预测。/n
【技术特征摘要】
1.一种基于众包的用户需求主动预测方法,其特征在于:包括以下步骤:
S1:确定参与众包任务的标注者,设计众包任务并发布到众包任务平台上,标注者接收到众包任务并完成任务;
S2:根据用户社交关系、历史行为数据以及众包模式采集的用户偏好信息构建异质信息网络;
S3:对异质信息网络中不同类型的实体进行统一表征,生成用户需求数据空间;
S4:利用异质信息网络中的元路径提取用户与需求对象的交互语义,分别学习用户和需求对象的表示向量;
S5:根据异质信息网络中用户社交关系聚合目标用户的邻居信息,得到目标用户的表示向量并进行需求预测。
2.根据权利要求1所述的一种基于众包的用户需求主动预测方法,其特征在于:所述步骤S1包括
S11:获取服务商的用户集合作为目标用户,并从社交网络、服务商平台获取用户社交关系数据,得到目标用户的社交邻居用户集合,将以上所有用户作为接收众包任务的标注者;
S12:从人口统计学信息、反映社交关系中共同兴趣爱好的社会需求及反映个人喜好的享乐需求角度出发设计用户偏好调研问卷,问卷内容包括文字表述和图形化展示的选择题,并允许标注者自主提交辅助信息,将问卷以众包任务形式发布到众包平台上,并向S11中获取的标注者发布任务。
3.根据权利要求2所述的一种基于众包的用户需求主动预测方法,其特征在于:所述步骤S2包括:
S21:将S1基于众包模式采集的多模态数据作为每个用户的属性集合,将用户和需求对象作为节点;
S22:将用户和需求对象按照以下关系建立连边:
关系R1:用户U之间存在好友、关注等直接关系,分别用L和L-1表示用户U之间的关系,即和
关系R2:部分用户存在历史行为信息,如用户购买过某件物品、使用过某种服务等,分别用B和B-1表示用户U和需求对象Ok间的关系,即和其中,k表示第k类需求对象;
S23:根据上述属性集合、节点及节点间关系建立多模态异质信息网络。
4.根据权利要求3所述的一种基于众包的用户需求主动预测方法,其特征在于:所述步骤S3包括:
S31:针对众包模式采集的用户信息、需求对象的文本类属性信息和图像类属性信息进行统一表达:
文本类型信息采用word2vec方法得到向量表示
其中,eu表示用户文本属性向量表示,eo表示需求对象的文本属性向量表示,N为需求对象类别数量;
图片类型信息采用卷积神经网络得到向量表示
其中,gu表示用户图片属性向量表示,go表示需求对象的图片属性向量表示;
S32:对经统一表达后的多模态属性信息进行融合:将S31得到的用户属性向量eu和gu进行外积操作实现特征交叉,得到的矩阵按行展平后输入多层感知机得到用户节点初始向量表示Z,需求对象属性表示向量和重复该操作得到需求对象节点初始向量表示Ok,所有用户、需求对象的向量表示构成用户需求数据空间。
5.根据权利要求3所述的一种基于众包的用户需求主动预测方法,其特征在于:所述步骤S4包括:
S41:根据用户的历史行为信息建立多个用户-需求对象共现矩阵Tk:用户-物品共现矩阵用户-服务共现矩阵其中,|I|为物品数量,|S|为服务数量,若用户购买过某件物品或用户使用过某种服务,则在相应共现矩阵的对应位置置1;
S42:在用户的第k类需求主动预测场景中,从步骤S2构建的异质信息网络中提取UOkU元路径,表示两个用户共同使用过第k类需求对象的语义信息,共现矩阵Tk与其转置相乘,即得到在该语义下的用户间关系矩阵从步骤S2构建的异质信息网络中提取OkUOk元路径,表示两个第k类需求对象被同一个用户使用过的语义信息,通过得到该语义下的第k类需求对象间关系矩阵
S43:对S42得到的用户间关系矩阵和需求对象间关系矩阵分别按以下公式进行标准化处理,
其中,和均为对角矩阵,和分别为和的度矩阵;
S44:使用图卷积神经网络,按以下公式学习用户向量表示,
按以下公式学习第k类需求对象的向量表示,
其中,分别为第l层用户、第k类需求对象的向量表示,当l为0时,为Z,为Ok,p、W均为权重参数,⊙表示逐元素相乘操作,σ为激活函数,φ表示将向量转化为对角矩阵;
S45:重复S44中的操作,分别对用户、第k类需求对象的向量表示进行交替更新,直至最后一层卷积结束,得到所有用户和第k类需求对象的向量表示。
6.根据权利要求5所述的一种基于众包的用户需求主动预测方法,其特征在于:所述步骤S5包括:
S51:S4得到目标用户i的向量表示为用户i的邻居用户j∈N(i),使用注意力机制聚合邻居用户信息得到最终的目标用户向量表示;计算邻居对于目标用户的权重系数,
更新目标用户的向量表示,
其中,α、W为权重参数,σ为激活函数,||为拼接操作;
S52:对于每个目标用户,计算其与每个第k类需求对象的相关性预测分值
S53:损失函数为二元交叉熵函数:
其中,Y和Y-分别为数据集中正、负样本,Y表示用户使用过的需求对象集合,Y-从数据集中用户未使用过的需求对象中采样得到,表示用户与该需求对象是否存在交互,存在交互为1,否则为0;使用随机梯度下降法对上述损失函数进行优化求解,根据步骤S52计算得到的预测分值从高到低对第k类需求对象进行排序,选取前n个需求对象作为用户的第k类需求列表;
S54:重复S42-S53的操作,可以得到每个用户对于所有类别需求对象的列表,从而实现用户需求主动预测。
7.一种基于众包的用户需求主动预测系统,其特征在于:包括
众包任务发布模块:确定参与众包任务...
【专利技术属性】
技术研发人员:张以文,储蓓,王庆人,沈书泽,
申请(专利权)人:安徽大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。