当前位置: 首页 > 专利查询>山西大学专利>正文

一种融入评论信息的电商网络商品推荐方法及系统技术方案

技术编号:38488672 阅读:28 留言:0更新日期:2023-08-15 17:03
本发明专利技术提供一种融入评论信息的电商网络商品推荐方法及系统,属于互联网服务推荐领域。方法包括实体属性及其情感抽取环节、用户

【技术实现步骤摘要】
一种融入评论信息的电商网络商品推荐方法及系统


[0001]本专利技术涉及互联网服务推荐领域,特别涉及一种融入评论信息的电商网络商品推荐方法及系统。

技术介绍

[0002]互联网和智能设备的普及与发展使得全球数据迅猛增长,海量数据蕴含着巨大的价值,但也导致用户难以获取真正需要的信息,“信息过载”问题严重影响了用户的网络体验。推荐系统应运而生,用以解决信息过载问题。推荐系统根据用户的兴趣特征和历史行为,预测用户对目标商品的评分,该算法的优劣会对推荐的性能产生重大影响。在推荐算法中,学习用户偏好、商品特征和其它辅助信息特征,对用户和商品之间存在的显式和潜在关系进行建模是准确推荐的关键。在推荐系统中,用户的购买数据可以表示成图的形式,通常将用户的购买数据建模为电商网络,其中用户和商品为电商网络中的节点,若用户对商品存在购买行为,则两种节点之间存在连边,电商网络从本质上说是二分图。由于图表示学习方法具有优秀的节点表示能力,可以从图数据中学习复杂的关系,利用图神经网络进行推荐已成为一种趋势。基于图神经网络的推荐系统主要研究如何挖掘图中节点间的隐藏关系,通过本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融入评论信息的电商网络商品推荐方法,其特征在于,包括以下步骤:S10、对电商交易日志系统中用户购买数据集中的评论文本数据进行处理,利用实体属性

情感对联合抽取任务获取评论数据中的评价主体的实体属性及其情感倾向;S20、基于步骤S10获得的实体属性及其情感倾向,构建用户

实体属性二分图、实体属性

商品二分图和用户

商品交互二分图;S30、基于步骤S20获得的用户

实体属性、实体属性

商品二分图和用户

商品交互二分图,利用图注意力神经网络构建电商网络商品推荐模型;S40、基于步骤S30构建的电商网络商品推荐模型,通过迭代计算方式对模型进行训练,确定模型的最优参数;S50、利用步骤S30构建的电商网络商品推荐模型以及步骤S40确定的模型最优参数,计算用户商品间的推荐得分,排序后确定推荐结果并输出。2.根据权利要求1所述一种融入评论信息的电商网络商品推荐方法,其特征在于,所述步骤S10具体包含以下步骤:S11、使用预训练好的BERT模型对评论文本进行初始化,得到每个单词包含丰富上下文信息的向量表示,该过程的形式化的表示如式(1)所示:x
t
=BERT(w
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)通过BERT(
·
)模型获取w
t
的相应词向量表示;其中,w
t
为评论文本中第t个单词,x
t
为该单词的向量表示;S12、边界预测:使用LSTM模型对向量x
t
进一步编码,采用一个LSTM模型取名为LSTM
B
,配合CRF框架预测其边界标签序列,边界标签集Y
B
为{I,O},其中,I是Inside,代表评论中该词的标签是I,此词属于实体属性;O是Outside,代表评论该词的标签是O,此词不属于实体属性,其形式化的过程如式(2)所示:其中,为第t个词对应的隐藏层向量表示,LSTM
B
(x
t
)上的箭头表示正向编码和反向编码;S13、统一标签预测:基于S12使用另外一个LSTM模型,取名为LSTM
U
,进行统一标签预测,将S12中的LSTM
B
和LSTM
U
进行串联,使LSTM
B
生成的向量表示直接作为引导信息提供给LSTM
U
,具体来说,该过程如式(3)所示:其中,为第t个词对应的隐藏层向量表示,上的箭头表示正向编码和反向编码;利用CRF计算统一预测标签,概率计算方式如式(4)所示:其中,表示实体属性情感倾向的概率分数,W
U
和b
U
为编码权重和偏置;边界信息有助于提高序列标注任务的性能,通过构建一个标签转移矩阵W
BG
,来连接边界标签和统一标签,边界标签和统一标签之间的转移概率设为相同的概率,如式(5)所示:
使用CRF计算边界预测的标签,概率计算方式如式(6)所示:其中,表示边界预测概率分数,W
B
和b
B
为编码权重和偏置;通过W
BG
将边界标签的概率分数映射到统一的标签空间,由此,可以得到统一标签概率分数率分数其中,为边界预测标签的概率分数,W
BG
为转移矩阵;为了融合直接得到的统一标签和经过转移得到的统一标签使用了一个超参数α,利用门控机制融合直接得到的统一标签和经过转移得到的统一标签的信息,如式(8)所示:其中,为融合直接得到的统一标签和经过转移得到的统一标签的最终标签概率分数,为式(4)概率分数,为式(7)所示统一标签概率分数;S14、构建联合优化目标函数进行训练,其形式化的过程如式(9)、式(10)和式(11)所示:示:L=L
B
+L
U
ꢀꢀꢀꢀꢀꢀꢀ
(11)其中,L
B
为边界预测任务的损失,L
U
为统一标签预测任务的损失函数,通过最小化边界预测任务和统一标签预测损失函数进行模型训练,L代表损失函数,T代表每条评论中单词数;S15、实体属性

情感关系确定:对任意一个评论文本text∈D
ij
,使用S14中训练好的模型进行预测,得到评论文本中实体属性及其情感倾向概率分数;其中,某实体属性在积极标签POS上的概率为其包含词的积极标签POS概率的均值,消极标签NEG和中立标签NEU使用类似手段进行处理,将以上三类标签空间中的概率通过softmax函数进行归一化,其概率最大的一类即为实体属性相应的标签,对于用户u
i
能得到实体属性集及其对应的情感概率,item能得到实体属性集及其对应的情感概率。3.根据权利要求1所述一种融入评论信息的电商网络商品推荐方法,其特征在于,所述步骤S20具体包含以下步骤:基于步骤S10抽取出实体属性term及其情感标签信息,将其转化为用户

实体属性二分
图G=(X,Y,E),其中:X={x1,x2,...,x
M
}表示用户

商品购买关系数据集中M个用户构成的集合,其中x
m
表示第m个用户,m∈[1,M];Y={y1,y2,...,y
N
}表示N个实体属性构成的集合,其中y
n
表示第n个实体属性,n∈[1,N];E={e
mn
}
m=1,2,...,M,n=1,2,...,N
表示用户对不同实体属性的情感态度偏好,e
mn
表示用户x
m
对实体属性y
n
的偏好概率分数;同理,构建实体属性

商品二分图。4.根据权利要求1所述一种融入评论信息的电商网络商品推荐方法,其特征在于,所述步骤S30中利用图注意力神经网络构建电商网路商品推荐模型包含嵌入层、传播层和预测层三个部分。5.根据权利要求1所述一种融入评论信息的电商网络商品推荐方法,其特征在于,所述步骤S30具体包含以下步骤:S31、使用图注意力神经网络将用户

实体属性二分图、实体属性

商品二分图编码为低维空间中的向量表示;在user

term中,设T为S10获得的实体属性,分别为实体属性term_j被分为3种情感的概率;T_num为实体属性term_j在user_i中出现的次数;利用实体属性的情感来确定其连边的权重,实体属性第i次的初始化方式如式(12)所示:将多次出现的实体属性term_j的权重平均值作为该实体属性在user

term图中边W
ij
的权重;由此,得到user

term图中边的权重;其中,为实体属性积极情感的概率;为实体属性消极情感的概率;为实体属性中性情感的概率;weight
j
表示实体属性term_j的权重;S32、利用图注意力神经...

【专利技术属性】
技术研发人员:杜航原白雪王文剑白亮梁吉业
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1