一种基于用户偏好与知识图谱的个性化产品描述生成方法技术

技术编号：29047238 阅读：15 留言：0更新日期：2021-06-26 06:04

本发明专利技术公开了一种基于用户偏好与知识图谱的个性化产品描述生成方法，通过对产品标题进行实体信息提取，再使用Graph Attention从外部知识库中提取与实体信息最相关的知识并进行融合，进一步增强实体中的知识；同时基于模型预测出用户的多个兴趣标签，再对用户进行聚类分析，通过TFIDF为同类用户构建专属的个性化词库；最后提出了一种多重指针生成网络融合来自产品标题、外部知识库与个性化词库中的知识，最终生成具有信息量、多样性的个性化产品描述。本发明专利技术能够通过产品标题与外部知识库，依据用户历史行为自动批量生成个性化的产品描述，解决人工撰写产品描述费事费力的问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户偏好与知识图谱的个性化产品描述生成方法

[0001]本专利技术属于知识表示
，具体涉及一种个性化产品描述生成方法。

技术介绍

[0002]计算机与互联网技术极大的改变了人们的生活与行为方式，其中居民消费习惯的变化最为明显。依据商务部数据，2019年电子商务交易额已经达全年GDP的35.13％，可以看出，电子商务经济已经成为中国经济体系的重要组成部分。
[0003]与传统线下商店相不同，用户在网络空间中无法与产品实体进行交互，只能依靠产品描述进一步了解产品信息，从而做出购买决策。产品描述是用户获取产品信息的主要渠道，其目的是向顾客提供有关产品的特性和优点。传统的产品描述通常是由商家聘用“专家”，根据产品信息进行手工撰写。然而手工撰写商品描述效率低下且成本较高，对于公司推广产品来说是一个较大的负担。在互联网如此庞大的电商规模之下，传统的手工撰写产品描述的方式已无法满足新时代的需求。人类撰写的商品描述受限于撰写者的经验、知识、对于产品的了解程度，在这样大规模、高频率的产品更新的情况下，人类撰写者没有时间、也没有精力去了解每一个产品的详细情况，导致写出的商品描述质量难以保证。另一方面，人工撰写的产品描述难以满足个性化需求，大多是尽可能覆盖所有的产品卖点，不同用户看到的都是相同的产品描述，可能会导致用户无法瞬间抓取到自己感兴趣的信息，最终丧失了进一步了解产品的动力。
[0004]现有的关于商品描述和评论生成的方法，大多基于人工构建的规则或简单的生成模型，根据产品标题或结合外部知识库生成通用的产...

【技术保护点】

【技术特征摘要】
1.一种基于用户偏好与知识图谱的个性化产品描述生成方法，其特征在于，包括以下步骤：步骤1：获取产品描述数据集，采集互联网电商网站中的产品描述Y＝(y1，y2，...y
n
)、产品标题X＝(x1，x2，...x
m
)、与用户评论数据<user
id
，user
review
>；步骤2：以产品标题中的实体在知识库中进行检索，将检索出的知识G分为两个部分：关系r＝DESC的知识表示为G1＝G
r＝DESC
，剩余的知识表示为G2＝G
r≠DESC
；使用TransE将知识库中检索到的实体与关系映射到低维空间；步骤3：将知识库中检索到的知识G1所包含三元组K1中的值按照它们对应的实体在产品标题X中的顺序进行拼接，然后使用双向GRU对K1进行编码；使用Attention机制选择知识，Attention机制描述为式(1)：ttention机制选择知识，Attention机制描述为式(1)：ttention机制选择知识，Attention机制描述为式(1)：其中，为编码阶段的第i个时间步的隐状态，是解码阶段第t个时间步的隐向量，W
k
，W
′
k
，b
k
和v是需进行学习的参数，v用于调整权重的维度，j表示时间步，为用Attention机制选择结果的上下文向量；步骤4：将知识库中检索到的知识G2，使用TransE将知识G2中所有的实体与关系映射为低维向量，知识G2的三元组K2被映射为τ＝(e，r，val)＝MLP(TransE(e，r，val))，其中τ，e，r和val分别为τ，e，r和val的TransE向量表示，MLP是全连接神经网络，用于消除结构化数据与非结构化的文本数据之间的隔阂，τ为映射后的三元组，e表示实体，val表示值；使用GraphAttention对检索出的知识进行选择与整合，如以下式(2)所示：ttention对检索出的知识进行选择与整合，如以下式(2)所示：ttention对检索出的知识进行选择与整合，如以下式(2)所...

【专利技术属性】
技术研发人员：郭斌，郝少阳，於志文，梁韵基，王柱，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人