The invention discloses a calculation method and device for personalized emotional summary, which can automatically generate personalized emotional summary according to different users. The calculation method includes: building data sets based on user comment data information; filtering data sets based on presupposed factor information to get filtering results; coding the filtering results using bidirectional LSTM by user sensitive encoder, modeling the content of comments with high user attention from filtering results based on user selection mechanism, and obtaining the modeling results; User-sensitive decoders decode the modeling results and input user vectors and user-specific vocabulary to the vocabulary prediction stage of the decoder, which makes the decoder output personalized emotional abstracts. According to the technical scheme of the invention, the user-based selection mechanism is adopted in the coding stage to filter comments according to the differences of users'concerns, and the user-related vocabulary is fused in the decoding stage to generate personalized emotional summaries.
【技术实现步骤摘要】
一种个性化情感摘要的计算方法与装置
本专利技术涉及网络信息领域,特别涉及一种个性化情感摘要的计算方法与装置。
技术介绍
情感摘要的目的是给一篇或者是多篇评论生成一个简要的摘要。给定一篇评论,由于不同的用户有着不同的经历以及不同的想法,导致他们会关注评论的不同内容。图1给出了酒店评论的一个例子。用户A可能是商务出行,他对酒店的位置和房间的关注多于对酒店价格的关注,而用户B可能是穷游,因此在选择酒店时更关注于酒店的价格。不仅如此,不同用户也有他们各自的用词习惯,用户C可能就经常总结会用一些显示表达他情感的词来总结他的评论,然而用户A和用户B却不这么做。传统的情感摘要系统仅仅关注评论内容,生成的摘要对于所有的用户都是一样的。而个性化的情感摘要可以针对不同的读者,生成不同的摘要。这些摘要可以直接反映读者对产品要素的不同偏好,应该能更有助于他们选择产品。鉴于此,提出本专利技术。
技术实现思路
本专利技术提供个性化情感摘要的计算方法与装置,用于解决传统的情感摘要系统仅仅关注评论内容,生成的摘要对于所有的用户都是一样,而不具备个性化的问题。为了达到上述目的,根据本专利技术的第一个方面,提供一种个性化情感摘要的计算方法,并采用如下具体方案:一种个性化情感摘要的计算方法包括:基于用户评论数据信息构建数据集;基于预设要素信息对所述数据集进行过滤,得到过滤结果;通过用户敏感编码器,对所述过滤结果使用双向LSTM进行编码后,基于用户选择机制从所述过滤结果中,获取用户关注度高的评论内容进行建模,得到建模结果;通过用户敏感解码器对所述建模结果进行解码,并输入用户向量及用户特定词汇至所述解 ...
【技术保护点】
1.一种个性化情感摘要的计算方法,其特征在于,包括:基于用户评论数据信息构建数据集;基于预设要素信息对所述数据集进行过滤,得到过滤结果;通过用户敏感编码器,对所述过滤结果使用双向LSTM进行编码后,基于用户选择机制从所述过滤结果中,获取用户关注度高的评论内容进行建模,得到建模结果;通过用户敏感解码器对所述建模结果进行解码,并输入用户向量及用户特定词汇至所述解码器的词汇预测阶段,使得所述解码器输出个性化情感摘要。
【技术特征摘要】
1.一种个性化情感摘要的计算方法,其特征在于,包括:基于用户评论数据信息构建数据集;基于预设要素信息对所述数据集进行过滤,得到过滤结果;通过用户敏感编码器,对所述过滤结果使用双向LSTM进行编码后,基于用户选择机制从所述过滤结果中,获取用户关注度高的评论内容进行建模,得到建模结果;通过用户敏感解码器对所述建模结果进行解码,并输入用户向量及用户特定词汇至所述解码器的词汇预测阶段,使得所述解码器输出个性化情感摘要。2.根据权利要求1所述的计算方法,其特征在于,所述基于用户评论数据信息构建数据集包括:从目标网站抓取所述用户评论信息;将所述用户评论信息按照用户-评论-摘要三元组形式构建所述数据集。3.根据权利要求1所述的计算方法,其特征在于,所述基于预设要素信息对所述数据集进行过滤,得到过滤结果包括:基于所述目标网站定义所述预设要素信息;根据要素分割算法将所述预设要素信息自动拓展种子词;基于所述预设要素信息及所述种子词对所述数据集进行第一次过滤,得到第一次过滤结果;对所述第一过滤结果进行长度过滤,过滤掉题目词汇小于预设数量的用户评论信息,得到第二次过滤结果;对所述第二次过滤结果进行压缩比过滤,过滤掉评论长度与题目长度比值大于预设阈值的所述用户评论信息,得到所述过滤结果。4.根据权利要求1所述的计算方法,其特征在于,所述通过用户敏感编码器,对所述过滤结果使用双向LSTM进行编码后,基于用户选择机制从所述过滤结果中,获取用户关注度高的评论内容进行建模,得到建模结果包括:基于用户选择机制的网络输入是用户向量u和编码端的隐层状态hi,输出是通过一个门向量gatei进行过滤后得到的源端隐层向量:gatei=σ(Wk[hi;u]+bk)(1)其中wk和bk是选择机制的参数,[;]是连接符号,σ表示的是sigmoid活函数,并且指的是逐位相乘的操作,h’i指的是保留hi信息的量,称为源端隐层向量。5.根据权利要求4所述的计算方法,其特征在于,所述通过用户敏感解码器对所述建模结果进行解码,并输入用户向量及用户特定词汇至所述解码器的词汇预测阶段,使得所述解码器输出个性化情感摘要包括:在t时刻的解码过程中,解码器通过接受上一时刻解码出的词向量生成t时刻的解码状态st,然后用所述解码状态st去关注所述源端隐层向量h’i,得到t时刻的上下文向量c’t,具体计算公式如(3)(4)(5)所示:其中,Wc,W’c,bc和vTa是注意力层的参数,at,i度量的是编码隐层状态hi和当前解码状态st的重要性得分,e′t,i为使用用户敏感编码器过滤后编码器顶层的隐藏状态,包含了待输入到连接层的隐藏向量,c′t为t时刻的上下文向量,和要素at相关的句子i的表示;将用户关注词汇表融入到词汇预测模块,得到影响词汇的概率分布Pvoc,,使用注意力机制来从所述用户特定词汇表中抽取词汇得到用户词表,用mt表示;mt=∑kβt,kUk(8)其中,wm,W′m,bm和vTb是...
【专利技术属性】
技术研发人员:张世博,沙芸,杨飞,
申请(专利权)人:北京石油化工学院,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。