【技术实现步骤摘要】
基于文本特征和情感倾向的网络论坛用户兴趣推荐算法
[0001]本专利技术涉及网络论坛文本数据推荐
,尤其涉及基于文本特征和情感倾向的网络论坛用户兴趣推荐算法。
技术介绍
[0002]推荐系统依据用户在网络上留下的行为、文本等信息确定用户的某些习惯,获取用户喜好,推送与用户兴趣爱好和所关注内容相关的物品或信息,更加方便人们的学习、工作和生活。将基于协同分类的方法应用于基于文本数据的推荐系统中,近年来得到了越来越多研究者的关注。
[0003]网络论坛用户的关注点、好恶与立场倾向,往往直接决定了论坛平台的这些属性。然而,相比于一个由无数用户的关注点累加而形成的平台,用户个人的种种信息却往往因为其本身的数据稀疏,而导致难以归纳,给推荐系统的应用和推广带来了诸多困难。总体而言,现有面向网络论坛的舆情研究,对用户关注点的推荐能力仍较薄弱。网络论坛中的用户数据存在数据稀疏问题,且传统情感分析算法往往只给出诸如“正向”、“负向”、“中立”的结果,缺乏对情感分析结果强度的刻画,这些都导致对网络论坛中用户进行关注点推荐时的准确率仍 ...
【技术保护点】
【技术特征摘要】
1.基于文本特征和情感倾向的网络论坛用户兴趣推荐算法,其特征在于,包括以下步骤:步骤S1,基于BM
‑
25的用户文本特征计算;步骤S2,软概率情感分析计算;步骤S3,基于文本特征与软概率情感分析的关注点矩阵构造;步骤S4,自主选择半径的密度聚类算法;步骤S5,基于文本特征和情感倾向的网络论坛用户隐含关注点LFM推荐方法。2.根据权利要求1所述的基于文本特征和情感倾向的网络论坛用户兴趣推荐算法,其特征在于,所述S1中将“用户
‑
实体”关系引入后,BM
‑
25算法的一般性公式为:其中,R(U
i
,I)是用户U
i
与实体I的相关性得分,其在BM
‑
25算法中一般用公式表达为:25算法中一般用公式表达为:其中,参数b的作用是调整文档长度对相关性影响的大小,将参数b重新定义为大小可调的一个参数,它将根据用户发帖数量u的大小影响BM
‑
25特征值计算的输出:在基于网络论坛进行用户关注点的计算时,BM
‑
25算法的相关性得分公式可总结为:3.根据权利要求1所述的基于文本特征和情感倾向的网络论坛用户兴趣推荐算法,其特征在于,所述S2中基于Bert的软概率情感计算主要包括数据向量化、网络构造、防过拟合、注意力机制、全连接层、判别函数等部分,最终输出情感强度赋值,将软概率情感值与...
【专利技术属性】
技术研发人员:巨星海,王心丹,陈曲,沈池花,闵宗茹,谭江浩,蔡佳琪,周刚,刘錞,尹家禹,
申请(专利权)人:上海瀛数信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。