The invention provides a forum post recommendation method, system, equipment and storage medium, which includes: collecting the text of each post in the forum; calculating the word vectors of each word in the text of the said post; acquiring the record of historical Posts browsed by users; and calculating the similarity between the historical Posts browsed by users and other posts in the Forum according to the word vectors of each said post. Degree: Recommend forum posts to users according to the calculated similarity. By adopting the scheme of the invention, the posts with high similarity between recommendation and historical Posts browsed by users can be realized based on the shallow double-layer neural network model, which can achieve better results in the field of text similarity calculation, fully exploit the hidden features of user preferences, better reflect user preferences, thereby improving user satisfaction, and thereby improving user click through. Excessive rate.
【技术实现步骤摘要】
论坛帖子推荐方法、系统、设备及存储介质
本专利技术涉及计算机网络
,尤其涉及一种论坛帖子推荐方法、系统、设备及存储介质。
技术介绍
在司机论坛中,司机会把自己的一些意见、建议反馈出来,在反馈信息的同时,也可以通过PGC(ProfessionalGeneratedContent,专业生成内容)产生一些高质量文章,解答司机运输、货运交接过程中的一些疑惑。在货物运输过程中,司机也会分享一些路途中的见闻、反馈自己对APP的一些观点等等。与此同时司机也会阅读论坛中的其他用户或者PGC的论坛帖子。为了提升司机的阅读效率,现有的论坛会分析司机的喜好,为司机推荐司机可能感兴趣的帖子来阅读。现有的论坛推荐中,使用的技术往往是基于有监督的分类学习方法。现有技术大多通过主观性的从文章中提取特征,然后对所有文章进行multilabel(多重标签)标记,然后基于此数据,进行有监督训练,最终得到训练结果。例如首先将论坛帖子中各个词的数据通过NaiveBayes(朴素贝叶斯)模型,计算给定类别的条件概率,最终通过生成式的方式得到最大可能类别。通过分析用户历史阅读记录,对用户阅读的文章进行排序,根据该用户对于某文章的喜爱程度,优先推荐同类别的文章。然而,主观性的特征提取很难发现用户喜好中的隐藏特征;而且根据历史经验来看,朴素贝叶斯模型对于文本相似度性能并非太好;此外对于用户喜好文章列表,仅仅给出排序,无法量化喜好程度,推荐效果欠佳。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供一种论坛帖子推荐方法、系统、设备及存储介质,能够充分发掘用户喜好特征中的隐藏特性,更好地体现用 ...
【技术保护点】
1.一种论坛帖子推荐方法,其特征在于,包括如下步骤:采集论坛中各个帖子的文本;计算所述帖子的文本中各个词的Word2Vec词向量;获取用户浏览的历史帖子记录;根据各个所述帖子的Word2Vec词向量,计算用户浏览的历史帖子与论坛中其他各个帖子的相似度;根据计算得到的相似度向用户推荐论坛帖子。
【技术特征摘要】
1.一种论坛帖子推荐方法,其特征在于,包括如下步骤:采集论坛中各个帖子的文本;计算所述帖子的文本中各个词的Word2Vec词向量;获取用户浏览的历史帖子记录;根据各个所述帖子的Word2Vec词向量,计算用户浏览的历史帖子与论坛中其他各个帖子的相似度;根据计算得到的相似度向用户推荐论坛帖子。2.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述采集论坛中各个帖子的文本之后,还包括采用jieba分词方法对各个帖子的文本进行分词的步骤。3.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述计算所述帖子的文本中各个词的Word2Vec词向量,包括如下步骤:计算所述帖子的文本中各个词的独热编码向量;将所述各个词的独热编码向量输入至训练好的Word2Vec模型,得到各个词的Word2Vec词向量,得到各个帖子的Word2Vec词向量;4.根据权利要求3所述的论坛帖子推荐方法,其特征在于,所述Word2Vec模型为Skip-gram模型,所述Skip-gram模型包括输入层、隐藏神经网络层和输出层,所述各个词的独热编码向量输入所述输入层,所述隐藏层对所述独热编码向量进行降维处理,所述输出层对所述隐藏神经网络层的输出进行Softmax回归,输出与各个词的独热编码向量维度相同的Word2Vec词向量。5.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述计算所述帖子的文本中各个词的Word2Vec词向量之后,还包括如下步骤:对所述帖子中各个词的词向量进行筛选,将符合预设筛选条件的词向量筛除。6.根据权利要求1所述的论坛帖子推荐方法,其特征在于,所述计算用户浏览的历史帖子与论坛中其他各个帖子的相似度,包括如下步骤:计算用户浏览的历史帖子中各个词与论坛中一帖子中各个词的相似度,并将计算得到的相似度结果取平...
【专利技术属性】
技术研发人员:刘祥,罗竞佳,邓金秋,沙韬伟,
申请(专利权)人:江苏满运软件科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。