一种基于文本挖掘与多视角融合的个性化混合推荐方法技术

技术编号:34131331 阅读:34 留言:0更新日期:2022-07-14 15:30
本发明专利技术涉及文本智能推荐计算技术领域,尤其是一种基于文本挖掘与多视角融合的个性化混合推荐方法,包括如下步骤:(1)建立评价信息与项目描述的短文本特征库、(2)建立背景数据库、(3)建立词向量表征、(4)段落向量的情感倾向性计算。本发明专利技术通过对评价信息的短文本进行拆解,提取出准确的词组、段落信息,结合背景内容的挖掘,精准分析用户的情感倾向,解决用户评价信息语义识别不准、难以精准预测用户情感倾向或是行为偏好的问题,有效、准确获取用户的需求,提高用户的体验度。提高用户的体验度。

A personalized hybrid recommendation method based on text mining and multi perspective fusion

【技术实现步骤摘要】
一种基于文本挖掘与多视角融合的个性化混合推荐方法


[0001]本专利技术涉及文本智能推荐计算
,尤其是一种基于文本挖掘与多视角融合的个性化混合推荐方法。

技术介绍

[0002]目前存在大量的用户评价信息以及项目内容描述多以短文本形式存在且情感及语义分析困难,单一视角的推荐模型容易导致推荐结果无法达到用户的满意度等问题。首先,分析用户评价信息的情感倾向,得到用户关于项目的综合评分,并在此基础上基于项目的协同过滤构建推荐模型;其次,基于词向量和深度神经网络计算项目的相似度,构建基于项目内容的推荐模型,并进一步对以上两个推荐视角进行融合,形成混合推荐模型;第三,构建基于多影响因素的半监督聚类的推荐筛选与排序模型,是较为有效的解决方案。
[0003]尤其是在电子商务、社交网络以及共享经济高速发展的今天,发现用户的需求、了解用户的行为、并为用户筛选出最相关的信息和项目是互联网服务的一个核心环节。个性化推荐作为一种帮助用户快速搜寻有用信息的工具,越来越受到人们的青睐。
[0004]传统的推荐算法通过根据用户对项目的评分进行协同过滤推荐本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于文本挖掘与多视角融合的个性化混合推荐方法,其特征在于,包括如下步骤:(1)建立评价信息与项目描述的短文本特征库:按照评价信息与项目描述的短文本内容将文本信息转化为可以检索的文字集合,在文字集合中按照词性进行分类,对于名词、动词、连接词逐一采集标序号;将采集到的词语与出现频率进行相关度统计,由使用频率的高低进行排列,记录词语在段落和句子中的位置、顺序;(2)建立背景数据库:(2.1)检测评价信息与项目描述短文本中出现的行业专有名词,确定短文本所属行业;通过确定出的行业范围进行比对,搜寻出与检测的短文本相似的文字内容;(2.2)使用步骤(1)中检测到的词语到网络数据库中比对,筛选出字词特征相关的片段标记保存;(3)建立词向量表征(3.1)以建立评价信息与项目描述的短文本特征库、建立背景数据库中同类词组进行比对,构建出短文本特征库的词意关联矩阵,针对每个词意关联矩阵涉及到的短文本,形成背景数据库和短文本涉及到的词组关联逻辑链;按照词组关联逻辑链,将短文本特征库词组变换为数字表示,形成数据集A;将背景数据库词组变换为数字表示,形成数据集B,数据集A中词组和数据集B中关联逻辑链逐一对应关系形成数据集C;所述数据集A中词组和数据集B中关联逻辑链包括对数据集A、B中词组进行顺序化标注;将进行关联逻辑链进行词典构建,根据所述词典将所述原始文本数据变换为所述数字表示;对于特定领域的短文本,由人工进行词组标注,标准产生的背景词组和逻辑链变换成数据集用数据表示;(3.2)将词组数据的数字形式输入模型中,逐一建立向量矩阵,按照逻辑链取对应的向量,将出现频度最高的词组和相关联的背景数据库中出现频度最高的词组分别经过隐藏层得到隐藏向量,所使用的激活函数为ReLu函数;将所述隐藏向量通过线性层,计算得到中心词CBOW的输出向量;根据所述输出向量和初始输入数据获得显得数据矩阵,将数据矩阵按照逻辑关联进行排列;(4)段落向量的情感倾向性...

【专利技术属性】
技术研发人员:王喜宾杨剑锋张克声郭晟南丁阿丹
申请(专利权)人:贵州理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1