The invention discloses a recommendation method based on deep semantics of the text, according to the deep semantics grid model automatic extraction of text, according to the situation of semantic reasoning of theme semantic analysis method in different text background, realize the integration situation of text tree, according to the user's real-time situation for each document to construct user interest picture text. According to the situation of the user real-time fluctuations in query end scenario semantic selection of text topic tree, query content query topics of interest modeling, based on the activation diffusion method of two latent semantic reasoning directly to the user interest in the subject, the theme of the global shock calculation of value, interest in constructing a query semantic fusion current user portrait. The similarity calculation method is used to score the document, and the text recommendation list is generated according to the score.
【技术实现步骤摘要】
一种基于深度语义辨析的文本推荐方法
本专利技术涉及推荐
,涉及一种基于深度语义辨析的文本推荐方法,特别涉及一种基于类脑“分层-发散”思考模式构建的深度语义网格模型与文本主题情景语义辨析的推荐方法。
技术介绍
推荐系统在上世纪90年代被提出,早期的推荐系统主要关注于检索结果的形式相似性,而忽略了检索结果与查询的语义相关性,导致推荐结果的噪音很大。近几年,随着无纸化数据的爆发式增长,信息检索的有效性问题引起了研究人员的广泛关注,提出多种基于语义的信息检索方法。在个性化语义推荐方面,主要分为形式语义学和社会语义学两类方法。社会语义学方法一方面通过分析用户日志、用户标签、领域流行度和用户活跃度等信息,构建用户人体画像,达到个性化推荐的效果;另一方面基于用户相似性和项目相似性的方法,通过最相似的若干用户对某个项目的评分逼近目标用户对该项目的评分达到推荐效果,例如协同过滤方法。前者提高了检索结果的兴趣相关性,但是需要分析大量的用户行为数据,显然大部分用户的数据达不到这个要求,同时,这种方法的本质是兴趣关键词的形式匹配,缺乏语义分析和潜在兴趣挖掘的能力;后者虽然更加人性化 ...
【技术保护点】
一种基于深度语义辨析的文本推荐方法,其特征在于,所述文本推荐方法包含如下步骤:步骤1:基于类脑“分层‑发散”思考模式构建深度语义网格模型;步骤2:结合“网格主题‑同义词袋”模型和词匹配技术推理文本的网格主题集,利用网格模型的“联想‑记忆”功能将分散的主题联结,然后利用情景语义分析功能推理不同激活主题在当前文本下的情景标签,最后构建融合多种情景语义以及记忆联结的文本主题树;步骤3:根据用户兴趣对文本主题树进行剪枝处理,即过滤掉不符合用户当前情景状态的主题和关系,从而构建基于情景语义筛选的文本主题树;步骤4:利用TF‑IDF算法统计数据库中所有经过情景语义筛选后的文本主题树,计 ...
【技术特征摘要】
1.一种基于深度语义辨析的文本推荐方法,其特征在于,所述文本推荐方法包含如下步骤:步骤1:基于类脑“分层-发散”思考模式构建深度语义网格模型;步骤2:结合“网格主题-同义词袋”模型和词匹配技术推理文本的网格主题集,利用网格模型的“联想-记忆”功能将分散的主题联结,然后利用情景语义分析功能推理不同激活主题在当前文本下的情景标签,最后构建融合多种情景语义以及记忆联结的文本主题树;步骤3:根据用户兴趣对文本主题树进行剪枝处理,即过滤掉不符合用户当前情景状态的主题和关系,从而构建基于情景语义筛选的文本主题树;步骤4:利用TF-IDF算法统计数据库中所有经过情景语义筛选后的文本主题树,计算主题的权重值并映射到相应的网格主题节点中,为每篇文档构建出用户文本兴趣画像;步骤5:根据伪相关反馈方法抽取出与用户查询内容相关的文档以及相应的情景语义筛选后的文本主题树,统计反馈树中主题的频次并做归一化处理得到初始兴趣主题激活值;步骤6:利用激活扩散机制计算反馈学习下初始兴趣网格主题与潜在兴趣网格主题的全局动态激活值,将计算结果赋值给网格模型中相应的主题节点,构建融合当前情景语义的用户查询兴趣画像;步骤7:利用基于网格的余弦相似度计算方法,为用户查询兴趣画像和用户文本兴趣画像之间的深度语义相关度进行评分,并生成推荐列表进行推荐。2.如权利要求1所述的一种基于深度语义辨析的文本推荐方法,其特征在于,步骤1中所述的深度语义网格模型是依据类脑“分层-发散”思维模式构建的,所述构建过程具体包括:第一步,选取具有多领域融合的分类本体,利用Stanford大学的自然语言处理工具对本体中主题作语义拆分和词性还原处理得到核心主题集,按照本体的记忆特性将核心主题连接成发散的网格模型;第二步,构建“网格主题-同义词袋”语义映射模型,“主题”代表分层网格模型中核心主题,“词袋”是通过抽取上述主题在WordNet词典中的同义术语集合组成。若“主题-词袋”模型中术语在文本中出现,则该主题被激活并将对应的网格节点属性设置为“1”,实现文本浅层语义主题挖掘功能;第三步,遍历DBpedia知识库中“主题-标签-摘要”三元组,将三元组中主题与“主题-词袋”模型中术语进行匹配并抽取知识库中匹配主题对应的标签和摘要数据,将“网格主题-DBpedia主题-标签-摘要”逐层映射,并用语义相关关系类型进行关联;第四步,以“分层-记忆”网格模型为骨架,实现“同义词袋-网格主题-DBpedia主题-标签-摘要”融合的“发散-深层”语义网格模型。3.如权利要求1所述的一种基于深度语义辨析的文本推荐方法,其特征在于,步骤2中采用了基于DBpedia知识库的主题情景语义辨析方法,所述语义辨析方法的具体步骤如下:第一步,生成文档中激活主题s动态跨度加窗后上下文的术语集合,Keys。第二步,生成DBpedia知识库中激活主题s所对应的不同情景标签m下摘要的术语集合,Tm,s;统计情景标签下的摘要术语个数,Nm。第三步,根...
【专利技术属性】
技术研发人员:郐弘智,陈建辉,盛文瑾,闫健卓,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。