【技术实现步骤摘要】
本专利技术涉及计算机信息检索领域,特别涉及面向社交网络文本内容的兴趣主题发现及语义链接的构建,以及整个主题网络的自动更新机制。
技术介绍
随着互联网技术的发展以及网民从被动授信到主动发信,社交网络和社交媒体逐渐主导互联网的信息传播。社交网络即社交网络服务(Social Network Service)。社交网络表现形式多种多样,其中博客、论坛和播客发展较早,逐渐产生了微博、社区、QQ空间、微信朋友圈等。用户通过这些社交平台进行撰写、分享、评价、讨论、互通和沟通。随着社交网络数据的爆炸式增加,导致用户无法通过导航快速浏览所需的信息,而在线的社交网络应用与传统的数据结构存在较大的差异,新的社交网络搜索引擎SNSearch成为一个新的研究热点。SNSearch系统主要由数据收集器、本体集成模块、文本索引器、数据可见性索引器、关键词查询模块、查询集成模块组成。推荐算法作为社交网络的另一个主要技术,能够有效地帮助用户主动推荐感兴趣的联系人或者内容。其中通过提前建立用户的兴趣偏好以及评分,再结合偏好相似度计算模型的协同过滤技术是目前各类平台的主体算法。如Sharm和Cosl ...
【技术保护点】
一种构建面向社交网络的兴趣主题语义网络的方法,其特征在于包含以下步骤:步骤1:读入网页文件;步骤2:文本提取,从上述网页文件中抽取所需的关键文本信息;步骤3:关键词抽取,从步骤2生成的文本信息中抽取关键词集;步骤4:构建关键词语义网络,分析页面内关键词之间的关系,并结合历史页面中的关键词关系,构建关键词与关键词之间的语义网络;步骤5:主题词判别,通过步骤4得到的语义网络关键词中心词计算模型,从关键词集中抽取候选主题词;步骤6:主题词筛选,将步骤5获得的候选主题词在基础主题库中进行精确匹配,如果没有找到则执行步骤7,否则则执行步骤8;步骤7:主题词相似度计算,通过主题词文本相 ...
【技术特征摘要】
1.一种构建面向社交网络的兴趣主题语义网络的方法,其特征在于包含以下步骤:步骤1:读入网页文件;步骤2:文本提取,从上述网页文件中抽取所需的关键文本信息;步骤3:关键词抽取,从步骤2生成的文本信息中抽取关键词集;步骤4:构建关键词语义网络,分析页面内关键词之间的关系,并结合历史页面中的关键词关系,构建关键词与关键词之间的语义网络;步骤5:主题词判别,通过步骤4得到的语义网络关键词中心词计算模型,从关键词集中抽取候选主题词;步骤6:主题词筛选,将步骤5获得的候选主题词在基础主题库中进行精确匹配,如果没有找到则执行步骤7,否则则执行步骤8;步骤7:主题词相似度计算,通过主题词文本相似和步骤4得到的语义网络相似计算步骤5得到的候选主题词与基础主题库中主题词的相似度,如果相似度大于某个阈值...
【专利技术属性】
技术研发人员:李华康,李涛,罗明,陈光宣,孙国梓,杨一涛,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。