一种网络文章传播影响力的评价系统及方法技术方案

技术编号:7493159 阅读:217 留言:0更新日期:2012-07-10 07:10
本发明专利技术实施例提供一种网络文章传播影响力的评价系统及方法,涉及互联网领域,能够代替人工进行网络文章传播影响力评价,提高了评价效率及评价精度。其网络文章传播影响力的评价系统,包括:数据采集单元,用于对预设站点下的栏目进行数据采集;文章录入单元,用于录入待评价的文章;关键词提取单元,用于提取关键词;评价分析单元,用于根据所述关键词找出所述待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到所述待评价文章的传播影响力指数。本发明专利技术实施例用于评价网络文章传播影响力。

【技术实现步骤摘要】

本专利技术涉及互联网领域,尤其涉及。
技术介绍
近些年,互联网的迅速发展,网络媒体也相应地发展强劲,而一向作为媒体声音的评论也随之显现出新的特质和发展空间。随着互联网技术的日益普及,越来越多的网友习惯于在网络上表达自己对各种新闻信息的看法和见解。这些看法和见解常常以帖子、留言、 网络日志等方式散见于网络,其中论点明确、论述清楚的文字更是上升为完整的网络评论形式,对新近发生的新闻事件予以自发的评判和评价。当下各新闻网站纷纷设立了专门的网络评论栏目,搜集各路网友的网络评论文字,及时整合之后发出自己的声音,成为重要的舆论导向工具。一篇评论文章的发表后,由于网络的复杂性,如何来观察其传播情况?对于文章的发布者或者管理者,是非常想了解的事情。那么一篇评论文章在互联网上传播影响力如何来评价呢?目前评价网络评论文章影响力的方法是利用传统的人工方法,通过各大搜索引擎观察其转载情况。通过查看每篇转载的点击量、回帖量、是否加精、推荐等数值,做出汇总统计。专利技术人发现现有这种方法比较普遍,但至少有如下缺点一、耗时较长,效率低。由于全部由人工完成,在检索和统计时消耗时间较长。二、数据统计不准确。因为各大引擎检索结果存在网络延时、收录遗漏等原因,导致检索的结果不完整。
技术实现思路
本专利技术的实施例提供,能够代替人工进行网络文章传播影响力评价,提高了评价效率及评价精度。为达到上述目的,本专利技术的实施例采用如下技术方案一种网络文章传播影响力的评价系统,包括数据采集单元,用于对预设站点下的栏目进行数据采集,采集项目包括文章正文、文章传播影响力评价相关项;文章录入单元,用于录入待评价的文章;关键词提取单元,用于提取得到所述待评价文章的关键词;评价分析单元,用于根据所述关键词从所述数据采集单元中找出所述待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到所述待评价文章的传播影响力指数。一种网络文章传播影响力的评价方法,包括对预设站点下的栏目进行数据采集,采集项目包括转载文章正文、转载文章传播影响力评价相关项;接收用户录入的待评价的文章;提取出所述待评价的文章的关键词;利用所述关键词从采集的文章中找出所述待评价文章的转载文章;根据各转载文章的传播影响力评价相关项得到所述待评价文章传的传播影响力指数。本专利技术实施例提供的网络文章传播影响力的评价系统及方法,数据采集单元对预设站点下的栏目进行数据采集;文章录入单元录入待评价的文章;关键词提取单元提取该待评价文章的关键词;评价分析单元根据该关键词从数据采集单元中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。这样一来,本专利技术实施例提供的评价系统能够代替人工进行网络文章传播影响力评价, 在提高了评价效率的同时也提高了评价精度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的网络文章传播影响力的评价系统的结构示意框图;图2为本专利技术另一实施例提供的网络文章传播影响力的评价系统的结构示意框图;图3为本专利技术实施例提供的网络文章传播影响力的评价方法的流程框图。 具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的网络文章传播影响力的评价系统,如图1所示,包括数据采集单元101,用于对预设站点下的栏目进行数据采集,采集项目包括文章正文、文章传播影响力评价相关项。文章录入单元102,用于录入待评价的文章。关键词提取单元103,用于提取得到待评价文章的关键词。评价分析单元104,用于根据该关键词从数据采集单元101中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。本专利技术实施例提供的网络文章传播影响力的评价系统,数据采集单元对预设站点下的栏目进行数据采集;文章录入单元录入待评价的文章;关键词提取单元提取该待评价文章的关键词;评价分析单元根据该关键词从数据采集单元中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。这样一来,本专利技术实施例提供的评价系统能够代替人工进行网络文章传播影响力评价,在提高了评价效率的同时也提高了评价精度。本专利技术另一实施例提供的网络文章传播影响力的评价系统,如图2所示,包括数据采集单元101、文章录入单元102、关键词提取单元103、和评价分析单元104。其中,数据采集单元101具体包括采集模块1011,用于对预设站点下的栏目进行数据采集,采集项目可以包括采集站点、采集频道、文章标题、文章正文、链接地址、以及传播影响力评价相关项,如点击数、回帖数、是否加精、是否置顶、是否推荐、是否首页等等。此外,对于已经采集过的信息,如果点击数、回帖数、是否加精、是否置顶、是否推荐、是否首页发生变化,则可以对该信息重新采集,并将最新的值更新到采集数据库1012 中。采集数据库1012,用于存储采集模块1021采集的数据。全文检索模块1013,用于对采集数据库1012中存储的采集数据建立索引。对于数据有更新的数据,则重新建立索引。建立索引后,提供有查询接口,以便于评价分析单元 104调用查询。文章录入单元102具体包括录入模块1021,用于录入待评价的文章。录入待评价的文章时,还可以将该文章的信息一并录入,包括文正标题、链接地址、文章正文等等。录入数据库模块1022,用于存储录入模块1021录入的待评价文章。关键词提取单元103与上一实施例基本类似,可以对一段文字进行关键词的提取,并提供切词接口,以便于评价分析单元104调用。评价分析单元104具体包括文章获取模块1041,用于从录入数据库模块1022中获取待评价文章。并以并获取到该带评价文章的相关信息。关键词获取模块1042,用于将待评价文章发送给关键词提取单元103,并从该关键词提取单元103获取到待评价文章的关键词。检索模块1043,用于利用该关键词向全文检索模块1013发起检索请求,并从全文检索模块1013获取到检索出的相似文章及相似文章的传播影响力评价相关项。比对模块1044,用于从上述相似文章中找出待评价文章的转载文章。具体的,可以从待评价文章中抽出一段文字,在相似文章中逐篇比对,将与待评价文章不匹配的相似文章予以抛除,将链接地址与待评价文章链接地址一致的相似文章标记为原文。将最终的符合条件的相似文章的基本信息存入数据库(图中未表示),确定为待评价文章的转载文章,并跟待评价文章建立数据关联。此外,对于已经统计过的文章,则只把最新的数据,如点击量、回帖量等更新即可。统计模块1045,用于统计各转载文章的传播影响力评价相关项,得到该待评价文章传的传播影响力指数。具体的,可以在数据库(图中未表示)中查找待评价文章的转载文章数据本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:赵增峰梁汝锋杨建武
申请(专利权)人:北大方正集团有限公司北京大学北京北大方正电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术