一种评价热点事件价值度的方法技术

技术编号:20176822 阅读:32 留言:0更新日期:2019-01-23 00:24
本发明专利技术提供了一种评价热点事件价值度的方法,它包括:确定评价热点事件价值度的维度;按照各个维度的重要程度确定维度之间的权重分配;按照各个维度的重要程度确定维度之间的权重分配;利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。并且根据所得到的事件价值度以及设定的舆情价值预警体系,将上述事件价值度与舆情价值预警体系进行对比,最终得到不同事件的预警级别。

A Method for Evaluating the Value of Hot Spot Events

The invention provides a method for evaluating the value of hot events, which includes: determining the dimension of evaluating the value of hot events; determining the weight distribution among dimensions according to the importance of each dimension; determining the weight distribution among dimensions according to the importance of each dimension; and using the output value and weight distribution value of each dimension mentioned above, establishing an algorithm analysis model for calculation. Calculate the event value. And according to the event value and the established public opinion value early warning system, the above event value is compared with the public opinion value early warning system, and finally the early warning level of different events is obtained.

【技术实现步骤摘要】
一种评价热点事件价值度的方法
本专利技术涉及一种热点事件价值度评价方法,具体而言涉及一种采用不同维度的指标对事件价值度进行辅助计算的方法。
技术介绍
热点事件普遍是指在某个时间段内社会中引起广泛关注、参与讨论、激起民众情绪,引发强烈反响的事件,通俗点说就是被很多人熟知且讨论的事件统称为热点事件。现在网络上主流的热点事件大部分都是通过人工筛选获取的。然而,在信息化的时代,网络信息的数据量成几何级增长,而且由于网络中言论的自由化,虚拟化,导致网络信息真假难辨,鱼龙混杂,此外网络中的信息传播速度快,受众量大,传播范围广,尤其是近年来出现的微信,微博等新兴传媒形式,具有内容简短,参与发言人数众多,话题随意性强等特征。这些网络媒体所具有的特征导致人工识别和研判显得力不从心,如何利用计算机网络技术、人工智能技术和数据挖掘技术自动的检测和挖掘热点事件成为一个重要的研究课题。目前有关话题事件的研究的工作主要集中于两类方法:一种是基于传统向量,空间话题模型的话题演化挖掘,通过将文档的时间信息作为话题属性引入到话题特征计算,进而构建具有动态演变性的话题模型;另一种方法则是在概率话题模型的基础上,通过计算时间信息与话题、文档、词项的后验概率分布完成对话题事件的内容检测和挖掘。
技术实现思路
本专利技术通过不同媒体类型的价值,以及媒体之间权重的跳跃性,从海量信息中抽取出潜在热点新闻数据,可以为我们的新闻热点平台提供较好的数据支撑。为此定义了综合媒体权重、媒体频道权重、版面位置权重、转载量、媒体跨越梯度权重这五个维度来进行辅助计算热点价值度。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。本专利技术提供了一种评价热点事件价值度的方法,其特征在于,该方法包括如下步骤:(1)确定评价热点事件价值度的维度,所述维度根据不同媒体类型及媒体之间权重的跳跃性确定,具体为:媒体权重、媒体频道权重、版面位置权重、转载量、以及媒体跨越梯度权重;(2)按照各个维度的重要程度确定维度之间的权重分配;(3)针对每个维度建立计算模型,得到各个维度的输出值;(4)利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。优选地,所述媒体权重的权重分配是依据Alexa排名得到的,根据Alexa排名将媒体权重分为10个等级,媒体权重最终得分记为W1。优选地,所述媒体频道权重的权重分配是根据报道在网站中所处的位置确定的:报道处于首页:媒体频道权重记为N;报道处于通过首页可访问到的频道页中:媒体频道权重记为N-20;报道处于三级栏目位置:媒体频道权重记为N-40;报道处于深度在三级以上的位置:媒体频道权重记为N-40-深度,其中,所述深度为报道距离首页的深度;其中N为设定的针对同一网站的媒体频道权重最大值,为自然数;最后确定的媒体频道权重最终值记为W2。优选地,所述版面位置权重的权重分配按照如下方法确定:(1)通过中心网页中主题网页链接的抽取算法,自动抽取报道所在版面的报道链接;(2)按照报道类型的链接在HTML源代码中的出现位置进行自动排序;(3)令T表示所有主题链接的数量,linkr表示排序为r的链接,则第r个链接的重要性计算如下:采用如下公式将链接重要性变为一个50-100之间的数值,作为版面位置权重,记为W3:W3=sigmoid(W(linkr))*100优选地,所述转载量的确定通过每一篇资讯信息的标题进行统计计算,记转载量为W4。优选地,所述媒体跨越梯度权重用于衡量一个事件是否具备热点的潜在条件,对每个事件,会有不同的媒体去报道,而每个报道的媒体会有不同的权重,对从低权重媒体报道到高权重媒体报道的事件进行标记,具体的评价方法为:其中,W5表示媒体跨越梯度权重;n表示跨越次数,n为大于0的整数;Mi为每个媒体跨越之间的权重。优选地,在得到各维度的数值之后,采用如下公式计算事件价值度:V(a)=α*W1+β*W2+γ*W3+δ*W4+θ*W5;其中:α+β+γ+δ+θ=1,α为媒体权重的权重分配;β为媒体频道权重的权重分配;γ为版面位置权重的权重分配;δ为转载量的权重分配;θ为媒体跨越梯度权重的权重分配。所述α,β,γ,δ,θ的确定采用层次分析法AHP,通过专家两两比较不同维度之间的相对重要程度,构造判断矩阵,利用几何平均法得到判断矩阵的元素权重,得到最终的参数数值。进一步地,对得到的事件价值度设定不同的预警级别,从而供判定该事件的热点程度,具体方法为:事件价值度在(0,20)区间,不列入预警;事件价值度在[20,40)区间,列为蓝色预警信息;事件价值度在[40,60)区间,列为黄色预警信息;事件价值度在[60,80)区间,列为橙色预警信息;事件价值度在[80,100)区间,列为红色预警信息。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。具体实施方式现在将全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本专利技术将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本专利技术的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本专利技术的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本专利技术的各方面。本专利技术提供了一种评价热点事件价值度的方法,其特征在于,该方法包括如下步骤:(1)确定评价热点事件价值度的维度,所述维度根据不同媒体类型及媒体之间权重的跳跃性确定,具体为:媒体权重、媒体频道权重、版面位置权重、转载量、以及媒体跨越梯度权重;(2)按照各个维度的重要程度确定维度之间的权重分配;(3)针对每个维度建立计算模型,得到各个维度的输出值;(4)利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。不同媒体的权重不一样,对舆情的价值也不同,如:BBC等全球知名网站报道的文章权重会更高,因此根据通用的网站情报,媒体权重的权重分配是依据Alexa排名得到的,根据Alexa排名将媒体权重分为10个等级,媒体权重最终得分记为W1。报道在网站中所处的频道与其舆情价值具有高度相关性,例如,首页显示的文章通常具有更高的重要性。因此,按如下方式设置媒体频道权重:权重100806060减去深度链接位置首页频道页三级栏目其他首页中出现的报道,其重要性权重为100,通过首页可访问到的频道页中的报道,其重要性为80,其他报道为60。深度在三级以上的报道,其权重为60减去其距离首页的深度。媒体频道的类型采用网络爬虫,按照广度优先遍历算法自动确定。因此,媒体频道权重的权重分配可归纳为,根据报道在网站中所处的位置来确定:报道处于首页:媒体频道权重记为N;报道处于通过首页可访问到的频道页中:媒体频道权重记为N-20;报道处于三级栏目位置:媒体频道权重记为N-40;报道处于深度在三级以上的位置:媒体频道权重记为N-40-深度,其中,所述深度为报道距离首页的深度;其中N为设定的针本文档来自技高网...

【技术保护点】
1.一种评价热点事件价值度的方法,其特征在于,该方法包括如下步骤:(1)确定评价热点事件价值度的维度;(2)按照各个维度的重要程度确定维度之间的权重分配;(3)针对每个维度建立计算模型,得到各个维度的输出值;(4)利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。

【技术特征摘要】
1.一种评价热点事件价值度的方法,其特征在于,该方法包括如下步骤:(1)确定评价热点事件价值度的维度;(2)按照各个维度的重要程度确定维度之间的权重分配;(3)针对每个维度建立计算模型,得到各个维度的输出值;(4)利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。2.根据权利要求1所述的方法,其特征在于:所述维度为根据不同媒体类型及媒体之间权重的跳跃性确定的,具体为:媒体权重;媒体频道权重;版面位置权重;转载量;以及媒体跨越梯度权重。3.根据权利要求2所述的方法,其特征在于:所述媒体权重的权重分配是依据Alexa排名得到的,根据Alexa排名将媒体权重分为10个等级,媒体权重最终得分记为W1。4.根据权利要求2-3中任一项所述的方法,其特征在于:所述媒体频道权重的权重分配是根据报道在网站中所处的位置确定的:报道处于首页:媒体频道权重记为N;报道处于通过首页可访问到的频道页中:媒体频道权重记为N-20;报道处于三级栏目位置:媒体频道权重记为N-40;报道处于深度在三级以上的位置:媒体频道权重记为N-40-深度,其中,所述深度为报道距离首页的深度;其中N为设定的针对同一网站的媒体频道权重最大值,为自然数;最后确定的媒体频道权重最终值记为W2。5.根据权利要求2-4中任一项所述的方法,其特征在于:所述版面位置权重的权重分配按照如下方法确定:(1)通过中心网页中主题网页链接的抽取算法,自动抽取报道所在版面的报道链接;(2)按照报道类型的链接在HTML源代码中的出现位置进行自动排序;(3)令T表示所有主题链接的数量,linkr表示排序为r的链接,则第r个链接的重要性计算如下:采用如下公式将链接重要性变为一个...

【专利技术属性】
技术研发人员:黄泽文程国艮
申请(专利权)人:中译语通科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1