The invention provides a method for evaluating the value of hot events, which includes: determining the dimension of evaluating the value of hot events; determining the weight distribution among dimensions according to the importance of each dimension; determining the weight distribution among dimensions according to the importance of each dimension; and using the output value and weight distribution value of each dimension mentioned above, establishing an algorithm analysis model for calculation. Calculate the event value. And according to the event value and the established public opinion value early warning system, the above event value is compared with the public opinion value early warning system, and finally the early warning level of different events is obtained.
【技术实现步骤摘要】
一种评价热点事件价值度的方法
本专利技术涉及一种热点事件价值度评价方法,具体而言涉及一种采用不同维度的指标对事件价值度进行辅助计算的方法。
技术介绍
热点事件普遍是指在某个时间段内社会中引起广泛关注、参与讨论、激起民众情绪,引发强烈反响的事件,通俗点说就是被很多人熟知且讨论的事件统称为热点事件。现在网络上主流的热点事件大部分都是通过人工筛选获取的。然而,在信息化的时代,网络信息的数据量成几何级增长,而且由于网络中言论的自由化,虚拟化,导致网络信息真假难辨,鱼龙混杂,此外网络中的信息传播速度快,受众量大,传播范围广,尤其是近年来出现的微信,微博等新兴传媒形式,具有内容简短,参与发言人数众多,话题随意性强等特征。这些网络媒体所具有的特征导致人工识别和研判显得力不从心,如何利用计算机网络技术、人工智能技术和数据挖掘技术自动的检测和挖掘热点事件成为一个重要的研究课题。目前有关话题事件的研究的工作主要集中于两类方法:一种是基于传统向量,空间话题模型的话题演化挖掘,通过将文档的时间信息作为话题属性引入到话题特征计算,进而构建具有动态演变性的话题模型;另一种方法则是在概率话题模型的基础上,通过计算时间信息与话题、文档、词项的后验概率分布完成对话题事件的内容检测和挖掘。
技术实现思路
本专利技术通过不同媒体类型的价值,以及媒体之间权重的跳跃性,从海量信息中抽取出潜在热点新闻数据,可以为我们的新闻热点平台提供较好的数据支撑。为此定义了综合媒体权重、媒体频道权重、版面位置权重、转载量、媒体跨越梯度权重这五个维度来进行辅助计算热点价值度。本专利技术的其他特性和优点将通过下面的详细描 ...
【技术保护点】
1.一种评价热点事件价值度的方法,其特征在于,该方法包括如下步骤:(1)确定评价热点事件价值度的维度;(2)按照各个维度的重要程度确定维度之间的权重分配;(3)针对每个维度建立计算模型,得到各个维度的输出值;(4)利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。
【技术特征摘要】
1.一种评价热点事件价值度的方法,其特征在于,该方法包括如下步骤:(1)确定评价热点事件价值度的维度;(2)按照各个维度的重要程度确定维度之间的权重分配;(3)针对每个维度建立计算模型,得到各个维度的输出值;(4)利用上述各个维度的输出值及权重分配值,建立算法分析模型进行计算得到事件价值度。2.根据权利要求1所述的方法,其特征在于:所述维度为根据不同媒体类型及媒体之间权重的跳跃性确定的,具体为:媒体权重;媒体频道权重;版面位置权重;转载量;以及媒体跨越梯度权重。3.根据权利要求2所述的方法,其特征在于:所述媒体权重的权重分配是依据Alexa排名得到的,根据Alexa排名将媒体权重分为10个等级,媒体权重最终得分记为W1。4.根据权利要求2-3中任一项所述的方法,其特征在于:所述媒体频道权重的权重分配是根据报道在网站中所处的位置确定的:报道处于首页:媒体频道权重记为N;报道处于通过首页可访问到的频道页中:媒体频道权重记为N-20;报道处于三级栏目位置:媒体频道权重记为N-40;报道处于深度在三级以上的位置:媒体频道权重记为N-40-深度,其中,所述深度为报道距离首页的深度;其中N为设定的针对同一网站的媒体频道权重最大值,为自然数;最后确定的媒体频道权重最终值记为W2。5.根据权利要求2-4中任一项所述的方法,其特征在于:所述版面位置权重的权重分配按照如下方法确定:(1)通过中心网页中主题网页链接的抽取算法,自动抽取报道所在版面的报道链接;(2)按照报道类型的链接在HTML源代码中的出现位置进行自动排序;(3)令T表示所有主题链接的数量,linkr表示排序为r的链接,则第r个链接的重要性计算如下:采用如下公式将链接重要性变为一个...
【专利技术属性】
技术研发人员:黄泽文,程国艮,
申请(专利权)人:中译语通科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。