【技术实现步骤摘要】
一种组合新闻分析基于多篇资讯的内容检索方法
本专利技术专利属于内容检索领域,尤其涉及一种组合新闻分析基于多篇资讯的内容检索方法。
技术介绍
随着互联网的发展,海量数据在互联网上传播,针对某个事件的新闻会通过不同维度来描述。随着时间的变化,事件本身的焦点也回逐渐转移。对事件评估也只能够聚焦到事件传播过程中的某个焦点,并不能针对整个事件做出评估。组合新闻分析就是针对事件多个焦点,多个维度对采集数据进行分析评估。对相同事件不同焦点的新闻组合到一起进行分析,能够更好的掌握事件随时间维度变化的发展动态。专利技术专利内容本专利技术专利提供一种组合新闻分析基于多篇资讯的内容检索方法,对新闻事件的评估有较高的准确性:通过对时间传播不同时段的焦点的相关新闻资讯进行组合,更好的分析出整个事件在互联网上的传播过程以及传播情况。一种组合新闻分析基于多篇资讯的内容检索方法,包括步骤一,将多篇资讯url组合到一起;作为要评估的输入项;步骤二,根据这些url对数据进行召回;首先获取url对应资讯的md5;根据获取到的这一批md5进行数据召回;每条url对应资讯最多有十条md5,如果对五个url进行组合评估,就将这五条url的md5都获取过来,进行召回数据;步骤三,对召回的数据通过归堆算法进行归堆;步骤四,将归堆后新闻进行评估分析,响应给用户。附图说明图1为一种组合新闻分析基于多篇资讯的内容检索方法传播事件河流数据构图图2为一种组合新闻分析基于多篇资讯的内容检索方法分析结果系统图。具体实施方式实施例:一种组合新闻分析基于多篇资讯的内容检索方法,包括步骤一,将多篇资讯url组合到一起;作为 ...
【技术保护点】
一种组合新闻分析基于多篇资讯的内容检索方法,其特征在于:包括步骤一,将多篇资讯url组合到一起;作为要评估的输入项;步骤二,根据这些url对数据进行召回;首先获取url对应资讯的md5;根据获取到的这一批md5进行数据召回;每条url对应资讯最多有十条md5,如果对五个url进行组合评估,就将这五条url的md5都获取过来,进行召回数据;步骤三,对召回的数据通过归堆算法进行归堆;步骤四,将归堆后新闻进行评估分析,响应给用户。
【技术特征摘要】
1.一种组合新闻分析基于多篇资讯的内容检索方法,其特征在于:包括步骤一,将多篇资讯url组合到一起;作为要评估的输入项;步骤二,根据这些url对数据进行召回;首先获取url对应资讯的md5;根据获取到的这一批md5进...
【专利技术属性】
技术研发人员:李学良,
申请(专利权)人:天津海量信息技术股份有限公司,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。