当前位置: 首页 > 专利查询>淮海工学院专利>正文

一种基于事件分析的Web新闻检索方法技术

技术编号:8453104 阅读:239 留言:0更新日期:2013-03-21 17:37
本发明专利技术是一种基于事件分析的Web新闻检索方法,其步骤如下:设置事件项Qe和约束项Qc两类输入框,得到查询项Q={Qe,Qc};选取Web新闻di的标题(T)、首段(FP)和末段(LP)三个部分表示di,di={T,FP,LP};计算di={T,FP,LP}中各个部分特征项的权重;设置查询项Q中特征项的权重为1;计算查询项Q和新闻di的相关度为R(Q,di),依据相关度R(Q,di)的大小降序排列输出检索结果。该方法区分了查询内容中不同项的作用,结合事件的动作要素、web新闻标题的重要性及事件项与约束项之间的距离,提出了事件查询项与Web新闻相关度的计算方法,能显著地提高事件类Web新闻检索的准确率。

【技术实现步骤摘要】

本专利技术属于信息检索领域,具体地说是涉及。
技术介绍
由于现实中的事件在互联网上都有明显的反映,互联网上存在着大量的面向事件的Web新闻报道。借助搜索引擎从互联网上获取事件相关信息已经是用户的迫切需求。但由于互联网上的信息急剧膨胀,通用搜索引擎返回的结果往往是信息量大、查询不准确。用户在输入某个关键字后,搜索到的有用信息并不多,对事件类信息的检索更是如此。事件检索指针对用户输入的事件查询关键字,获取相关信息或者精准的答案。TDT与事件检索有着一定的联系,其主旨是基于事件对信息流进行组织和利用。其研究方向主要是未知话题的识别及已知话题的跟踪,话题跟踪经常提供若干篇新闻报道为种子,利用相关算法自动将后续相关新闻报道检测加入到已知话题中。国内外关于事件检索的研究成果不多,与事件检索密切相关的工作主要有在2012年加拿大出版的会议论文集2012年北美计算语言学-人类语言技术会议(Proceedings of 2012Conference of the North American Chapterof the Associationfor Computational Linguistics本文档来自技高网...

【技术保护点】
一种基于事件分析的Web新闻检索方法,其特征在于,具体步骤如下:A.在查询框中输入事件项Qe和约束项Qc两部分,得到查询项Q={Qe,Qc};B.选取一篇Web新闻di的标题T、首段FP和末段LP三个部分表示di,di={T,FP,LP},其具体步骤如下:B1.提取Web新闻HTML源码中的和两标签的中间部分作为di的标题T;B2.提取Web新闻正文部分的第一段作为di的首段FP;B3.提取Web新闻正文部分的最后一段作为di的末段LP,得到Web新闻的三个部分di={T,FP,LP};C.计算di={T,FP,LP}中各个部分特征项的权重,其具体步骤如下:C1.假设事件项Qe={a2},a2...

【技术特征摘要】

【专利技术属性】
技术研发人员:仲兆满李存华管燕
申请(专利权)人:淮海工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1