【技术实现步骤摘要】
本专利技术属于信息检索领域,具体地说是涉及。
技术介绍
由于现实中的事件在互联网上都有明显的反映,互联网上存在着大量的面向事件的Web新闻报道。借助搜索引擎从互联网上获取事件相关信息已经是用户的迫切需求。但由于互联网上的信息急剧膨胀,通用搜索引擎返回的结果往往是信息量大、查询不准确。用户在输入某个关键字后,搜索到的有用信息并不多,对事件类信息的检索更是如此。事件检索指针对用户输入的事件查询关键字,获取相关信息或者精准的答案。TDT与事件检索有着一定的联系,其主旨是基于事件对信息流进行组织和利用。其研究方向主要是未知话题的识别及已知话题的跟踪,话题跟踪经常提供若干篇新闻报道为种子,利用相关算法自动将后续相关新闻报道检测加入到已知话题中。国内外关于事件检索的研究成果不多,与事件检索密切相关的工作主要有在2012年加拿大出版的会议论文集2012年北美计算语言学-人类语言技术会议(Proceedings of 2012Conference of the North American Chapterof the Associationfor Computational L ...
【技术保护点】
一种基于事件分析的Web新闻检索方法,其特征在于,具体步骤如下:A.在查询框中输入事件项Qe和约束项Qc两部分,得到查询项Q={Qe,Qc};B.选取一篇Web新闻di的标题T、首段FP和末段LP三个部分表示di,di={T,FP,LP},其具体步骤如下:B1.提取Web新闻HTML源码中的和两标签的中间部分作为di的标题T;B2.提取Web新闻正文部分的第一段作为di的首段FP;B3.提取Web新闻正文部分的最后一段作为di的末段LP,得到Web新闻的三个部分di={T,FP,LP};C.计算di={T,FP,LP}中各个部分特征项的权重,其具体步骤如下:C1.假设事件项 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。