【技术实现步骤摘要】
本专利技术涉及机器学习与信息检索技术,尤其涉及。
技术介绍
随着互联网的高速发展,网络信息越来越丰富和日益多元化,但,同时也意味着如果用户想全面而系统地获得某一类特定信息,将不得不花费更多的时间和精力从信息海洋中进行筛选,并自行进行组织和梳理。为此,一些互联网信息提供商做了这方面的尝试,例如各大门户网站提供了分频道的新闻;针对某一重大事件提供专题报道等,但这些产品很大程度上依赖于人工筛选和编辑,展现形式也往往是单条的新闻、图片等,形式也较为单一。 近年来,机器学习技术(包括分类、聚类等技术)和信息检索技术得到快速发展,同时随着计算机性能的不断提高,为自动化筛选某一特定领域的信息,并进行有效组织和检索功能提供了技术实现的可能。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供,以实现机器对信息的分类、聚类和检索,使其在互联网海量信息的环境中,自动筛选出某一特定领域的信息,并实现有效组织和检索功能。为达到上述目的,本专利技术的技术方案是这样实现的 一种特定领域信息自动化组织的装置,该装置主要包括新闻采集模块、新闻筛选模块、新闻话题检测模块、后台信息缓存模块、特定领 ...
【技术保护点】
一种特定领域信息自动化组织的装置,其特征在于,该装置主要包括新闻采集模块、新闻筛选模块、新闻话题检测模块、后台信息缓存模块、特定领域信息采集模块、索引模块以及检索模块;其中:新闻采集模块,用于采集网络新闻;新闻筛选模块,从采集的新闻中筛选出特定领域的新闻;新闻话题检测模块,对特定领域的新闻进行话题检测;后台信息缓存模块,缓存按话题组织的特定领域的新闻,以备前端模块随时访问;特定领域信息采集模块,从设定的网站采集该特定领域的信息;索引模块,对新闻和特定领域的信息建立索引;以及检索模块,对用户输入的查询进行处理并查询索引,并整理检索结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:李德聪,杨青,
申请(专利权)人:人民搜索网络股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。