一种互联网信息分析系统技术方案

技术编号:14928306 阅读:97 留言:0更新日期:2017-03-30 20:04
本发明专利技术涉及互联网领域,尤其涉及一种互联网信息分析系统。信息采集单元用于系统在联网状态下根据用户输入的关键字采集舆情信息;信息过滤单元用于对采集的舆情信息进行识别分析;信息整合单元用于对过滤的舆情信息按预设条件进行分类;语义解析单元用于对整合后的舆情信息进行语义解析;数据分析单元用于获取经过语义解析的舆情信息,并对舆情信息进行关联于关键字的分析,获得舆情信息的分析结果。有益效果是,能够通过对信息源的识别,在获取信息前首先通过筛选到符合用户要求的信息源,以及通过信息源对能够对此类信息进行较系统的分析,进而为需要的用户提供数据参考以及决策支持。

【技术实现步骤摘要】

本专利技术涉及互联网领域,尤其涉及一种互联网信息分析系统
技术介绍
互联网的普及给各行各业带来了巨大的信息量,大数据也随之应用而生,大数据(bigdata,megadata),或称巨量资料,是指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。互联网中的大小站点数以千万计,积淀下的信息量更是海量级,在这些信息中存在这相当巨大的关于商机,待遇等方面的数据,绝大部分分布在各大论坛中,各个空间中,BLOG等互动讨论空间中,这些互动空间中的数据具备相当的价值,在一定程度上具备相当大的参考价值,各企事业单位、政府机构等也需要关注这些空间中的互联网舆论,为客户提供及时的互联网舆论方向分析,为公共危机公关,舆论导向等提供数据支持。但目前还没有能够对此类信息进行较系统的分析,进而为需要的用户提供数据参考以及决策支持。
技术实现思路
针对上述问题一种互联网信息分析系统。具体的技术方案是:一种互联网信息分析系统,其中,包括:信息采集单元,用于所述系统在联网状态下根据用户输入的关键字采集舆情信息;信息过滤单元,连接所述信息采集单元,用于对采集的所述舆情信息进行识别分析,过滤与所述关键字无关的所述舆情信息;信息整合单元,连接所述信息过滤单元,用于对过滤的所述舆情信息按预设条件进行分类,并对同一类别的所述舆情信息中信息进行两两信息间不重复部分的相互复制;语义解析单元,连接所述信息整合单元,用于对整合后的所述舆情信息进行语义解析;数据分析单元,连接所述语义解析单元,用于获取经过所述语义解析的所述舆情信息,并对所述舆情信息进行关联于所述关键字的分析,获得舆情信息的分析结果。优选的,上述的互联网信息分析系统,其中,包括:信息存储单元,连接所述信息整合单元,用于存储进行所述分类后的所述舆情信息。优选的,上述的互联网信息分析系统,其中,所述舆情信息存储单元包括:复数个存储模块,每个所述存储模块用于存储一个类别的所述舆情信息;信息管理模块,连接所述存储模块,用于对存储的所述舆情信息进行删除、增加、修改的管理。优选的,上述的互联网信息分析系统,其中,所述过滤分析单元包括:第一分类模块,用于对采集的所述舆情信息根据与所述关键字的关联进行识别,并分为关联信息与无关联信息;过滤模块,连接所述第一分类模块,用于过滤所述无关联信息。5、如权利要求1所述的互联网信息采集系统,其特征在于,所述舆情信息整合单元包括:第二分类模块,根据所述预设条件对过滤的所述舆情信息进行分类,并对每个所述分类存储在所述存储模块没内;信息补充模块,连接所述第二分类模块,用于对每个所述分类中的所述舆情信息中关联于所述关键字的特征词进行提取,对具有同一所述特征词的所述舆情信息进行相互复制;信息删除模块,连接所述信息补充模块,用于对每个所述分类中所述特征词全部相同的重复所述舆情信息进行删除。优选的,上述的互联网信息分析系统,其中,所述语义解析单元包括:识别模块,用于对整合的所述舆情信息进行识别,将识别的所述舆情信息分为语言信息和感情信息;语言语义分析,连接所述识别模块,用于对识别的所述语言信息进行语义解析,获得语言解析语义;感情语义分析,连接所述识别模块,用于对识别的所述感情信息进行语义解析,获得感情解析语义;优选的,上述的互联网信息分析系统,其中,包括:自动预警单元,连接所述信息整合单元,用于当所述舆情信息被非所述合法用户获取时进行预警。优选的,上述的互联网信息分析系统,其中,包括:报告生成单元,连接所述数据分析单元,用于根据所述分析结果,按预置格式形成一分析报告。本专利技术的有益效果是,能够通过对信息源的识别,在获取信息前首先通过筛选到符合用户要求的信息源,以及通过信息源对能够对此类信息进行较系统的分析,进而为需要的用户提供数据参考以及决策支持。附图说明图1为一种互联网信息分析系统的较佳实施例中的总结构示意图;图2-7为一种互联网信息分析系统的较佳实施例中,在图1的基础上,部分结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。如图1所示,一种互联网信息分析系统,其中,包括:信息采集单元1,用于系统在联网状态下根据用户输入的关键字采集舆情信息;信息过滤单元2,连接信息采集单元1,用于对采集的舆情信息进行识别分析,过滤与关键字无关的舆情信息;信息整合单元3,连接信息过滤单元2,用于对过滤的舆情信息按预设条件进行分类,并对同一类别的舆情信息中信息进行两两信息间不重复部分的相互复制;语义解析单元4,连接信息整合单元3,用于对整合后的舆情信息进行语义解析;数据分析单元5,连接语义解析单元4,用于获取经过语义解析的舆情信息,并对舆情信息进行关联于关键字的分析,获得舆情信息的分析结果。本专利技术是通过信息采集单元1获取用户输入的关键字采集与关键字相关联的信息,通过信息过滤单元2,过滤与关键字无关的信息,例如嵌在信息中的广告等信息,将过滤的信息通过信息整合单元3进行整合,对同一类别的舆情信息中信息进行两两信息间不重复部分的相互复制,对过滤的信息按预设条件进行分类,预设条件可以是某类商品的使用方法的分类,可以是不同功能的分类等,并对同一类别的信息进行信息间的相互补充,例如对商品使用方法的分类,将具有共性的使用方法集合成一个使用方法,并将相同共性集合成的使用方法中多余的信息删除。对与整合后的信息通过语义解析单元4进行语义的解析,使用户根据解析的语义对数据进行挖掘,进而获得用户所需的有商业价值的信息。本专利技术主要面向各企事业单位、政府机构等需要关注互联网舆论的客户,为客户提供及时的互联网舆论方向分析,为公共危机公关,舆论导向等提供数据支持。本专利技术较佳实施例中,如图2所示,包括:信息存储单元6,连接信息整合单元3,用于存储进行分类本文档来自技高网...
一种互联网信息分析系统

【技术保护点】
一种互联网信息分析系统,其特征在于,包括:信息采集单元,用于所述系统在联网状态下根据用户输入的关键字采集舆情信息;信息过滤单元,连接所述信息采集单元,用于对采集的所述舆情信息进行识别分析,过滤与所述关键字无关的所述舆情信息;信息整合单元,连接所述信息过滤单元,用于对过滤的所述舆情信息按预设条件进行分类,并对同一类别的所述舆情信息中进行两两信息的不重复部分的相互复制;语义解析单元,连接所述信息整合单元,用于对整合后的所述舆情信息进行语义解析;数据分析单元,连接所述语义解析单元,用于获取经过所述语义解析的所述舆情信息,并对所述舆情信息进行关联于所述关键字的分析,获得舆情信息的分析结果。

【技术特征摘要】
1.一种互联网信息分析系统,其特征在于,包括:
信息采集单元,用于所述系统在联网状态下根据用户输入的关键字采集舆情信息;
信息过滤单元,连接所述信息采集单元,用于对采集的所述舆情信息进行识别分析,过滤与所述关键字无关的所述舆情信息;
信息整合单元,连接所述信息过滤单元,用于对过滤的所述舆情信息按预设条件进行分类,并对同一类别的所述舆情信息中进行两两信息的不重复部分的相互复制;
语义解析单元,连接所述信息整合单元,用于对整合后的所述舆情信息进行语义解析;
数据分析单元,连接所述语义解析单元,用于获取经过所述语义解析的所述舆情信息,并对所述舆情信息进行关联于所述关键字的分析,获得舆情信息的分析结果。
2.如权利要求1所述的互联网信息采集系统,其特征在于,包括:
信息存储单元,连接所述信息整合单元,用于存储所述分类后的所述舆情信息。
3.如权利要求2所述的互联网信息采集系统,其特征在于,所述舆情信息存储单元包括:
复数个存储模块,每个所述存储模块用于存储一个类别的所述舆情信息;
信息管理模块,连接所述存储模块,用于对存储的所述舆情信息进行删除、增加、修改的管理。
4.如权利要求1所述的互联网信息采集系统,其特征在于,所述过滤分析单元包括:
第一分类模块,用于对采集的所述舆情信息根据与所述关键字的关联进行识别,并分为关联信息与无关联信息;
过...

【专利技术属性】
技术研发人员:方净
申请(专利权)人:宁波公众信息产业有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1