【技术实现步骤摘要】
互联网信息监控系统及其方法
[0001]本申请涉及智能分析领域,且更为具体地,涉及一种互联网信息监控系统及其方法。
技术介绍
[0002]互联网信息监控是一种基于互联网技术的信息分析和监测方案,它可以对互联网上的各种信息进行收集、整理、分析和展示,以便帮助用户了解和掌握当前的信息动态,及时发现和解决可能存在的问题。
[0003]互联网信息监控主要包括有信息数据采集、信息数据清洗、信息数据存储、情感分析、主题分析、事件追踪以及信息报告生成等。传统的信息监控分析只是简单的通过关键词匹配来判断信息的情感倾向,这种方式往往无法准确判断用户的情感表达。
[0004]因此,需要一种优化的互联网信息监控方案。
技术实现思路
[0005]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种互联网信息监控系统及其方法,其通过对用户关于热点事件的评论数据进行处理以得到用户针对此次热点事件的态度。这样,有助于帮助管理者快速判断此次热点事件的信息趋势,并针对性地制定相应的信息危机处理方案。
[0006 ...
【技术保护点】
【技术特征摘要】
1.一种互联网信息监控系统,其特征在于,包括:数据获取模块,用于获取用户针对热点事件的评论数据;预处理模块,用于对所述评论数据进行数据清洗和预处理以得到预处理后评论数据;分词模块,用于对所述预处理后评论数据进行分词处理以得到评论词的序列;评论词编码模块,用于将所述评论词的序列通过包含词嵌入层的语义编码器以得到多个评论词上下文语义特征向量;多尺度卷积编码模块,用于将所述多个评论词上下文语义特征向量排列为一维特征向量后通过包含第一卷积层和第二卷积层的多尺度卷积结构以得到评论数据片语粒度特征向量;级联模块,用于将所述多个评论词上下文语义特征向量进行级联以得到评论数据词粒度特征向量;融合模块,用于融合所述评论数据片语粒度特征向量和所述评论数据词粒度特征向量以得到分类特征向量;以及判断模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示用户针对热点事件的评价是积极的还是消极的。2.根据权利要求1所述的互联网信息监控系统,其特征在于,所述评论词编码模块,包括:词向量转化单元,用于使用所述语义编码器的词嵌入层将所述评论词的序列中各个评论词映射成为多个评论词向量以获得评论词向量的序列;以及语义编码单元,用于使用所述包含词嵌入层的语义编码器对所述评论词向量的序列进行基于全局的上下文语义编码以得到多个评论词上下文语义特征向量。3.根据权利要求2所述的互联网信息监控系统,其特征在于,所述多尺度卷积结构,包括:相互并行的第一卷积层和第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度级联层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。4.根据权利要求3所述的互联网信息监控系统,其特征在于,所述多尺度卷积编码模块,包括:第一尺度提取单元,用于使用所述多尺度卷积结构的第一卷积层以如下第一卷积公式对所述一维特征向量进行一维卷积编码以得到第一尺度片语粒度特征向量;其中,所述第一卷积公式为:其中,a为第一卷积核在x方向上的宽度,F(a)为第一卷积核参数向量,G(x
‑
a)为与第一卷积核函数运算的局部向量矩阵,w为第一卷积核的尺寸,X表示所述一维特征向量,Cov1(X)为所述第一尺度片语粒度特征向量;第二尺度提取单元,用于使用所述多尺度卷积结构的第二卷积层以如下第二卷积公式对所述一维特征向量进行一维卷积编码以得到第二尺度片语粒度特征向量;其中,所述第二卷积公式为:
其中,b为第二卷积核在x方向上的宽度,F(b)为第二卷积核参数向量,G(x
‑
b)为与第二卷积核函数运算的局部向量矩阵,m为第二卷积核的尺寸,X表示所述一维特征向量,Cov2(X)为所述第二尺度片语粒度特征向量;以及多尺度级联单元,用于使用所述多尺度卷积结构的级联层对所述第一尺度片语粒度特征向量和所述第二尺度片语粒度特征向量进行级联以得到所述评论数据片语粒度特征向量。5.根据权利要求4所述的互联网信息监控系统,其特征在于,所述级联模块,用于:以如下级联公式将所述多个评论词上下文语义特征向量进行级联以得到所述评论数据词粒度特征向量;其中,所述级联公式为:V
e
=Concat[V<...
【专利技术属性】
技术研发人员:赖起敬,
申请(专利权)人:江西中唐产业互联网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。