【技术实现步骤摘要】
资讯信息分析方法及装置
[0001]本专利技术涉及大数据
,尤其涉及一种资讯信息分析方法及装置。
技术介绍
[0002]网络资讯作为一种十分重要的资讯表现形式,在不同机构之间也会转载,相互影响,图1为资讯信息转载示意图,因此,网络中充斥着大量的相同的信息,会导致资讯信息分析失真,比如词频统计、情感分析等会因为统计相同信息失去相应的真实度。因此,现有的资讯信息分析方法存在分析结果不准确的问题。
技术实现思路
[0003]本专利技术实施例提出一种资讯信息分析方法,用以实现对资讯信息的准确分析,该方法包括:
[0004]基于关键字爬取网络上的资讯信息;
[0005]对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;
[0006]将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;
[0007]构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的影响度;
[0008]根据所述资讯信息的情感分类结果和影响度,确定所述资讯信 ...
【技术保护点】
【技术特征摘要】
1.一种资讯信息分析方法,其特征在于,包括:基于关键字爬取网络上的资讯信息;对爬取的资讯信息进行预处理,获得符合预设格式要求的资讯信息;将符合预设格式要求的资讯信息输入至训练好的情感分类模型,获得资讯信息的情感分类结果;构建所述资讯信息的网络拓扑,基于所述网络拓扑计算所述资讯信息的影响度;根据所述资讯信息的情感分类结果和影响度,确定所述资讯信息的情感分析结果。2.如权利要求1所述的资讯信息分析方法,其特征在于,对爬取的资讯信息进行预处理,包括:依次采用如下方法对爬取的资讯信息进行预处理:去空格处理,标点及转义字符处理,分词处理,停用词处理。3.如权利要求1所述的资讯信息分析方法,其特征在于,所述情感分类模型为BiLSTM情感分类模型。4.如权利要求3所述的资讯信息分析方法,其特征在于,所述情感分类模型的训练步骤包括:爬取网络上的历史资讯信息;对爬取的历史资讯信息进行预处理,获得符合预设格式要求的资讯信息;对符合预设格式要求的资讯信息进行情感标签标注;将标注后的资讯信息分为训练集数据和验证集数据;基于训练集数据训练BiLSTM情感分类模型,获得训练后的BiLSTM情感分类模型;基于验证集数据验证所述训练后的BiLSTM情感分类模型,直至满足预设精度,获得训练好的BiLSTM情感分类模型。5.如权利要求1所述的资讯信息分析方法,其特征在于,所述资讯信息的属性包括信息标题、发布机构、时间、发布来源、作者和信息内容。6.如权利要求5所述的资讯信息分析方法,其特征在于,构建所述资讯信息的网络拓扑...
【专利技术属性】
技术研发人员:张辉,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。