一种基于深度学习的舆情预警方法及系统技术方案

技术编号：21605646 阅读：28 留言：0更新日期：2019-07-13 18:16

本说明书公开了一种基于深度学习的舆情预警方法及系统，获得整体抽样文本；利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数；基于所述整体抽样文本对应的舆情分数和预设抽样策略，从所述整体抽样文本中获取目标抽样文本；将所述目标抽样文本转换为报文并进行预警。

A Public Opinion Early Warning Method and System Based on Deep Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的舆情预警方法及系统
本申请涉及支付
，尤其涉及一种基于深度学习的舆情预警方法及系统。
技术介绍
随着互联网技术的不断发展，网上交易逐渐取代线下交易成为主流交易方式，因此针对网上交易进行风险防控研究有非常重要的意义。目前，在风险防控中的实际抽样中，抽样的审理工作人员往往只对大额样本进行抽样，但往往会忽视掉用户的情绪感知。这部分情绪感知可能是引发重大舆情的潜在因素，如果忽略则会影响风险防控的准确度。
技术实现思路
由于在风险防控中文本数据的情感分析非常重要，这部分情绪感知可能是引发重大舆情的潜在因素，如果忽略这部分情绪感知则会极大的影响到风险防控的准确度，而目前一般利用人工对用户的情感进行分析，然而实际情况人工往往对文本数据不敏感，长时间对于文本的审理可能会引发疲劳容易出错，进而会进一步影响到风险防控的准确度。为解决上述技术问题，本说明书提供了一种基于深度学习的舆情预警方法及系统，通过文本的情感分析，改变抽样的方式方法，将大量缩短人工的时间，提升工作效率和量级，并且将文本的情感分析纳入风险防控中，能够提高风险防控的准确度。本说明书提供了一种基于深度学习的舆情预警方法，包括：获得整体抽样文本；利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数；基于所述整体抽样文本对应的舆情分数和预设抽样策略，从所述整体抽样文本中获取目标抽样文本；将所述目标抽样文本转换为报文并进行预警。本说明书公开了一种基于深度学习的舆情预警系统，包括：第一获得模块，用于获得整体抽样文本；舆情分析模块，用于利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对...

【技术保护点】
1.一种基于深度学习的舆情预警方法，所述方法包括：获得整体抽样文本；利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数；基于所述整体抽样文本对应的舆情分数和预设抽样策略，从所述整体抽样文本中获取目标抽样文本；将所述目标抽样文本转换为报文并进行预警。

【技术特征摘要】
1.一种基于深度学习的舆情预警方法，所述方法包括：获得整体抽样文本；利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数；基于所述整体抽样文本对应的舆情分数和预设抽样策略，从所述整体抽样文本中获取目标抽样文本；将所述目标抽样文本转换为报文并进行预警。2.如权利要求1所述的方法，所述利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数之前，所述方法还包括：利用训练文本对RNN深度学习模型进行训练，得到所述舆情分析模型。3.如权利要求2所述的方法，所述利用训练文本对RNN深度学习模型进行训练，得到所述舆情分析模型，具体包括：利用不可信、可信、中立三种标签建立分类器，对所述训练文本进行分类标注；其中，对包含有正面情绪的训练文本标注可信标签；对包含有负面情绪的训练文本标注不可信标签；对包含有中立情绪的训练文本标注中立标签；用分类标注后的训练文本对所述RNN模型进行训练，得到所述舆情分析模型。4.如权利要求3所述的方法，所述对所述训练文本进行分类标注，具体包括：对所述训练文本中包含有负面情绪的部分训练文本标注为不可信标签；利用包含有不可信标签的部分训练文本来训练半监督学习算法中的PULearning模型，并基于训练的PULearning模型从剩余训练文本中预测不可信的训练文本，并标注为不可信标签。5.如权利要求1所述的方法，在利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数之前，所述方法还包括：对所述整体抽样文本进行预训练。6.如权利要求5所述的方法，所述对所述整体抽样文本进行预训练，具体包括：保持神经网络模型中的特定层数的网络结构不变，利用所述神经网络模型对所述整体抽样文本进行预训练；或者将所述整体抽样文本按照场景进行分类，并保持神经网络模型中的特定层数的网络结构不变，利用所述神经网络模型分别对各个场景中的抽样文本进行预训练。7.如权利要求1-6任一权项所述的方法，所述舆情分析模型包括文本情感分析模型；所述利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数,具体包括:利用文本情感分析模型对所述整体抽样文本进行情感分析并得到对应的情感分数。8.如权利要求7所述的方法，所述利用文本情感分析模型对所述整体抽样文本进行情感分析并得到对应的情感分数，具体包括：对所述整体抽样文本进行分词处理，每个抽样文本划分出一个或者多个词向量；将所述每个抽样文本对应的一个或者多个词向量输入神经网络模型，得到每个词向量的情感分数；基于每个词向量的情感分数，得到每个抽样文本对应的情感分数。9.如权利要求1-6任一权项所述的方法，所述基于所述整体抽样文本对应的舆情分数和预设抽样策略，从所述整体抽样文本中获取目标抽样文本，具体包括：在用户和商户交易时，从所述整体抽样文本中获取所述商户的历史交易文本数据；基于所述整体抽样文本对应的舆情分数和所述预设抽样策略，从所述历史交易文本数据中获取所述目标抽样文本。10.如权利要求9所述的方法，所述基于所述整体抽样文本对应的舆情分数和预设抽样策略，从所述历史交易文本数据中获取所述目标抽样文本之后，所述方法还包括：将所述目标抽样文本发送给所述用户。11.如权利要求1-6任一权项所述的方法，所述利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数之后，所述方法还包括：将所述整体抽样文本对应的舆情分数输入到其他抽样类模型中确定出抽样阈值,或将所述整体抽样文本对应的舆情分数联合其他预设策略确定出所述抽样阈值；基于所述抽样阈值从所述整体抽样文本中选择出目标价值情绪文本,并将所述目标价值情绪文本输入到审理报文系统中进行反...

【专利技术属性】
技术研发人员：鲍晟霖，王维强，许辽萨，赵闻飙，袁锦程，易灿，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人