一种基于深度学习的舆情预警方法及系统技术方案

技术编号:21605646 阅读:28 留言:0更新日期:2019-07-13 18:16
本说明书公开了一种基于深度学习的舆情预警方法及系统,获得整体抽样文本;利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数;基于所述整体抽样文本对应的舆情分数和预设抽样策略,从所述整体抽样文本中获取目标抽样文本;将所述目标抽样文本转换为报文并进行预警。

A Public Opinion Early Warning Method and System Based on Deep Learning

【技术实现步骤摘要】
一种基于深度学习的舆情预警方法及系统
本申请涉及支付
,尤其涉及一种基于深度学习的舆情预警方法及系统。
技术介绍
随着互联网技术的不断发展,网上交易逐渐取代线下交易成为主流交易方式,因此针对网上交易进行风险防控研究有非常重要的意义。目前,在风险防控中的实际抽样中,抽样的审理工作人员往往只对大额样本进行抽样,但往往会忽视掉用户的情绪感知。这部分情绪感知可能是引发重大舆情的潜在因素,如果忽略则会影响风险防控的准确度。
技术实现思路
由于在风险防控中文本数据的情感分析非常重要,这部分情绪感知可能是引发重大舆情的潜在因素,如果忽略这部分情绪感知则会极大的影响到风险防控的准确度,而目前一般利用人工对用户的情感进行分析,然而实际情况人工往往对文本数据不敏感,长时间对于文本的审理可能会引发疲劳容易出错,进而会进一步影响到风险防控的准确度。为解决上述技术问题,本说明书提供了一种基于深度学习的舆情预警方法及系统,通过文本的情感分析,改变抽样的方式方法,将大量缩短人工的时间,提升工作效率和量级,并且将文本的情感分析纳入风险防控中,能够提高风险防控的准确度。本说明书提供了一种基于深度学习的舆情预警方法,包括:获得整体抽样文本;利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数;基于所述整体抽样文本对应的舆情分数和预设抽样策略,从所述整体抽样文本中获取目标抽样文本;将所述目标抽样文本转换为报文并进行预警。本说明书公开了一种基于深度学习的舆情预警系统,包括:第一获得模块,用于获得整体抽样文本;舆情分析模块,用于利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数;第二获得模块,用于基于所述整体抽样文本对应的舆情分数和预设抽样策略,从所述整体抽样文本中获取目标抽样文本;转换模块,用于将所述目标抽样文本转换为报文并进行预警。本说明书公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。本说明书公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。通过本说明书的一个或者多个技术方案,本说明书具有以下有益效果或者优点:本说明书公开了一种基于深度学习的舆情预警方法及系统,首先获得整体抽样文本;然后利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数;基于所述整体抽样文本对应的舆情分数和预设抽样策略从所述整体抽样文本中获取目标抽样文本,由于在风险防控中文本数据的舆情分析非常重要,这部分情绪感知可能是引发重大舆情的潜在因素,如果忽略这部分情绪感知则会极大的影响到风险防控的准确度,故而通过对抽样文本进行舆情分析得到对应的舆情分数,然后将舆情分数和预设抽样策略进行结合,从而改变原有抽样方式,可以更偏向于抽取容易引发舆情的目标抽样文本,然后将所述目标抽样文本转换为报文并进行预警,让抽样更加的科学,进而防控舆情。上述说明仅是本说明书技术方案的概述,为了能够更清楚了解本说明书的技术手段,而可依照说明书的内容予以实施,并且为了让本说明书的上述和其它目的、特征和优点能够更明显易懂,以下特举本说明书的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本说明书的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本说明书一个实施例的一种基于深度学习的舆情预警方法的流程图;图2示出了根据本说明书一个实施例的一种基于深度学习的舆情预警系统的示意图;图3示出了根据本说明书一个实施例的计算机设备的示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。在互联网金融风险防控中,目前仍然利用人工采样审核的方式来识别互联网金融欺诈,同时,大量投诉或理赔中的文本信息中的情感信息被浪费,并未用于风险防控的核查中,进而导致风险防控不准。为此,本申请的专利技术人提出了基于深度学习的舆情预警解决方案,其通过对文本数据进行舆情分析得到对应的舆情分数,再将舆情分数结合预设抽样策略来进行抽样审理,实现了对文本数据是否可信的自动化判断,并且能够提高风险防控的准确度。本说明书的一个或者多个实施例公开了一种基于深度学习的舆情预警方法,参看图1,该方法包括以下步骤:步骤11,获得整体抽样文本。在具体的实施过程中,本说明书的整体抽样文本包含多种抽样文本,例如:支付类投诉文本,来电文本,支付类社交文本,公开微博文本等等支付类整体抽样文。在这些支付类抽样文本中的情感能够表达出各种情绪,故而采集这些抽样文本能够获得多方面的舆情,进而更加准确的进行风险防控。更为具体的,在支付类平台中,根据操作的不同,可以将用户的行为分为以下类别:“一元购”、“付款未发货”、“信用卡套现”、“假冒公检法等公职人员”、“假冒其他身份”、“假冒支付平台客服”、“假冒领导或亲友”、“共享单车退款”、“其他兼职类”、“其他平台刷单”、“其他欺诈方式”、“口碑刷单”、“处理其他电商订单退款被骗”、“处理机票退改签被骗”、“处理支付订单退款被骗”、“开通借呗”、“开通微粒贷”、“开通花呗”、“投资理财/高额返利类”、“收到商品/服务与约定不符”、“时时彩/彩票”、“服饰/手机等实物购买”、“淘宝刷单”、“游戏充值/代练等游戏相关”、“缴纳淘宝店铺保证金被骗”、“考题购买/资料购买/办证等”、“色欲、情欲等,挑起或激发起性欲的操作”、“话费/流量/会员充值等”、“贷款/办卡/提额类其他”、“利用财产做注码来赌输赢操作”、“软件/应用(APP)购买”、“违禁其他类”。而整体抽样文本可以从用户的上述行为及其相关评论中获取。进一步的,整体抽样文本中包括有对用户行为相关的评论数据,抽样文本的相关数据(例如产生时间、地点、相关用户等等)等等参数。步骤12,利用舆情分析模型对所本文档来自技高网...

【技术保护点】
1.一种基于深度学习的舆情预警方法,所述方法包括:获得整体抽样文本;利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数;基于所述整体抽样文本对应的舆情分数和预设抽样策略,从所述整体抽样文本中获取目标抽样文本;将所述目标抽样文本转换为报文并进行预警。

【技术特征摘要】
1.一种基于深度学习的舆情预警方法,所述方法包括:获得整体抽样文本;利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数;基于所述整体抽样文本对应的舆情分数和预设抽样策略,从所述整体抽样文本中获取目标抽样文本;将所述目标抽样文本转换为报文并进行预警。2.如权利要求1所述的方法,所述利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数之前,所述方法还包括:利用训练文本对RNN深度学习模型进行训练,得到所述舆情分析模型。3.如权利要求2所述的方法,所述利用训练文本对RNN深度学习模型进行训练,得到所述舆情分析模型,具体包括:利用不可信、可信、中立三种标签建立分类器,对所述训练文本进行分类标注;其中,对包含有正面情绪的训练文本标注可信标签;对包含有负面情绪的训练文本标注不可信标签;对包含有中立情绪的训练文本标注中立标签;用分类标注后的训练文本对所述RNN模型进行训练,得到所述舆情分析模型。4.如权利要求3所述的方法,所述对所述训练文本进行分类标注,具体包括:对所述训练文本中包含有负面情绪的部分训练文本标注为不可信标签;利用包含有不可信标签的部分训练文本来训练半监督学习算法中的PULearning模型,并基于训练的PULearning模型从剩余训练文本中预测不可信的训练文本,并标注为不可信标签。5.如权利要求1所述的方法,在利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数之前,所述方法还包括:对所述整体抽样文本进行预训练。6.如权利要求5所述的方法,所述对所述整体抽样文本进行预训练,具体包括:保持神经网络模型中的特定层数的网络结构不变,利用所述神经网络模型对所述整体抽样文本进行预训练;或者将所述整体抽样文本按照场景进行分类,并保持神经网络模型中的特定层数的网络结构不变,利用所述神经网络模型分别对各个场景中的抽样文本进行预训练。7.如权利要求1-6任一权项所述的方法,所述舆情分析模型包括文本情感分析模型;所述利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数,具体包括:利用文本情感分析模型对所述整体抽样文本进行情感分析并得到对应的情感分数。8.如权利要求7所述的方法,所述利用文本情感分析模型对所述整体抽样文本进行情感分析并得到对应的情感分数,具体包括:对所述整体抽样文本进行分词处理,每个抽样文本划分出一个或者多个词向量;将所述每个抽样文本对应的一个或者多个词向量输入神经网络模型,得到每个词向量的情感分数;基于每个词向量的情感分数,得到每个抽样文本对应的情感分数。9.如权利要求1-6任一权项所述的方法,所述基于所述整体抽样文本对应的舆情分数和预设抽样策略,从所述整体抽样文本中获取目标抽样文本,具体包括:在用户和商户交易时,从所述整体抽样文本中获取所述商户的历史交易文本数据;基于所述整体抽样文本对应的舆情分数和所述预设抽样策略,从所述历史交易文本数据中获取所述目标抽样文本。10.如权利要求9所述的方法,所述基于所述整体抽样文本对应的舆情分数和预设抽样策略,从所述历史交易文本数据中获取所述目标抽样文本之后,所述方法还包括:将所述目标抽样文本发送给所述用户。11.如权利要求1-6任一权项所述的方法,所述利用舆情分析模型对所述整体抽样文本进行舆情分析并得到对应的舆情分数之后,所述方法还包括:将所述整体抽样文本对应的舆情分数输入到其他抽样类模型中确定出抽样阈值,或将所述整体抽样文本对应的舆情分数联合其他预设策略确定出所述抽样阈值;基于所述抽样阈值从所述整体抽样文本中选择出目标价值情绪文本,并将所述目标价值情绪文本输入到审理报文系统中进行反...

【专利技术属性】
技术研发人员:鲍晟霖王维强许辽萨赵闻飙袁锦程易灿
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1