一种基于情感分析的预警方法及装置制造方法及图纸

技术编号:20567139 阅读:17 留言:0更新日期:2019-03-14 09:41
本发明专利技术提供了一种基于情感分析的预警方法及装置,其中,该方法包括:实时流式确定待监测的目标实体信息;从预先获取的可处理文本中提取与目标实体信息相关的监测信息,并对监测信息进行结构化处理;对结构化处理后的监测信息进行情感分析,根据情感分析结果确定监测信息对应的违约程度;根据所有监测信息的违约程度以及相应的权重确定目标实体的违约程度,在目标实体的违约程度达到预警值时生成预警消息。通过本发明专利技术实施例提供的基于情感分析的预警方法及装置,能在全网范围对指定实体进行定向监测,监测的信息更加全面,后续预测结果更加准确;基于情感分析可以有效地预测目标实体存在的风险,及时生成预警消息提醒用户。

【技术实现步骤摘要】
一种基于情感分析的预警方法及装置
本专利技术涉及自然语言处理
,具体而言,涉及一种基于情感分析的预警方法及装置。
技术介绍
目前,当需要对企业经营状况进行分析时,一般借助债券评级机构对公司进行评级,分析公司的生产经营状况和财务状况等。传统的债券评级机构使用人工方法采集信息,这种方式存在以下问题:滞后性:滞后性体现在两点:1)在企业出现了实质性违约后,才进行评级的下调,实时性较差。2)定期统计数据,会导致无法实时掌握企业的最新经营情况变化,市场反应速度慢。效率低:信息由人工采集和录入,难以在第一时间发现违约的预警信号;且由于导致违约的信号可能有多个,并有不同的信息源,人工难以一一发现。
技术实现思路
为解决上述问题,本专利技术实施例的目的在于提供一种基于情感分析的预警方法及装置。第一方面,本专利技术实施例提供了一种基于情感分析的预警方法,包括:实时流式确定待监测的目标实体信息,所述目标实体信息包括公司、行业、资产、证券、人物实体中的一项或多项;从预先获取的可处理文本中提取与所述目标实体信息相关的监测信息,并对所述监测信息进行结构化处理;对结构化处理后的所述监测信息进行情感分析,根据情感分析结果确定所述监测信息对应的违约程度;根据所有监测信息的违约程度以及相应的权重确定所述目标实体的违约程度,在所述目标实体的违约程度达到预警值时生成预警消息。第二方面,本专利技术实施例还提供了一种基于情感分析的预警装置,包括:目标实体确定模块,用于实时流式确定待监测的目标实体信息,所述目标实体信息包括公司、行业、资产、证券、人物实体中的一项或多项;监测信息处理模块,用于从预先获取的可处理文本中提取与所述目标实体信息相关的监测信息,并对所述监测信息进行结构化处理;情感分析模块,用于对结构化处理后的所述监测信息进行情感分析,根据情感分析结果确定所述监测信息对应的违约程度;预警模块,用于根据所有监测信息的违约程度以及相应的权重确定所述目标实体的违约程度,在所述目标实体的违约程度达到预警值时生成预警消息。本专利技术实施例上述第一方面提供的方案中,基于目标实体信息可以从大量的目标信息源中多维度地获取可处理文本,能在全网范围对指定实体进行定向监测,监测的信息更加全面,后续预测结果更加准确;采用流式的方式实时获取目标实体信息,可以更加快速地获取目标实体信息;对监测信息进行结构化处理方便后续快速处理数据,对结构化处理后的监测信息进行情感分析可以全面确定目标实体的违约程度,从而可以有效地预测目标实体存在的风险,及时生成预警消息提醒用户。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本专利技术实施例所提供的一种基于情感分析的预警方法的流程图;图2示出了本专利技术实施例所提供的一种基于情感分析的预警装置的结构示意图;图3示出了本专利技术实施例所提供的执行基于情感分析的预警方法的电子设备的结构示意图。具体实施方式在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。在本专利技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利技术中的具体含义。本专利技术实施例提供的一种基于情感分析的预警方法,用于对用户关注的内容进行预警,参见图1所示,该方法包括:步骤101:实时流式确定待监测的目标实体信息,目标实体信息包括公司、行业、资产、证券、人物实体中的一项或多项。本专利技术实施例中,可以预设监测实体名单,该监测实体名单可以由用户自行指定生成,也可以是系统自动生成;该监测实体名单可基于需要实时维护,以使得监测实体名单中的目标实体符合用户需求。目标实体为待监测的实体,与目标实体相关的信息具体包括公司、行业、资产、证券、人物实体等。例如某公司A为目标实体时,相应的目标实体信息可以包括公司A的名称、公司A所属行业、公司A的资产信息、公司A的证券信息、公司A相关的人物实体(比如法人、股东等),通过多方面监控目标实体的相关信息,可以获取更加全面的数据,使得后续预测结果更加准确。同时,本专利技术实施例中采用流式的方式实时获取目标实体信息,在网站发生更新时实时爬取该网站,相比现有的批量处理方式具有更高的实时性,可以更加快速地获取目标实体信息。步骤102:从预先获取的可处理文本中提取与目标实体信息相关的监测信息,并对监测信息进行结构化处理。本专利技术实施例中,在确定目标实体后,即可定位相关的目标信息源,并从目标信息源获取相应的信息,该目标信息源可以包括官网、行业网站、门户网站、微博、微信等。从目标信息源获取到相应的信息后即可对获取到的信息进行初步处理,生成可处理文本。具体的,由于从目标信息源获取的信息可能是照片、PDF等非文本格式的内容,此时需要对该内容进行初步处理,具体可基于图像识别技术提取文本特征,识别图像中不同尺度、不同宽高比例以及不同倾斜程度的文字,生成文本格式的可处理文本,方便后续快速处理。具体的,可以使用残差神经网络作为骨干网络,结合空间金字塔采样法以及多尺度特征金字塔模型来自动提取图像文本特征,该方式能够识别图像中不同尺度、不用宽高比例以及不同倾斜程度的文字,在ICDAR端到端场景文本识别/多方向文本识别数据集上均获得优异的效果。同时,可处理文本中包含大量与目标实体相关的内容,例如重复的内容等,此时需要从中提取出与目标实体相关的、有用的监测信息。同时,为了方便处理,将非结构化的监测信息转换为结构化的数据;例如,提取出的监测信息为对XX公司的新闻事件报道,对该监测信息进行结构化处理后可得到“XX公司,在XX时间,发生XX事件”的结构化数据。步骤103:对结构化处理后的监测信息进行情感分析,根据情感分析结果确定监测信息对应的违约程度。本专利技术实施例中,情感分析是指分析监测信息中的情感倾向和情感强度,根据监测信息的情感分析结果即可确定该监测信息所表示的违约程度;其中,监测信息的违约程度表示的是该监测信息所体现出的目本文档来自技高网...

【技术保护点】
1.一种基于情感分析的预警方法,其特征在于,包括:实时流式确定待监测的目标实体信息,所述目标实体信息包括公司、行业、资产、证券、人物实体中的一项或多项;从预先获取的可处理文本中提取与所述目标实体信息相关的监测信息,并对所述监测信息进行结构化处理;对结构化处理后的所述监测信息进行情感分析,根据情感分析结果确定所述监测信息对应的违约程度;根据所有监测信息的违约程度以及相应的权重确定所述目标实体的违约程度,在所述目标实体的违约程度达到预警值时生成预警消息。

【技术特征摘要】
1.一种基于情感分析的预警方法,其特征在于,包括:实时流式确定待监测的目标实体信息,所述目标实体信息包括公司、行业、资产、证券、人物实体中的一项或多项;从预先获取的可处理文本中提取与所述目标实体信息相关的监测信息,并对所述监测信息进行结构化处理;对结构化处理后的所述监测信息进行情感分析,根据情感分析结果确定所述监测信息对应的违约程度;根据所有监测信息的违约程度以及相应的权重确定所述目标实体的违约程度,在所述目标实体的违约程度达到预警值时生成预警消息。2.根据权利要求1所述的方法,其特征在于,所述对所述监测信息进行结构化处理包括:预先获取监测样本信息,并确定所述监测样本信息的事件触发词、事件元素和事件类型;根据所述事件触发词和事件元素生成所述监测样本信息的事件向量,并根据不同事件类型的所述监测样本信息的事件向量对事件提取模型进行分类训练,确定训练后的事件提取模型;根据训练后的事件提取模型抽取所述监测信息中的事件触发词和事件元素,并根据所述监测信息的事件触发词和事件元素生成结构化的监测信息。3.根据权利要求1所述的方法,其特征在于,所述对结构化处理后的所述监测信息进行情感分析包括:确定所述监测信息中的评价对象和评价方面,并确定所述评价对象在每个评价方面的情感分类。4.根据权利要求1所述的方法,其特征在于,所述对结构化处理后的所述监测信息进行情感分析包括:基于句法树的递归神经网络模型确定所述监测信息中每个词语在所述监测信息中的极性,并根据每个词语的极性确定所述监测信息的情感极性得分。5.根据权利要求1所述的方法,其特征在于,还包括:基于长短期记忆网络和条件随机场算法预测与所述监测信息对应的事件的生命周期。6.一种基于情感分析的预警装置,其...

【专利技术属性】
技术研发人员:李纪为
申请(专利权)人:北京香侬慧语科技有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1