股市运行风险信息挖掘方法及装置制造方法及图纸

技术编号:24010723 阅读:14 留言:0更新日期:2020-05-02 01:39
本申请提供一种股市运行风险信息挖掘方法及装置。该方法包括:获取待挖掘的新闻数据;利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。本申请实施例通过多个抽取规则分别对新闻数据进行抽取,获得新闻数据中的风险摘要,无需人工从新闻数据中摘取,从而提高了对风险摘要挖掘的效率。

Method and device of mining risk information of stock market operation

【技术实现步骤摘要】
股市运行风险信息挖掘方法及装置
本申请涉及信息挖掘
,具体而言,涉及一种股市运行风险信息挖掘方法及装置。
技术介绍
股票市场是一个国家或地区经济和金融活动的晴雨表,也是企业融资和投资者资产配置的重要手段,对股市的预测研究不仅可以为政府、企业和投资者制定相关决策提供依据,还可以规避金融风险,促进股票市场稳定健康发展。政府相关政策对股市有着重要的影响,因此股民几乎每天都会关注政府部门发布的政策新闻,但是,一般情况下,政策新闻篇幅较大,股民需要阅读整篇政策新闻,然后从中获取对股市有影响的内容。现有技术中,为了节省了用户的阅读时间,有些股市预测平台会定期向用户推送政策新闻中对股市有影响的内容,这些内容是通过人工预先从整篇政策新闻中挑选出来的。很显然,人工从政策新闻中挑选有价值的内容效率比较低。
技术实现思路
本申请实施例的目的在于提供一种股市运行风险信息挖掘方法及装置,用以解决现有技术中对政策新闻挖掘效率低的问题。第一方面,本申请实施例提供一种股市运行风险信息挖掘方法,包括:获取待挖掘的新闻数据;利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。本申请实施例通过多个抽取规则分别对新闻数据进行抽取,获得新闻数据中的风险摘要,无需人工从新闻数据中摘取,从而提高了对风险摘要挖掘的效率。进一步地,所述信息抽取模型中包括与每个抽取规则对应的新闻类型;所述方法还包括:根据所述目标抽取规则确定所述新闻数据对应的目标新闻类型。本申请实施例通过利率利空政策、股市利空政策和行业概念利空政策这三个方面对新闻数据进行挖掘,从而可以获得更加全面、准确的风险摘要。进一步地,在获得目标抽取规则和风险摘要之后,所述方法还包括:获取属于同一新闻类型的多个风险摘要;对所述多个风险摘要进行聚类分析,获得至少一个细分类别。本申请实施例通过对同一类型的风险摘要进行聚类分析,将属于同一类型的风险摘要归为一类,以实现对风险摘要的整理。进一步地,所述对所述多个风险摘要进行聚类分析,获得至少一个细分类别,包括:从多个风险摘要中选取K个风险摘要作为均值向量;其中,K为正整数,且K的最大值小于风险摘要的总数;循环执行簇归类操作,直至计算每个簇的新的均值向量的变化幅度小于预设幅度为止;其中,所述簇归类操作包括:计算每个风险摘要到每个均值向量之间的距离;将距离风险摘要最近的均值向量的标记作为所述风险摘要的簇标记,获得K个簇,计算每个簇的新的均值向量。进一步地,所述新闻类型包括利率利空政策、股市利空政策和行业概念利空政策;在利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取之前,所述方法还包括:分别获取所述利率利空政策、股市利空政策和行业概念利空政策对应的关键词;根据所述利率利空政策的关键词生成所述利率利空政策对应的抽取规则;根据所述股市利空政策的关键词生成所述股市利空政策对应的抽取规则;根据所述行业概念利空政策的关键词生成所述行业概念利空政策对应的抽取规则。本申请实施例通过不同的抽取规则对新闻数据进行抽取,能够从不同类型的新闻数据所具备的特征不同出发,从而提高了抽取的准确性。进一步地,所述利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要,包括:将所述新闻数据中的每个段落与抽取规则进行匹配,若匹配成功,则所述抽取规则为目标抽取规则,匹配成功的段落为所述风险摘要。本申请实施例通过以段落为单位,将对股市有影响的段落抽取出来,使得风险摘要更加精简。第二方面,本申请实施例提供一种股市运行风险信息挖掘装置,包括:数据获取模块,用于获取待挖掘的新闻数据;信息抽取模块,用于利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。进一步地,所述信息抽取模型中包括与每个抽取规则对应的新闻类型;所述挖掘装置还包括:类型确定模块,用于根据所述目标抽取规则确定所述新闻数据对应的目标新闻类型。第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法。第四方面,本申请实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的方法。本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的股市运行风险信息挖掘方法流程示意图;图2为本申请实施例提供的聚类分析流程示意图;图3为本申请实施例提供的规则配置页面;图4为本申请实施例提供的抽取规则显示页面;图5为本申请实施例提供的抽取结果示意图;图6为本申请实施例提供的挖掘装置结构示意图;图7为本申请实施例提供的电子设备实体结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。图1为本申请实施例提供的股市运行风险信息挖掘方法流程示意图,如图1所示,执行该方法的主体为挖掘装置,该挖掘装置可以是服务器、电脑终端、移动终端或智能穿戴设备等,该方法包括:步骤101:获取待挖掘的新闻数据;步骤102:利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。在具体的实施过程中,下面从挖掘装置分别为服务器和电脑进行描述。一、挖掘装置为服务器当用户想要获知近期的关于股市的政策新闻时,可以通过用户终端向服务器发送查询请求。其中,用户终端可以安装有该服务器对应的客户端,通过客户端向服务器发送该查询请求。查询请求可以是近期政策风险有哪些,并且查询请求中也可以指定具体日期,例如:今天、最近一周等。服务器在接收到查询请求之后,获取待挖掘的新闻数据。应当说明的是,若用户没有指定时间,那么可以默本文档来自技高网...

【技术保护点】
1.一种股市运行风险信息挖掘方法,其特征在于,包括:/n获取待挖掘的新闻数据;/n利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;/n其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。/n

【技术特征摘要】
1.一种股市运行风险信息挖掘方法,其特征在于,包括:
获取待挖掘的新闻数据;
利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;
其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。


2.根据权利要求1所述的方法,其特征在于,所述信息抽取模型中包括与每个抽取规则对应的新闻类型;所述方法还包括:
根据所述目标抽取规则确定所述新闻数据对应的目标新闻类型。


3.根据权利要求2所述的方法,其特征在于,在获得目标抽取规则和风险摘要之后,所述方法还包括:
获取属于同一新闻类型的多个风险摘要;
对所述多个风险摘要进行聚类分析,获得至少一个细分类别。


4.根据权利要求3所述的方法,其特征在于,所述对所述多个风险摘要进行聚类分析,获得至少一个细分类别,包括:
从多个风险摘要中选取K个风险摘要作为均值向量;其中,K为正整数,且K的最大值小于风险摘要的总数;
循环执行簇归类操作,直至计算每个簇的新的均值向量的变化幅度小于预设幅度为止;
其中,所述簇归类操作包括:
计算每个风险摘要到每个均值向量之间的距离;
将距离风险摘要最近的均值向量的标记作为所述风险摘要的簇标记,获得K个簇,计算每个簇的新的均值向量。


5.根据权利要求2所述的方法,其特征在于,所述新闻类型包括利率利空政策、股市利空政策和行业概念利空政策,在利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取之前,所述方法还包括:
分别获取所述利率利空政策、股市利空政策和行业概念利空政策对应的关键词;
根据所述利率...

【专利技术属性】
技术研发人员:席丽娜刘大双李德彦
申请(专利权)人:中科鼎富北京科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1