【技术实现步骤摘要】
股市运行风险信息挖掘方法及装置
本申请涉及信息挖掘
,具体而言,涉及一种股市运行风险信息挖掘方法及装置。
技术介绍
股票市场是一个国家或地区经济和金融活动的晴雨表,也是企业融资和投资者资产配置的重要手段,对股市的预测研究不仅可以为政府、企业和投资者制定相关决策提供依据,还可以规避金融风险,促进股票市场稳定健康发展。政府相关政策对股市有着重要的影响,因此股民几乎每天都会关注政府部门发布的政策新闻,但是,一般情况下,政策新闻篇幅较大,股民需要阅读整篇政策新闻,然后从中获取对股市有影响的内容。现有技术中,为了节省了用户的阅读时间,有些股市预测平台会定期向用户推送政策新闻中对股市有影响的内容,这些内容是通过人工预先从整篇政策新闻中挑选出来的。很显然,人工从政策新闻中挑选有价值的内容效率比较低。
技术实现思路
本申请实施例的目的在于提供一种股市运行风险信息挖掘方法及装置,用以解决现有技术中对政策新闻挖掘效率低的问题。第一方面,本申请实施例提供一种股市运行风险信息挖掘方法,包括:获取待挖掘的新闻 ...
【技术保护点】
1.一种股市运行风险信息挖掘方法,其特征在于,包括:/n获取待挖掘的新闻数据;/n利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;/n其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。/n
【技术特征摘要】
1.一种股市运行风险信息挖掘方法,其特征在于,包括:
获取待挖掘的新闻数据;
利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取,获得风险摘要;
其中,所述风险摘要为利用目标抽取规则从所述新闻数据中抽取到的内容,所述目标抽取规则为多个抽取规则中成功抽取到风险摘要的抽取规则。
2.根据权利要求1所述的方法,其特征在于,所述信息抽取模型中包括与每个抽取规则对应的新闻类型;所述方法还包括:
根据所述目标抽取规则确定所述新闻数据对应的目标新闻类型。
3.根据权利要求2所述的方法,其特征在于,在获得目标抽取规则和风险摘要之后,所述方法还包括:
获取属于同一新闻类型的多个风险摘要;
对所述多个风险摘要进行聚类分析,获得至少一个细分类别。
4.根据权利要求3所述的方法,其特征在于,所述对所述多个风险摘要进行聚类分析,获得至少一个细分类别,包括:
从多个风险摘要中选取K个风险摘要作为均值向量;其中,K为正整数,且K的最大值小于风险摘要的总数;
循环执行簇归类操作,直至计算每个簇的新的均值向量的变化幅度小于预设幅度为止;
其中,所述簇归类操作包括:
计算每个风险摘要到每个均值向量之间的距离;
将距离风险摘要最近的均值向量的标记作为所述风险摘要的簇标记,获得K个簇,计算每个簇的新的均值向量。
5.根据权利要求2所述的方法,其特征在于,所述新闻类型包括利率利空政策、股市利空政策和行业概念利空政策,在利用信息抽取模型中的多个抽取规则分别对所述新闻数据进行抽取之前,所述方法还包括:
分别获取所述利率利空政策、股市利空政策和行业概念利空政策对应的关键词;
根据所述利率...
【专利技术属性】
技术研发人员:席丽娜,刘大双,李德彦,
申请(专利权)人:中科鼎富北京科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。