【技术实现步骤摘要】
金融信息识别方法、装置、电子设备及计算机存储介质
[0001]本申请属于数据处理
,尤其涉及一种金融信息识别方法、装置、电子设备及计算机存储介质。
技术介绍
[0002]自然语言处理(Natural Language Processing,NLP)的目的是为了让机器理解人类语言。在金融分析领域,超额收益往往来自于信息不对称,而在大数据时代,信息不对称主要体现在信息过载的情况下,快速利用和挖掘信息的能力不对称。因此,利用NLP技术从这些非结构化的数据中高效、及时地挖掘出有价值的信息,才可能获得超额收益。经济、金融、政策、宏观统计数据等新闻或研究报告对投资标价格的影响举足轻重,所以如何从相关资料中精准定位到信息,并分析其对于投资标的带来的正负影响和影响周期显得尤为重要。
[0003]现行研究的技术方案往往选取新闻或文章标题而非正文作为原始文本,主要原因是对于金融、经济相关新闻,其正文中往往会引用过去类似事件的相关数据,使得正文中包含太多的噪声信息,这会对提取结果造成很大误差。新闻标题大都聚焦文章主旨,提取时相对准确 ...
【技术保护点】
【技术特征摘要】
1.一种金融信息识别方法,其特征在于,包括:获取待识别的金融信息;将所述金融信息输入预设的金融信息识别模型,输出识别结果;其中,所述金融信息识别模型是通过持续学习框架进行持续性预训练,再接入双向长短时记忆网络以及卷积神经网络进行模型训练得到的模型。2.根据权利要求1所述的金融信息识别方法,其特征在于,所述持续性预训练包括词语识别预训练、结构识别预训练和语义分析预训练。3.根据权利要求1所述的金融信息识别方法,其特征在于,在所述将所述金融信息输入预设的金融信息识别模型,输出识别结果之前,所述方法还包括:通过所述持续学习框架进行持续性预训练,得到预训练模型;采集测试语料,并对所述测试语料进行预处理;利用预处理后的测试语料对所述双向长短时记忆网络以及所述卷积神经网络进行模型训练,得到所述金融信息识别模型。4.根据权利要求1所述的金融信息识别方法,其特征在于,所述将所述金融信息输入预设的金融信息识别模型,输出识别结果,包括:将所述金融信息输入所述双向长短时记忆网络,输出所述金融信息的语义特征;将所述语义特征输入所述卷积神经网络,输出所述金融信息的全局特征;利用分类器对所述全局特征进行分类,得到所述识别结果。5.一种金融信息识别装置,其特征在于,包括:获取模块,用于获取待识别的金融信息;输出模块,用于将所述金融信息输入预设的金融信息识别模型,输出识别结果;其中,所述金融信息识别模型是通过持续学习...
【专利技术属性】
技术研发人员:张翼翔,
申请(专利权)人:中移智行网络科技有限公司中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。