The invention discloses an analysis method of financial event modification tense based on attention mechanism, which belongs to the field of data processing technology. The core idea of the analysis method is: after the input text is quantified, the in-depth learning neural network technology is applied, and the attention mechanism technology is combined to do high-dimensional feature learning for the input text vector, with the goal of learning the most relevant tense The invention aims to solve the defects in the prior art that more rely on human editing rules, so as to improve efficiency and scalability; the application of attention mechanism to temporal analysis can obtain more rich text features, improve the accuracy of output results, greatly reduce errors and improve efficiency.
【技术实现步骤摘要】
一种基于注意力机制的金融事件修饰时态的分析方法
本专利技术涉及数据处理
,特别涉及一种基于注意力机制的金融事件修饰时态的分析方法。
技术介绍
最近几年,随着深度学习技术的不断发展,越来越多的研究应用到自然语言处理中。注意力机制是主要研究领域之一,深度学习中的注意力机制从本质上讲和人类的选择性视觉注意力机制类似,核心目标也是从众多信息中选择出对当前任务目标更关键的信息。金融事件修饰时态的分析方法在许多领域都有广泛的应用,尤其是在金融、财务以及法律等领域,其主要目的在于探讨当某一事件发生时(如公司股利宣告或盈余发布等事件)是否会引起股价的异常变动,因而导致异常报酬率,研究结果可以用来了解市场证券价格与特定事件是否具有关联性,主要实施方法是利用统计方法检定异常报酬率状况,即检定期望异常报酬率是否为零,由于经济金融类的特殊属性,文本中词汇的时效性对投资参考价值具有重要意义。但是由于中文缺乏明显的时态标记,无论是古汉语还是现代汉语。不同于印欧语言,形态变化有那么明显,例如英语动词有现在时、过去时和过去分词等形态。尽管如此,中文还是具有自己的特点,例如时间词(昨天|明天)、动态助词(着|过)、上下文语境等。但是这些特点很难完全形成规则来识别和判断文本的时态,现在有较多的中文文本处理场景,应用到注意力机制,然而中文时态分析更多是靠人为编辑的规则,无法实现自动化新特征发现,维护这些规则的效率也相对较低,可扩展性差。
技术实现思路
本专利技术目的在于提供一种金融事件修饰时态的分析方法,旨在解决现有技术中更多依赖人为编辑规则的缺陷,从而提高效率,增强可扩展性。为了解决上述技 ...
【技术保护点】
1.一种基于注意力机制的金融事件修饰时态的分析方法,其特征在于,包括以下步骤:步骤a:整理并输入原始文本,将所述原始文本作分词处理形成词汇;步骤b:将所述词汇输入到深度神经网络后转为词向量,每个所述词向量后面拼接对应词汇的词性向量和位置序号,生成新向量,记作Vec_Input;步骤c:将各个所述Vec_Input向量组合后,生成文本矩阵,记作Text_Matrix,以此代表文本信息;步骤d:将所述Text_Matrix输入到N个线性空间映射函数,输出N个新文本矩阵,记作New_Text_Matrix;步骤e:将N个所述New_Text_Matrix输入注意力机制模块,输出注意力系数矩阵,记作Mat_Attention,即每个词汇两两之间都有注意力系数;步骤f:将Mat_Attention和Text_Matrix做矩阵相乘,然后输入到归一化模块进行归一化处理并输出结果矩阵,记作Mat_Result,即每个词汇两两之间的修饰相关度值;步骤g:在所述Mat_Result中找到金融事件词汇的位置,并查看与所述金融事件词汇相关度高的词汇,在所述词汇中查看和时态修饰有关的词,以此来判断该金融事件的 ...
【技术特征摘要】
1.一种基于注意力机制的金融事件修饰时态的分析方法,其特征在于,包括以下步骤:步骤a:整理并输入原始文本,将所述原始文本作分词处理形成词汇;步骤b:将所述词汇输入到深度神经网络后转为词向量,每个所述词向量后面拼接对应词汇的词性向量和位置序号,生成新向量,记作Vec_Input;步骤c:将各个所述Vec_Input向量组合后,生成文本矩阵,记作Text_Matrix,以此代表文本信息;步骤d:将所述Text_Matrix输入到N个线性空间映射函数,输出N个新文本矩阵,记作New_Text_Matrix;步骤e:将N个所述New_Text_Matrix输入注意力机制模块,输出注意力系数矩阵,记作Mat_Attention,即每个词汇两两之间都有注意力系数;步骤f:将Mat_Attention和Text_Matrix做矩阵相乘,然后输入到归一化模块进行归一化处理并输出结果矩阵,记作Mat_Result,即每个词汇两两之间的修饰相关度值;步骤g:在所述Mat_Result中找到金融事件词汇的位置,并查看与所述金融事件词汇相关度高的词汇,在所述词汇中查看和时态修饰有关的词,以此来判断该金融事件的时态;步骤h:根据结果的精度判断,当精度达到阈值时输出最终结果,当精度达不到阈值时,再经过反馈训练模块返回到步骤c,重新训练神经网络结构。2.根据权利要求1所述...
【专利技术属性】
技术研发人员:柴志伟,陶村春,
申请(专利权)人:宁波深擎信息科技有限公司,上海深擎信息科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。