【技术实现步骤摘要】
一种用于高精度识别中标金额的LSTM模型单元训练方法及装置
本专利技术涉及识别技术,具体的涉及用于高精度识别中标金额的LSTM模型单元训练方法及装置。
技术介绍
LSTM(longshorttermmemory,长短期记忆网络)是为了解决长期问题而专门设计出来的,所有的RNN(RecurrentNeuralNetwork,循环神经网络)都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。LSTM同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于单一神经网络层,这里是有四个,以一种非常特殊的方式进行交互。softmax是归一化指数函数,是逻辑函数的一种推广。它能将一个含任意实数的K维向量z“压缩”到另一个K维实向量σ(z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1。该函数多于多分类问题中。由于招中标文件编写格式差异大的特点,目前市面上并没有对于招中标文件的中标金额进行识别提取的成熟解决方案。本专利是依托于四川隧 ...
【技术保护点】
1.一种用于高精度识别中标金额的LSTM模型单元训练方法,应用于计算机,其特征在于,所述方法包括:/nS1:获取标注有中标金额信息的判别二值或三值表;/nS2:根据所述标注有中标金额信息的判别二值或三值表生成字符向量训练素材;/nS3:初始化LSTM模型单元;/nS4:将所述字符向量训练素材按正序排列输入到当前LSTM模型单元中进行训练,得到对应字符向量训练素材的前向运行预测值;/nS5:根据得到的对应字符向量训练素材的前向运行预测值,计算与该对应字符向量训练素材的实际类别之间的差距;/nS6:判断所述差距是否持续震荡下降,若是,则执行S7,若否,则结束,得到目标LSTM模 ...
【技术特征摘要】
1.一种用于高精度识别中标金额的LSTM模型单元训练方法,应用于计算机,其特征在于,所述方法包括:
S1:获取标注有中标金额信息的判别二值或三值表;
S2:根据所述标注有中标金额信息的判别二值或三值表生成字符向量训练素材;
S3:初始化LSTM模型单元;
S4:将所述字符向量训练素材按正序排列输入到当前LSTM模型单元中进行训练,得到对应字符向量训练素材的前向运行预测值;
S5:根据得到的对应字符向量训练素材的前向运行预测值,计算与该对应字符向量训练素材的实际类别之间的差距;
S6:判断所述差距是否持续震荡下降,若是,则执行S7,若否,则结束,得到目标LSTM模型单元;
S7:通过链式法则,得到当前LSTM模型单元中每个参数应该变化的数值大小;
S8:通过梯度下降优化算法,得到当前LSTM模型中每个参数的变化方向和变化值,进而修正LSTM模型中每个参数。
2.根据权利要求1所述的方法,其特征在于,所述S2包括:使用Embedding层,对字符进行向量化,使每一个字符对应于一个300维的向量。
3.根据权利要求1所述的方法,其特征在于,所述S4包括:
S41:将字符向量训练素材中的每一个向量,按照从前到后的顺序,依次通过当前LSTM模型单元进行运算,得到一个最终结果输出量;
S42:将得到的最终结果输出量输入激活函数softmax进行运算,得到对应字符向量训练素材的预测值,记为该字符的前向运算预测值,然后与真实标签进行衡量得到损失值。
4.根据权利要求1所述的方法,其特征在于,所述S5中,所述前向运行预测值是一个2维或3维向量,记为前向运行2维或3维预测向量,字符对应的标签类型值,也表示为一个2维或3维向量,则所述差距指的是前向运行2维或3维预测向量与该对应的标签类型2维或3维向量之间的差异化程度。
5.根据权利要求4所述的方法,其特征在于,
前向运行2维或3维预测向量与对应的标签类型2维或3维向量之间的差异化程度用损失函数进行表示,记一个前向运行2维或3维预测向量与对应的标签类型2维或3维向量之间的损失函数值为cost(hθ(x),y)...
【专利技术属性】
技术研发人员:张森,缪谨,畅敏,于长虹,肖波,谭卓,吴宏扬,盛润,许云侠,
申请(专利权)人:四川隧唐科技股份有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。