深度学习序列标注方法、装置及计算机可读存储介质制造方法及图纸

技术编号：26792127 阅读：18 留言：0更新日期：2020-12-22 17:07

本发明专利技术涉及一种人工智能，提供一种深度学习序列标注方法、装置及计算机可读存储介质，其中方法包括：利用初始化的embedding层将待处理文本的句子中的每个字进行预处理，获取所述待处理文本中的每个字的字向量；通过bi‑lstm层对所述字向量进行处理，获取所述待处理文本的文本特征；通过softmax层对所述文本特征进行处理，获取所述文本特征的预测标注位置；通过loss层对所述文本特征的预测标注位置进行处理，完成所述待处理文本的序列标注。本发明专利技术提高在深度学习中序列标注的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习序列标注方法、装置及计算机可读存储介质
本专利技术涉及人工智能
，尤其涉及一种基于损失函数的深度学习序列标注方法、装置、电子设备及计算机可读存储介质。
技术介绍
在机器学习和深度学习应用中，数据不平衡是一个非常常见的问题，尤其在自然语言处理任务中。例如：在自然语言处理的序列标注任务中，对命名实体识别采用BIEOS标注时，文本中大部分数据会标为O(即不是命名实体)，O与其他类别(标注为B、I、E、S)的数量相差非常明显，这种显著的不平衡在普通的loss下会导致模型倾向于负例，但是实际上在标注任务中正确标注正例更为重要，因此一般采用macro-F1这种同时注重各个标签的准确与召回的评价函数来进行评测，并且负例过多会导致模型难以学习到困难样本(标注为正例的样本)，会在损失函数的推动下遗忘对困难样本的学习。为了解决不平衡问题，采取非常多的解决方法，例如：从数据的角度进行数据抽样、对大类数据欠采样、对小类数据过采样、利用smote生成数据、对数据进行回译、以及在损失函数中对小类样本的损失进行手动或者自动加权等，这些举措在一定程度上缓解了数据不平衡带来的模型对困难样本难学习的问题。但上述解决标注不平衡问题的方式，忽视损失函数本身的特点带来的问题，其中，给损失函数加权是一种从表层去解决的思路，本质上损失函数始终平等的看待每个样本，无论正负标签，普通loss(如交叉熵)始终都是将样本推向1或者0，但实际上，对标注某个字分类而言，将样本分为正负只需要样本的分为正负的概率大于或小于0.5即可，不需要花费更多...

【技术保护点】
1.一种深度学习序列标注方法，其特征在于，所述方法包括：/n利用初始化的embedding层对待处理文本的句子中的每个字进行预处理，获取所述待处理文本中的每个字的字向量；/n通过bi-lstm层对所述字向量进行处理，获取所述待处理文本的文本特征；/n通过softmax层对所述文本特征进行处理，获取所述文本特征的预测标注位置；/n通过loss层对所述文本特征的预测标注位置进行处理，完成所述待处理文本的序列标注。/n

【技术特征摘要】
1.一种深度学习序列标注方法，其特征在于，所述方法包括：
利用初始化的embedding层对待处理文本的句子中的每个字进行预处理，获取所述待处理文本中的每个字的字向量；
通过bi-lstm层对所述字向量进行处理，获取所述待处理文本的文本特征；
通过softmax层对所述文本特征进行处理，获取所述文本特征的预测标注位置；
通过loss层对所述文本特征的预测标注位置进行处理，完成所述待处理文本的序列标注。

2.如权利要求1所述的深度学习序列标注方法，其特征在于，所述利用初始化的embedding层将待处理文本的句子中的每个字进行预处理，获取所述待处理文本中的每个字的字向量，包括如下步骤：
利用初始化的embedding层将所述待处理文本的句子中的每个字由one-hot向量映射为低维稠密的字向量，得到所述待处理文本中的每个字的字向量。

3.如权利要求1所述的深度学习序列标注方法，其特征在于，所述通过bi-lstm层对所述字向量进行处理，获取所述待处理文本的文本特征，包括如下步骤：
将所述待处理文本中的句子的每个字的字向量作为双向lstm各个时间步的输入；
将正向lstm输出的隐状态向量与反向lstm的在各个位置输出的隐状态向量进行按位置拼接，得到完整的隐状态向量；
对所述完整的隐状态向量进行处理，获取所述待处理文本的文本特征。

4.如权利要求1所述的深度学习序列标注方法，其特征在于，所述通过softmax层对所述文本特征进行处理，获取所述文本特征的预测标注位置，包括如下步骤：
对所述文本特征进行softmax计算，计算所述待处理文本中句子的每个字预测为某一个标注标签的归一化概率；
将计算得到的最大概率标注为预测标签，完成所述待处理文本中待标注位置的分类。

5.如权利要求4所述的深度学习序列标注方法，其特征在于，所述对所述文本特征进行softmax计算，计算所述待处理文本中句子的每个字预测为某一个标注标签的归一化概率，包括如下步骤：
所述softmax计算公式为：

【专利技术属性】
技术研发人员：孙思，
申请(专利权)人：平安国际智慧城市科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人