基于深度学习的文本处理方法、装置、设备及介质制造方法及图纸

技术编号：24331224 阅读：20 留言：0更新日期：2020-05-29 19:40

本申请实施例公开了一种基于深度学习的文本处理方法、装置、设备及介质，涉及自然语言处理领域。方法包括：获取样本集合和由样本集合训练的深度学习模型；选取样本集合中的目标样本文本和目标样本文本对应的样本处理结果；调用深度学习模型，对目标样本文本进行处理，得到多个处理结果的概率，选取概率最高的处理结果作为目标样本文本对应的预测处理结果；响应于预测处理结果与样本处理结果不同，对多个处理结果的概率进行统计处理，获取目标样本文本的处理结果分布特征；响应于处理结果分布特征满足目标条件，对样本集合中的样本处理结果进行修正处理，得到修正后的样本集合，提高了样本集合的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的文本处理方法、装置、设备及介质
本申请涉及自然语言处理领域，特别涉及一种基于深度学习的文本处理方法、装置、设备及介质。
技术介绍
随着人工智能技术和自然语言处理技术的发展，目前越来越多地应用模型对文本进行处理，例如文本分类模型、文本翻译模型等。相关技术中，通常会先获取样本集合，该样本集合中包括多条样本文本和该多条样本文本对应的样本处理结果，根据样本集合对模型进行训练。其中，模型的训练效果取决于样本集合中样本处理结果是否准确，如果样本集合中的部分样本处理结果不准确，可能会影响模型的准确度。
技术实现思路
本申请实施例提供了一种基于深度学习的文本处理、装置、设备及介质，可以提高样本集合的准确性。所述技术方案如下：一方面，提供了一种基于深度学习的文本处理方法，所述方法包括：获取样本集合和由所述样本集合训练的深度学习模型，所述样本集合中包括多条样本文本和所述多条样本文本对应的样本处理结果；选取所述样本集合中的目标样本文本和所述目标样本文本对应的样本处理结果；调用所述深度学习模型，对所述目标样本文本进行处理，得到多个处理结果的概率，选取概率最高的处理结果作为所述目标样本文本对应的预测处理结果；响应于所述预测处理结果与所述样本处理结果不同，对所述多个处理结果的概率进行统计处理，获取所述目标样本文本的处理结果分布特征，所述处理结果分布特征用于指示所述深度学习模型处理所述目标样本文本得到的处理结果的不确定性程度；响应于所述处理结果分布特...

【技术保护点】
1.一种基于深度学习的文本处理方法，其特征在于，所述方法包括：/n获取样本集合和由所述样本集合训练的深度学习模型，所述样本集合中包括多条样本文本和所述多条样本文本对应的样本处理结果；/n选取所述样本集合中的目标样本文本和所述目标样本文本对应的样本处理结果；/n调用所述深度学习模型，对所述目标样本文本进行处理，得到多个处理结果的概率，选取概率最高的处理结果作为所述目标样本文本对应的预测处理结果；/n响应于所述预测处理结果与所述样本处理结果不同，对所述多个处理结果的概率进行统计处理，获取所述目标样本文本的处理结果分布特征，所述处理结果分布特征用于指示所述深度学习模型处理所述目标样本文本得到的处理结果的不确定性程度；/n响应于所述处理结果分布特征满足目标条件，对所述样本集合中的所述样本处理结果进行修正处理，得到修正后的样本集合。/n

【技术特征摘要】
1.一种基于深度学习的文本处理方法，其特征在于，所述方法包括：
获取样本集合和由所述样本集合训练的深度学习模型，所述样本集合中包括多条样本文本和所述多条样本文本对应的样本处理结果；
选取所述样本集合中的目标样本文本和所述目标样本文本对应的样本处理结果；
调用所述深度学习模型，对所述目标样本文本进行处理，得到多个处理结果的概率，选取概率最高的处理结果作为所述目标样本文本对应的预测处理结果；
响应于所述预测处理结果与所述样本处理结果不同，对所述多个处理结果的概率进行统计处理，获取所述目标样本文本的处理结果分布特征，所述处理结果分布特征用于指示所述深度学习模型处理所述目标样本文本得到的处理结果的不确定性程度；
响应于所述处理结果分布特征满足目标条件，对所述样本集合中的所述样本处理结果进行修正处理，得到修正后的样本集合。

2.根据权利要求1所述的方法，其特征在于，所述响应于所述处理结果分布特征满足目标条件，对所述样本集合中的所述样本处理结果进行修正处理，得到修正后的样本集合，包括：
响应于所述处理结果分布特征满足所述目标条件，将所述样本集合中的所述样本处理结果替换为所述预测处理结果，得到所述修正后的样本集合，或者，将所述样本集合中的所述目标样本文本和所述样本处理结果删除，得到所述修正后的样本集合。

3.根据权利要求1所述的方法，其特征在于，所述响应于所述处理结果分布特征满足目标条件，对所述样本集合中的所述样本处理结果进行修正处理，得到修正后的样本集合，包括：
对所述处理结果分布特征进行统计处理，得到所述预测处理结果的准确度；
响应于所述预测处理结果的准确度大于预设准确度，对所述样本集合中的所述样本处理结果进行修正处理，得到所述修正后的样本集合。

4.根据权利要求3所述的方法，其特征在于，所述处理结果分布特征为所述目标样本文本的困惑度，所述困惑度与所述预测处理结果的准确度呈正相关关系；或者，
所述处理结果分布特征为所述目标样本文本的信息熵，所述信息熵与所述预测处理结果的准确度呈负相关关系。

5.根据权利要求1所述的方法，其特征在于，所述获取样本集合和由所述样本集合训练的深度学习模型之后，所述方法还包括：
对第一文本中的每个汉字字符进行编码，得到所述每个汉字字符对应的汉字特征值；
获取包括多个预设特征值以及对应的拼音字符的映射关系，所述多个预设特征值按照顺序排列；
根据每个汉字特征值与所述多个预设特征值之间的大小关系以及所述多个预设特征值的顺序，查询所述每个汉字特征值对应的拼音字符；
将所述每个汉字字符分别转换为所述每个汉字特征值对应的拼音字符，得到第二文本；
调用所述深度学习模型，对所述第二文本进行处理，得到处理结果。

6.根据权利要求5所述的方法，其特征在于，所述根据每个汉字特征值与所述多个预设特征值之间的大小关系以及所述多个预设特征值的顺序，查询所述每个汉字特征值对应的拼音字符，包括：
对于每个汉字特征值，进行如下查询处理：
确定所述多个预设特征值中位于中间位置的第一预设特征值；
响应于所述第一预设特征值与所述汉字特征值相同，将所述第一预设特征值对应的拼音字符，作为所述汉字特征值对应的拼音字符；
响应于所述第一预设特征值小于所述汉字特征值，根据所述多个预设特征值的顺序确定大于所述第一预设特征值的第二预设特征值，直至确定的预设特征值与所述汉字特征值相同，将所述确定的预设特征值对应的拼音字符作为所述汉字特征值对应的拼音字符；
响应于所述第一预设特征值大于所述汉字特征值，根据所述多个预设特征值的顺序确定小于所述第一预设特征值的第三预设特征值，直至确定的预设特征值与所述汉...

【专利技术属性】
技术研发人员：苗思奇，卢子填，胡荣杰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人