文本处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：32826076 阅读：14 留言：0更新日期：2022-03-26 20:28

本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质，涉及自然语言处理领域。该方法包括：获取待校正的第一文本数据；将第一文本数据输入至目标处理器，得到第一文本数据的处理结果；其中，目标处理器对第一文本数据进行动词识别，得到待校正动词，并对所识别的待校正动词进行时态校正，得到待校正动词对应的目标动词；处理结果中包括该目标动词。本申请实施例基于目标处理器对第一文本数据中的动词进行时态校正，使得处理后的第一文本数据更加符合语法规范。的第一文本数据更加符合语法规范。的第一文本数据更加符合语法规范。

全部详细技术资料下载

【技术实现步骤摘要】
文本处理方法、装置、电子设备及计算机可读存储介质

[0001]本申请涉及自然语言处理
，具体而言，本申请涉及一种文本处理方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]机器翻译，又称为自动翻译，是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支，是人工智能的终极目标之一，具有重要的科学研究价值。
[0003]通常，机器翻译的方法主要包括基于统计的方法和基于人工神经网络的方法；其中，基于人工神经网络的机器翻译在译文流畅度方面有一定提升。但是目前机器翻译的输出都会存在一定的语法错误导致翻译的准确率较低；比如，当目标语言为英文时，其中动词的时态容易发生错误。

技术实现思路

[0004]本申请实施例提供了一种文本处理方法、装置、电子设备及计算机可读存储介质，可以解决机器翻译的准确率较低的问题。所述技术方案如下：
[0005]根据本申请实施例的一个方面，提供了一种文本处理方法，该方法包括：
[0006]获取待校正的第一文本数据；
[0007]将第一文本数据输入至目标处理器，得到第一文本数据的处理结果；其中，目标处理器对第一文本数据进行动词识别，得到待校正动词，并对所识别的待校正动词进行时态校正，得到待校正动词对应的目标动词；处理结果中包括目标动词。
[0008]可选的，上述对所识别的待校正动词进行时态校正，得到待校正动词对应的目标动词，包括：
[0009]根据预设的时态词典，确定待校正动词的...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法，其特征在于，包括获取待校正的第一文本数据；将所述第一文本数据输入至目标处理器，得到所述第一文本数据的处理结果；其中，所述目标处理器对所述第一文本数据进行动词识别，得到待校正动词，并对所识别的待校正动词进行时态校正，得到所述待校正动词对应的目标动词；所述处理结果中包括所述目标动词。2.根据权利要求1所述的方法，其特征在于，所述对所识别的待校正动词进行时态校正，得到所述待校正动词对应的目标动词，包括：根据预设的时态词典，确定所述待校正动词的每个备选时态；以及对所述第一文本数据中的所述待校正动词进行掩码处理，得到掩码文本；其中，所述掩码文本包括所述待校正动词的上下文信息；将所述掩码文本输入至预设预测模型，预测得到每个所述备选时态的预测概率；根据所述预测概率，确定所述备选时态中的目标时态以及所述待校正动词在所述目标时态下的目标动词。3.根据权利要求2所述的方法，其特征在于，所述将所述掩码文本输入至预设预测模型，预测得到每个所述备选时态的预测概率，包括：将所述掩码文本进行词嵌入处理，生成所述掩码文本对应的词向量；基于所述预测模型对所述词向量进行预测，得到每个所述备选时态的预测概率。4.根据权利要求2所述的方法，其特征在于，所述获取待校正的第一文本数据，包括：将待翻译的原始文本数据输入翻译器，获取翻译器输出的第一文本数据。5.根据权利要求4所述的方法，其特征在于，所述确定所述备选时态中的目标时态，包括：从所述预测概率中，获取所述待校正动词对应的备选时态的预测概率，作为第一概率；获取所述预测概率最大的备选时态作为校正时态，并将最大的所述预测概率作为第二概率；基于所述第一概率和所述第二概...

【专利技术属性】
技术研发人员：礼慧，孙健，郭萌，陈海燕，
申请(专利权)人：文思海辉智科科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人