一种基于CNN与BERT模型的英文语法纠错方法技术

技术编号：25186203 阅读：11 留言：0更新日期：2020-08-07 21:13

英文语法纠错是自然语言处理领域中的一个重要研究方向。传统的语法纠错系统多基于规则判断，能够检测出的错误种类有限，扩展能力差。现有的基于循环神经网络的语法纠错系统在面对长句子时，容易丢失头尾的信息，且由于无法并行提取特征，致使训练周期长。本发明专利技术提供了一种基于CNN与BERT模型的英文语法纠错方法。模型采用了CNN+Attention+BERT结构，实现方式采用了Encoder‑Decoder框架。通过卷积，能够高效并准确地提取上下文的特征；Attention层为不同的单词增加的权重，使得模型可以学到更重要的特征；BERT采用了Masked Language Model的方式来训练语言模型，通过fine‑tuning可以为其添加（0,1）分类任务，用于为纠错系统输出的句子评分，提高系统准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN与BERT模型的英文语法纠错方法
本专利技术是自然语言处理领域中的一项任务，主要是一种基于CNN（ConvolutionalNeuralNetworks，卷积神经网络）与BERT（BidirectionalEncoderRepresentationsfromTransformers）模型的英文语法纠错方法。
技术介绍
对于国内英语学习者来说，语法往往是他们在英语学习中的难点，由于教学资源有限，学习者们遇到的语法问题往往不能及时得到正确的修改意见与范例。如果能有一种语法纠错系统，使得学习者们在学习和使用英语的过程中出现的语法错误能够被及时地指出，并给出相应的反馈建议，则可以极大地降低学习者们学习的难度，并显著地提高他们的英语水平。传统的英文纠错系统大多是单纯基于统计机器翻译原理或是基于某种语法规则而实现的纠错系统，准确度不高，训练模型效率低，能够查出的语法错误类型也有限。针对这些问题，本文提出了一种基于CNN与BERT模型的英文语法纠错方法。利用CNN+Attention（注意力机制）有效地提取句子特征；同时通过对BERT模型进行fine-tuning（参数微调），训练新的语言模型，为神经网络的输出结果评分，选出最佳的纠错结果。
技术实现思路
本专利技术提出一种基于CNN与BERT模型的英文语法纠错方法，将语法纠错视为一种从错误的“坏英语”到对应正确的“好英语”的翻译类任务，使用Encoder–Decoder（编码-解码）框架。模型采用了CNN+Attention+BERT结构。通过大...

【技术保护点】
1.一种基于CNN与BERT模型的英文语法纠错方法，利用基于Encoder-Decoder框架的CNN + Attention模型对英文句子进行纠错。/n

【技术特征摘要】
1.一种基于CNN与BERT模型的英文语法纠错方法，利用基于Encoder-Decoder框架的CNN+Attention模型...

【专利技术属性】
技术研发人员：马士成，贾艳明，
申请(专利权)人：北京博智天下信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人