基于自然语言处理的文本自动校对系统及方法技术方案

技术编号:40326661 阅读:17 留言:0更新日期:2024-02-09 14:20
本申请涉及自然语言处理技术领域,其具体地公开了一种基于自然语言处理的文本自动校对系统及方法,其首先建立语料库,基于深度学习技术,分别利用上下文编码器和双向长短期记忆神经网络模型对待校正文本进行不同粒度的特征提取分析,并基于多粒度融合特征和语料特征之间的转移特征来表示两者的特征差异,以此来得到错误字词以及错误字词的位置下标。这样,能够更准确地检测和纠正文本中的错误,并且减少了人工干预,提高了检测效率。

【技术实现步骤摘要】

本申请涉及自然语言处理,且更为具体地,涉及一种基于自然语言处理的文本自动校对系统及方法


技术介绍

1、随着计算机技术的发展,自然语言处理技术得到了广泛的应用。由数据处理、信息处理发展到知识处理,对语言文字处理要求的深度和广度越来越高。在文本处理中,自然语言处理技术可以帮助人们快速、准确地处理大量的文本信息。

2、文本自动校对是自然语言处理中的一个重要任务,它可以检测文本中的错误并对其进行纠正。现有的文本自动校对系统主要依赖于规则和词典来进行校对,由于中文表达的复杂多样,基于语义规则和统计语言模型等文本校正方法的校正率并不高,无法完全准确地检测和纠正所有类型的错误。此外,这些系统通常需要大量的人工干预来进行校对,这大大增加了工作量并降低了效率。

3、因此,期待一种基于自然语言处理的文本自动校对系统及方法,能够提高纠错率。


技术实现思路

1、为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于自然语言处理的文本自动校对系统及方法,其首先建立语料库,基于深度学习技术,分别利用上本文档来自技高网...

【技术保护点】

1.一种基于自然语言处理的文本自动校对系统,其特征在于,包括:

2.根据权利要求1所述的基于自然语言处理的文本自动校对系统,其特征在于,所述嵌入编码模块,包括:

3.根据权利要求2所述的基于自然语言处理的文本自动校对系统,其特征在于,所述词粒度上下文语义理解模块,包括:

4.根据权利要求3所述的基于自然语言处理的文本自动校对系统,其特征在于,所述融合模块,用于:以如下融合公式来融合所述词粒度上下文语义特征向量和所述段粒度上下文语义特征向量以获得所述多粒度融合特征向量,其中,所述融合公式为:

5.根据权利要求4所述的基于自然语言处理的文本自动...

【技术特征摘要】

1.一种基于自然语言处理的文本自动校对系统,其特征在于,包括:

2.根据权利要求1所述的基于自然语言处理的文本自动校对系统,其特征在于,所述嵌入编码模块,包括:

3.根据权利要求2所述的基于自然语言处理的文本自动校对系统,其特征在于,所述词粒度上下文语义理解模块,包括:

4.根据权利要求3所述的基于自然语言处理的文本自动校对系统,其特征在于,所述融合模块,用于:以如下融合公式来融合所述词粒度上下文语义特征向量和所述段粒度上下文语义特征向量以获得所述多粒度融合特征向量,其中,所述融合公式为:

5.根据权利要求4所述的基于自然语言处理的文本自动校对系统,其特征在于,所述转移计算模块,用于:以如下转移公式计算所述多粒度融合特征向量与所述语料特征向量之间的转移矩阵;

6.根据权利要求5所述的基于自然语言处理的文本自动校对系统,其特征在于,所述优化模块,...

【专利技术属性】
技术研发人员:孙向东乔允鑫
申请(专利权)人:屯昌蝉独智能科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1