基于人工智能的循环神经网络的文本纠错方法及装置制造方法及图纸

技术编号:16587390 阅读:70 留言:0更新日期:2017-11-18 14:57
本发明专利技术提出一种基于人工智能的循环神经网络的文本纠错方法及装置,其中,该方法包括:获取待纠错文本数据;利用训练的循环神经网络模型,对待纠错文本数据进行纠错处理,生成纠错后的文本数据。由此,通过采用循环神经网络模型,结合上下文的句法信息,对存在错误的文本数据进行纠错处理,提高了纠错的准确性,更好的满足了用户的需求,改善了用户体验。

Text correction method and device for recurrent neural network based on Artificial Intelligence

The invention provides a device and method of correcting the text, recurrent neural network based on artificial intelligence, the method includes: obtaining the text data to be corrected; using recurrent neural network model training, error correction is performed to text data, text data is generated after error correction. Therefore, by using the recurrent neural network model and combining the syntactic information of context, error correcting text data is processed, which improves the accuracy of error correction, meets the needs of users better, and improves the user experience.

【技术实现步骤摘要】
基于人工智能的循环神经网络的文本纠错方法及装置
本专利技术涉及计算机
,尤其涉及一种基于人工智能的循环神经网络的文本纠错方法及装置。
技术介绍
人工智能(ArtificialIntelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。随着互联网技术的普及和人工智能化的发展,人类生活越来越依赖于搜索引擎、语音识别、语义理解等技术。而这些技术应用中,文本错误识别和纠错任务也变得及其重要。现有的文本自动纠错方法,大多采用机器学习的方法,将自动纠错任务当成噪声信道模型,利用分类的思想完成纠错任务,或者利用传统的统计机器翻译方式,处理待纠错文本以达到纠错的目的。上述方法,纠错任务的完成依靠特征的设计,是以数据驱动的,模型面临着对数据规范性要求高、数据稀疏和模型通用性差,无法大规模使用等问题,且由于缺少上下文的句法信息,使得纠错的准确性差,无法达本文档来自技高网...
基于人工智能的循环神经网络的文本纠错方法及装置

【技术保护点】
一种基于人工智能的循环神经网络的文本纠错方法,其特征在于,包括:获取待纠错文本数据;利用训练的循环神经网络模型,对所述待纠错文本数据进行纠错处理,生成纠错后的文本数据。

【技术特征摘要】
1.一种基于人工智能的循环神经网络的文本纠错方法,其特征在于,包括:获取待纠错文本数据;利用训练的循环神经网络模型,对所述待纠错文本数据进行纠错处理,生成纠错后的文本数据。2.如权利要求1所述的方法,其特征在于,所述对所述待纠错文本数据进行纠错处理之前,还包括:获取待训练的文本对语料,所述文本对包括错误文本及与所述错误文本对应的准确文本;利用所述文本对语料对预设的循环神经网络模型进行训练,确定所述训练的循环神经网络模型。3.如权利要求2所述的方法,其特征在于,所述利用所述文本对语料对预设的循环神经网络模型进行训练,包括:利用所述文本对语料,对长短时记忆循环神经网络模型进行训练;或者,利用所述文本对语料,对双向循环神经网络模型进行训练。4.如权利要求2或3所述的方法,其特征在于,所述获取待训练的文本对语料,包括:对用户在预设时间内连续输入的两次语音进行识别,生成第一文本对;或者,根据所述用户在预设时间内连续输入的两次文本检索语句,确定第二文本对。5.如权利要求1-3任一所述的方法,其特征在于,所述获取待纠错文本数据,包括:确定用户输入的文本数据对应的语言模型得分,小于预设的值;和/或,利用预设的分类模型,确定所述用户输入的文本数据为待纠错文本数据。6.一种基于人工智能的循环神经网络的文本纠错装置,其特征在于,包括:第一获取模块,用于获取待纠错文本数据;处理模块,用于利用训练的循环神经网络模型,对所述待纠错文本数...

【专利技术属性】
技术研发人员:杨春杰姚树杰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1