中文文本语法纠错方法及相关设备技术

技术编号:37396111 阅读:26 留言:0更新日期:2023-04-30 09:24
本发明专利技术公开了一种中文文本语法纠错方法及相关设备,该方法包括:获取待纠错的中文文本,以及通过量子长短时记忆网络QLSTM对所述待纠错的中文文本进行编码得到多个嵌入向量;通过Q

【技术实现步骤摘要】
中文文本语法纠错方法及相关设备


[0001]本专利技术属于量子计算
,特别是涉及一种中文文本语法纠错方法及相关设备。

技术介绍

[0002]中文文本语法纠错在输入法、搜索引擎、文本自动纠正系统、语音纠错等场景的应用非常多。由于人机交互界面的快速发展,系统需要处理大量人们随意输入的语句,因此包含着大量的错误,这些都需要依靠文本语法纠错系统进行更正,从而更好的识别用户的真实意图,同时人机交互对于纠错系统的性能也有着很高的要求。
[0003]量子计算机是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。量子计算机因其具有相对普通计算机更高效的处理数学问题的能力,故成为一种正在研究中的关键技术。量子计算机的发展也为提高人机交互过程中纠错系统的性能提供了一种新的解决方向。如何通过量子计算实现中文文本语法的纠错问题是一个需要解决的技术问题。

技术实现思路

[0004]本专利技术的目的是提供一种中文文本语法纠错方法及相关设备,旨在通过量子计算实现中文文本语法的纠错,提高人机交互过程中纠错系统的性能。...

【技术保护点】

【技术特征摘要】
1.一种中文文本语法纠错方法,其特征在于,所述方法包括:获取待纠错的中文文本,以及通过量子长短时记忆网络QLSTM对所述待纠错的中文文本进行编码得到多个嵌入向量;通过Q

Transformer模型分别对多个所述嵌入向量进行处理,得到多个最终表示向量;基于多个所述最终表示向量确定纠错后的中文文本。2.如权利要求1所述的方法,其特征在于,所述QLSTM和所述Q

Transformer模型均包括变分量子线路VQC,所述VQC包括数据编码层、变分层和量子测量层,其中:所述数据编码层用于将输入数据转化为目标量子态;所述变分层用于将所述目标量子态演化为多量子位纠缠态;所述量子测量层用于测量所述多量子位纠缠态对应的量子比特,得到输出数据。3.如权利要求2所述的方法,其特征在于,所述数据编码层包括H门和R
x
门,所述H门用于将初始态演化成叠加态,所述R
x
门用于将所述叠加态演化成输入数据对应的目标量子态;所述变分层包括R
z
门和CNOT门,所述R
z
门和CNOT门用于将所述目标量子态演化为多量子位纠缠态。4.如权利要求2或3所述的方法,其特征在于,所述通过QLSTM对所述待纠错的中文文本进行编码得到多个嵌入向量,包括:对所述待纠错的中文文本进行分词,得到原始关键词序列,所述原始关键词序列包括多个原始关键词;通过第一查找表查找得到每个所述原始关键词的词向量,通过第二查找表查找得到每个所述原始关键词在所述待纠错的中文文本中的位置的位置向量,以及通过QLSTM对每个所述原始关键词的拼音进行编码,得到拼音向量;基于所述词向量、所述位置向量和所述拼音向量确定每个所述原始关键词的嵌入向量,得到多个所述嵌入向量。5.如权利要求4所述的方法,其特征在于,所述QLSTM还包括遗忘门、记忆门和输出门;所述通过QLSTM对每个所述原始关键词的拼音进行编码,得到拼音向量,包括:通过第一个所述VQC对拼音数据进行转化,得到第一特征数据,所述拼音数据通过对每个所述原始关键词的拼音进行文本语义编码得到;通过所述遗忘门对所述第一特征数据进行遗忘,得到保留数据,以及通过第二个所述VQC对所述第一特征数据进行转化,得到第二特征数据;通过所述记忆门对所述第二特征数据进行记忆,得到记忆数据,以及通过第三个所述VQC对所述第二特征数据进行转化,得到第三特征数据;通过所述输出门对第一输出数据和所述第三特征数据进行处理,得到拼音向量,所述第一输出数据基于所述保留数据和所述记忆数据确定。6.如权利要求5所述的方法,其特征在于,所述记忆门包括所述VQC、输入层和第一tanh层;所述通过所述记忆门对所述第二特征数据进行记忆,得到记忆数据,包括:通过所述输入层确定所述第二特征数据中待更新数据,以及通过所述VQC对所述第二特征数据进行转化,得到第四特征数据;通过所述第一tanh层创建所述第四特征数据的添加数据;基于所述待更新数据和所述添加数据得到记忆数据。
7.如权利要求5或6所述的方法,其特征在于,所述输出门包括输出层和第二tanh层,所述通过所述输出门对第一输出数据和所述第三特征数据进行处理,得到拼音向量,包括:通过所述输出层对所述第三特征数据进行筛选,得到第二输出数据;通过所述第二tanh层对所述第一输出数据处理得到第三输出数据;基于所述第二输出数据和所述第三输出数据,得到拼音向量。8.如权利要求2或3所述的方法,其特征在于,所述Q

Transformer模型...

【专利技术属性】
技术研发人员:窦猛汉孔小飞方圆李蕾
申请(专利权)人:合肥本源量子计算科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1