一种英文案例训练方法、装置、设备及可读存储介质制造方法及图纸

技术编号：34133522 阅读：23 留言：0更新日期：2022-07-14 16:02

本发明专利技术提供了一种英文案例训练方法、装置、设备及可读存储介质，涉及自然语言处理技术领域，包括获取目标案例文本语句中至少两个英文字符和所述字符之间的组合关系,每个所述字符均对应有第一向量集合;基于所述字符之间的组合关系和每个所述字符对应的所述第一向量集合,得到训练案例，将所有的所述训练案例进行集合,得到英文训练案例集合;对所述英文训练案例集合中的每个所述训练案例进行测试,得到每个所述训练案例对应的案例训练结果。有益效果：解决了传统的英文文本表示方法表示的特征项之间相互独立，数据稀疏，导致了计算量大的技术问题，并且测试准确率大于预设准确率时，进一步提高了英文案例训练的准确率。进一步提高了英文案例训练的准确率。进一步提高了英文案例训练的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种英文案例训练方法、装置、设备及可读存储介质

[0001]本专利技术涉及自然语言处理
，具体而言，涉及英文案例训练方法、装置、设备及可读存储介质。

技术介绍

[0002]在计算机自然语言处理领域，语言模型的训练需要依赖极大量的语料数据，局限性较大。
[0003]现有技术中一般采用将语音转换成文本，再将采用算法将文本信息与翻译库中的语句进行相似性匹配，将相似度最高的结果作为输出。采用信息检索技术对大规模翻译记忆库构建索引，采用粗选和精选策略，即首先从索引库中根据输入的待译句子得到匹配的子集，然后利用句子语义向量相似度和编辑距离线性组合的模糊匹配方法得到最终的翻译输出，最后将人工后编辑后的译文及其源语言句段返回翻译记忆库增量式更新。这样效率并不高，也影响了交流效率。

技术实现思路

[0004]本专利技术的目的在于提供一种英文案例训练方法、装置、设备及可读存储介质，以改善上述问题。为了实现上述目的，本专利技术采取的技术方案如下：第一方面，本申请提供了一种英文案例训练方法，包括：获取目标案例文本语句中至少两个英文字符和所述字符之间的组合关系,每个所述字符均对应有第一向量集合,所述第一向量集合中包括至少一个字符;基于所述字符之间的组合关系和每个所述字符对应的所述第一向量集合,得到训练案例，将所有的所述训练案例进行集合,得到英文训练案例集合;对所述英文训练案例集合中的每个所述训练案例进行测试,得到每个所述训练案例对应的案例训练结果。
[0005]优选地，所述基于所述字符之间的组合关系和每个...

【技术保护点】

【技术特征摘要】
1.一种英文案例训练方法，其特征在于，包括：获取目标案例文本语句中至少两个英文字符和所述字符之间的组合关系,每个所述字符均对应有第一向量集合,所述第一向量集合中包括至少一个字符;基于所述字符之间的组合关系和每个所述字符对应的所述第一向量集合,得到训练案例，将所有的所述训练案例进行集合,得到英文训练案例集合;对所述英文训练案例集合中的每个所述训练案例进行测试,得到每个所述训练案例对应的案例训练结果。2.根据权利要求1所述的英文案例训练方法，其特征在于，所述基于所述字符之间的组合关系和每个所述字符对应的所述第一向量集合,得到训练案例，包括：分析所述字符之间的组合关系，若所述字符之间的组合关系为且的关系，则在每个所述第一向量集合里各取一个所述字符，将取出来的所有所述字符与其对应的所述字符进行集合得到所述训练案例；分析所述字符之间的组合关系，若所述字符之间的组合关系为或的关系，则在每个所述字符所对应的所述第一向量集合中均加入一个代表空值的字符；将加入所述代表空值的字符后的所述第一向量集合定义为第二向量集合；在每个所述第二向量集合里各取一个字符，将取出来的所有数值与其对应的所述字符进行集合得到所述训练案例。3.根据权利要求1所述的英文案例训练方法，其特征在于，所述将所有的所述训练案例进行集合,得到英文训练案例集合，之后包括：获取第一信息，所述第一信息包括英文训练案例集合中的英文语音信息；将所述第一信息转换为数字语音信号，检测到与所述数值语音信号相对应的匹配参数；根据所述匹配参数识别到相对应的图像信息，对图像信息进行顺序标注，并将标注好的所述图像信息输入至卷积神经网络中进行训练；根据时序分类算法，对所述卷积神经网络中的所述图像信息进行更新；基于遗传算法，将更新后的所述图像信息重新配置得到可编程器件的重配置数据流；根据所述重配置数据流，找到与所述重配置数据流相匹配的所述训练案例。4.根据权利要求1所述的英文案例训练方法，其特征在于，所述对所述英文训练案例集合中的每个所述训练案例进行测试，之后包括：获取第二信息，所述第二信息包括每个所述训练案例进行测试的结果；对所述测试的结果进行预处理后，得到英文训练文本；将所述英文训练文本输入至word2vec模型中；转换所述word2vec模型中的所述英文训练文本为向量集合；将所述向量集合和英文训练文本输入至卷积神经网络中训练，得到训练结果；根据训练结果和预置代价函数计算得出损失函数值；判断所述损失函数值是否低于预置阈值；若是，则保存损失函数的参数，并生成训练后的英文文本模型；若否，则继续进行计算。5.一种英文案例训练装置，其特征在于，包括：获取模块：用于获取目标案例文本语句中至少两个英文字符和所述字符之间的组合关
系,每个所述字符均对应有第一向量集合,所述第一向量集合中包括至少一个字符;集合模块：用于基于所述字符之间的组合关系和...

【专利技术属性】
技术研发人员：李银波，
申请(专利权)人：湖南城市学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人