一种基于机器学习的英语翻译系统技术方案

技术编号:36883945 阅读:14 留言:0更新日期:2023-03-15 21:23
本发明专利技术涉及翻译领域,公开了一种基于机器学习的英语翻译系统,包括:数据库,用于存储翻译集,翻译集包括英语

【技术实现步骤摘要】
一种基于机器学习的英语翻译系统


[0001]本专利技术涉及翻译领域,更具体地说,它涉及一种基于机器学习的英语翻译系统。

技术介绍

[0002]机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
[0003]同时,机器翻译又具有重要的实用价值。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。
[0004]现在的机器翻译系统种类多样,其中英译汉的系统有很多,但是翻译的语言较为生硬,无法根据使用者的常用语音习惯和发言等进行翻译,不能满足现在的翻译实用要求。

技术实现思路

[0005]本专利技术提供一种基于机器学习的英语翻译系统,包括:
[0006]数据库,用于存储翻译集,翻译集包括英语

标准语言

常用语言的映射集;
[0007]语音接收模块,用于接收待使用者的语音,并对语音进行降噪除杂处理;
[0008]翻译模块,用于互译英语和标准语言;
[0009]选择模块,用于在数据库中选择与标准中文语言对应的常用语言;
[0010]输出模块,用于将常用语言输出;
[0011]学习模块,接收使用者的语言,并学习使用者的常用语言习惯并与标准语言建立对应关系,存入数据库。
[0012]进一步地:翻译模块的将中文翻译为英文的方法包括如下步骤:
[0013]S1:获取语音数据信息,并对数据进行分割,得到的分割之后的数据信息表;
[0014]S2:获取输入的数据信息表,根据关键字在数据库中检索出对应的数据集;
[0015]S3:提取数据集中的对应数据,并按照规则进行组合,得出标准中文语句;
[0016]S4:对得出的标准中文语句进行选择,选择出概率最高的标准中文语句;
[0017]S5:将得到的标准中文语句输出到选择模块中。
[0018]进一步地:在步骤S1中,获取语音数据之后,将语音数据转换为文字信息,然后对文字信息进行分割,对文字信息进行分词的步骤如下:
[0019]S11:对文字信息的语式进行分析,得到文字信息的语式分析结果,该语式分析结果至少包括一种预存的标准语式;
[0020]S12:根据分析得到的语式,对该文字信息进行分字和/或词,每种语式得到一组字和/或词;
[0021]S13:将每组字和/或词编为一条字词信息表。
[0022]进一步地:在步骤S2中,对每条字词信息先提取关键字,按照关键字在数据库中检索对应的数据集,其中,对字词表赋予权重,关键字在字词信息表中出现的频率越高,其对
应的权重就越高。
[0023]进一步地:在步骤S2中,数据集由英文和中文相对应的字和词组成。
[0024]进一步地:学习模块包括选择单元和学习单元,选择单元用于选择使用者的语音习惯所属地,然后从总服务器中将该所属地的语料库下载到数据库中,该语料库中包括英语

标准语言

常用语言的映射集合;
[0025]学习单元用于学习使用者的常用语言习惯并与标准语言建立对应关系,并存入和更新数据库。
[0026]进一步地:学习单元的学习方法包括如下步骤:
[0027]S101:接收使用者输入的语言数据,分析并处理该条语言数据,在数据库中检索是否存在相同数据,若存在,则执行S102,若不存在,则执行S104;
[0028]S102:将数据库中含有该条语言数据的数据集提取出来,选择并提取出该数据集中对应的标准语言数据;
[0029]S103:将该标准语言数据输入到翻译模块中;
[0030]S104:按照所属地的语言准则,对该条语言数据进行分词,得到分析结果,该分析结果包括若干按照所属地的语言准则的分词数据表;
[0031]S104:根据的到的分词数据表,找出对应的标准中文分词,并按照所属地的语言准则与标准中文语言准则的对应关系,将标准中文分词重新组句;
[0032]S105:选择出概率最大的标准中文语句,并将该条语言数据与该条标准中文语句建立对应关系,存入数据库;
[0033]S106:将该条标准中语句数据输入到翻译模块中。
[0034]进一步地:在步骤S101中,通过关键字检索的方式,在数据库中检索数据。
[0035]进一步地:在步骤S105中,根据使用者输入的语言数据的语义和语调选择出概率最大的标准中文语句。
[0036]进一步地:输出模块包括语音播放模块,语音播放模块用于播放翻译之后的语音。
[0037]本专利技术的有益效果在于:本专利技术提出的一种基于机器学习的英语翻译系统,能够实现对根据使用者的语音习惯进行学习,使得翻译的语言,语义准确,表达生动。
附图说明
[0038]图1是本专利技术提出的一种基于机器学习的英语翻译系统的组成框图;
[0039]图2是本专利技术提出的一种基于机器学习的英语翻译系统中翻译模块将中文翻译为英文的方法的流程示意图;
[0040]图3是本专利技术提出的一种基于机器学习的英语翻译系统中学习单元的学习方法流程示意图。
具体实施方式
[0041]现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其他例子
中也可以进行组合。
[0042]实施例1
[0043]参考附图1,在本实施例中提出了一种基于机器学习的英语翻译系统,包括:
[0044]数据库,用于存储翻译集,翻译集包括英语

标准语言

常用语言的映射集;
[0045]语音接收模块,用于接收待使用者的语音,并对语音进行降噪除杂处理;
[0046]翻译模块,用于互译英语和标准语言;
[0047]选择模块,用于在数据库中选择与标准中文语言对应的常用语言;
[0048]输出模块,用于将常用语言输出;
[0049]学习模块,接收使用者的语言,并学习使用者的常用语言习惯并与标准语言建立对应关系,存入数据库。
[0050]实施例2
[0051]参考附图2,在本实施例中,翻译模块将中文翻译为英文的方法,包括如下步骤:
[0052]S1:获取语音数据信息,并对数据进行分割,得到的分割之后的数据信息表;
[0053]S2:获取输入的数据信息表,根据关键字在数据库中检索出对应的数据集;
[0054]S3:提取数据集中的对应数据,并按照规则进行组合,得出标准中文语句;
[0055]S本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的英语翻译系统,其特征在于,包括:数据库,用于存储翻译集,翻译集包括英语

标准语言

常用语言的映射集;语音接收模块,用于接收待使用者的语音,并对语音进行降噪除杂处理;翻译模块,用于互译英语和标准语言;选择模块,用于在数据库中选择与标准中文语言对应的常用语言;输出模块,用于将常用语言输出;学习模块,接收使用者的语言,并学习使用者的常用语言习惯并与标准语言建立对应关系,存入数据库。2.根据权利要求1所述的一种基于机器学习的英语翻译系统,其特征在于,翻译模块的将中文翻译为英文的方法包括如下步骤:S1:获取语音数据信息,并对数据进行分割,得到的分割之后的数据信息表;S2:获取输入的数据信息表,根据关键字在数据库中检索出对应的数据集;S3:提取数据集中的对应数据,并按照规则进行组合,得出标准中文语句;S4:对得出的标准中文语句进行选择,选择出概率最高的标准中文语句;S5:将得到的标准中文语句输出到选择模块中。3.根据权利要求2所述的一种基于机器学习的英语翻译系统,其特征在于,在步骤S1中,获取语音数据之后,将语音数据转换为文字信息,然后对文字信息进行分割,对文字信息进行分词的步骤如下:S11:对文字信息的语式进行分析,得到文字信息的语式分析结果,该语式分析结果至少包括一种预存的标准语式;S12:根据分析得到的语式,对该文字信息进行分字和/或词,每种语式得到一组字和/或词;S13:将每组字和/或词编为一条字词信息表。4.根据权利要求3所述的一种基于机器学习的英语翻译系统,其特征在于,在步骤S2中,对每条字词信息先提取关键字,按照关键字在数据库中检索对应的数据集,其中,对字词表赋予权重,关键字在字词信息表中出现的频率越高,其对应的权重就越高。5.根据权利要求4所述的一种基于机器学习的英语翻译系统,其特征在于,在步骤S2中,数据集由英文和...

【专利技术属性】
技术研发人员:张芳舟
申请(专利权)人:吉林农业科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1