当前位置: 首页 > 专利查询>深圳大学专利>正文

大句库翻译方法技术

技术编号:15639295 阅读:71 留言:0更新日期:2017-06-15 22:38
本发明专利技术公开了一种大句库翻译方法,要解决的技术问题是提高机器翻译语言时的准确率。本发明专利技术的方法包括以下步骤:设置源语言大句库模块、目标语言大句库模块、多义句库模块、同义句库模块,输入需要翻译的句子,从源语言大句库模块中找出与输入句子相同的源语句句子,在多义句库模块和同义句库模块中找出多义句和同义句,选出语义最接近的句子,目标语言大句库模块找到目标语言中的相应句子。本发明专利技术与现有技术相比,以句库替代词库,采用了完整句子对应完整句子的翻译方法,避免了将源语言句子拆分为单词,翻译单词,再由目标语言单词组成句子的过程中,带来的各种语法错误,并采用了多义句和同义句的处理方法,明显提高了翻译的准确度。

【技术实现步骤摘要】
大句库翻译方法
本专利技术涉及一种语言翻译的方法,特别是一种利用机器的语言翻译的方法。
技术介绍
语言的机器翻译最早出现于20世纪40年代,并伴随着计算机技术的进展不断完善。近十年来,一路发展而来的传统机器翻译系统和方法,有了持续的提高。主流的现有技术机器翻译,是先行分别建立源语言和目标语言的词库或字库。当翻译一个句子时,机器把输入的源语言的句子,拆分成主语、谓语、宾语、状语等成分,而后按照两个词库中词与词之间的对应关系,找出目标语言中相应的词,再将目标语言的词组成句子,得到翻译后的句子。由于不同的语言中,对名词的性、格、数,动词的时态、变位,形容词的性等研发处理有许多不同之处,所以在组建目标语言句子的过程中,难免出现语法错误,降低了翻译的准确性。
技术实现思路
本专利技术的目的是提供一种大句库翻译方法,要解决的技术问题是提高机器翻译语言时的准确率。本专利技术采用以下技术方案:一种大句库翻译方法,包括以下步骤:一、设置源语言大句库模块、目标语言大句库模块、多义句库模块、同义句库模块、搜索引擎模块、句子调出模块、翻译输出模块、语音输入输出模块、文字输入输出模块、显示模块和使用者选择模块;所述源语言大句库模块通过人工或电脑统计日常生活和工作中常用源语言短句在会话中出现的频率,从出现次数最高开始排列,将最先出现的表示一个句意的句子作为源语句,删除句意相似或相同的排列在后面的句子,存储进源语言大句库模块;再按源语句句意多重表达含义和相似与相同扩展源语句,分别形成多义句库和同义句库;所述目标语言大句库模块通过人工或电脑对源语言大句库、多义句库、同义句库中句子的一一对应翻译获得,建立目标语言大句库与源语言大句库、多义句库、同义句库中句子相互对应的编码关系后,存储在目标语言大句库模块;二、使用者选择源语言和目标语言,输入需要翻译的句子,发送到搜索引擎模块;三、搜索引擎模块从源语言大句库模块中找出与输入句子相同的源语句句子,发送至句子调出模块,句子调出模块根据源语句与多义句和同义句的对应关系,在多义句库模块和同义句库模块中找出与源语句句子对应关系的多义句和同义句,将源语句、多义句和同义句发送至显示模块显示;四、使用者从显示模块的源语句、多义句和多义句中,选出与自己想要表达的语义最接近的句子,发送至使用者选择模块,使用者选择模块将使用者选出的句子转换成目标语言大句库中对应的编码,发送至目标语言大句库模块;五、目标语言大句库模块根据编码找到目标语言中的相应句子,发送至翻译输出模块。本专利技术的步骤一,源语言大句库模块存储有不少于两万个句子。本专利技术的步骤一,多义句库模块中通过人工或电脑对构成源语句中的词进行分解、分析,对源语句中同一词具有多重表达含义构成的词进行归纳统计,用不同含义的词代替源语句,获得相应的多义句,建立源语句与多义句的对应关系,存储进多义句库模块。本专利技术的步骤一,同义句库模块中通过人工或电脑对构成源语句中的词进行分解、分析,对源语句中词的同义词进行归纳统计,用不同的词代替源语句,获得相应的同义句,建立源语句与同义句的对应关系,存储进同义句库模块。本专利技术的步骤二,输入需要翻译的句子,采用语音或文字输入需要翻译的句子;采用语音输入时,语音输入输出模块对使用者发出的语音句子进行语音识别,得到需要翻译的句子的文字,发送到搜索引擎模块;采用文字输入时,文字输入输出模块将使用者输入的句子发送到搜索引擎模块。本专利技术的步骤三,搜索引擎模块从源语言大句库模块中没有找出与输入句子相同的源语句句子,句子调出模块在多义句库模块和同义句库模块中找出与输入句子相同的多义句和同义句,根据多义句和同义句与源语句的对应关系,找出源语句句子,将源语句、多义句和同义句发送至显示模块显示。本专利技术的步骤五,翻译输出模块将翻译后的句子发送至文字输入输出模块,驱动显示模块显示。本专利技术的步骤五,显示模块设有源语言区域和目标语言区域,源语言区域和目标语言区域与语音输入输出模块连接。本专利技术的步骤一,源语言大句库模块、目标语言大句库模块、多义句库模块、同义句库模块、搜索引擎模块、句子调出模块和翻译输出模块设置在服务器上,语音输入输出模块、文字输入输出模块、显示模块和使用者选择模块设置在智能终端上,建立智能终端与服务器经网络联网。本专利技术的智能终端为智能手机、上网本或个人电脑,网络为因特网。本专利技术与现有技术相比,以句库替代词库,采用了完整句子对应完整句子的翻译方法,避免了将源语言句子拆分为单词,翻译单词,再由目标语言单词组成句子的过程中,带来的各种语法错误,并采用了多义句和同义句的处理方法,明显提高了翻译的准确度,利用互联网,方便使用者。附图说明图1是本专利技术的方法采用的系统结构示意图。图2是本专利技术的方法流程图。图3是本专利技术实施例1的操作流程图。图4是本专利技术实施例2的操作流程图。图5是本专利技术实施例3的操作流程图。具体实施方式下面结合附图和实施例对本专利技术作进一步详细说明。如图1所示,本专利技术的大句库翻译方法,建立n个智能终端与服务器经网络联接的系统,智能终端为智能手机、上网本或个人电脑,n为使用本专利技术方法的智能终端的数量,网络为因特网。本专利技术的大句库翻译方法,也可以应用在单台翻译的机器上。如图2所示,本专利技术的大句库翻译方法,包括以下步骤:一、在服务器上设置源语言大句库模块、目标语言大句库模块、多义句库模块、同义句库模块、搜索引擎模块、句子调出模块和翻译输出模块。在智能终端上设置语音输入输出模块、文字输入输出模块、显示模块和使用者选择模块,建立智能终端与服务器经因特网联网。源语言大句库模块存储有不少于两万个句子,每个句子都表示一个完整的意思。通过人工或电脑统计日常生活和工作中常用源语言短句在会话中出现的频率,从出现次数最高开始排列,将最先出现的表示一个句意的句子作为源语句,删除句意相似或相同的排列在后面的句子,然后将排列的不少于两万个句子存储进源语言大句库模块。再按源语句句意多重表达含义和相似与相同扩展源语句,形成多义句库和同义句库。多义句库模块中存储的每个句子都表示一个完整的意思,多义句库根据源语言大句库中的源语句按多重意思表达进行扩展,得到多义句库的句子。通过人工或电脑对构成源语句中的词进行分解、分析,对源语句中同一词具有多重表达含义构成的词进行归纳统计,用不同含义的词代替源语句,获得相应的多义句,建立源语句与多义句的对应关系,存储进多义句库模块。同义句库模块中存储的每个句子都表示一个完整的意思,同义句库根据源语言大句库模块中的源语句按相同意思进行扩展获得同义句库的句子。通过人工或电脑对构成源语句中的词进行分解、分析,对源语句中词的同义词进行归纳统计,用不同的词代替源语句,获得相应的同义句,建立源语句与同义句的对应关系,存储进同义句库模块。目标语言大句库模块中存储的每个句子都表示一个完整的意思,通过人工或电脑对源语言大句库、多义句库、同义句库中句子的一一对应翻译获得,建立目标语言大句库与源语言大句库、多义句库、同义句库中句子相互对应的编码关系后,存储在目标语言大句库模块。二、使用者选择源语言和目标语言,采用语音或文字输入需要翻译的句子。采用语音输入时,语音输入输出模块按现有技术对使用者发出的语音句子进行语音识别,得到需要翻译的句子的文字,发送到搜索引擎模块。采用文字输入时,本文档来自技高网...
大句库翻译方法

【技术保护点】
一种大句库翻译方法,包括以下步骤:一、设置源语言大句库模块、目标语言大句库模块、多义句库模块、同义句库模块、搜索引擎模块、句子调出模块、翻译输出模块、语音输入输出模块、文字输入输出模块、显示模块和使用者选择模块;所述源语言大句库模块通过人工或电脑统计日常生活和工作中常用源语言短句在会话中出现的频率,从出现次数最高开始排列,将最先出现的表示一个句意的句子作为源语句,删除句意相似或相同的排列在后面的句子,存储进源语言大句库模块;再按源语句句意多重表达含义和相似与相同扩展源语句,分别形成多义句库和同义句库;所述目标语言大句库模块通过人工或电脑对源语言大句库、多义句库、同义句库中句子的一一对应翻译获得,建立目标语言大句库与源语言大句库、多义句库、同义句库中句子相互对应的编码关系后,存储在目标语言大句库模块;二、使用者选择源语言和目标语言,输入需要翻译的句子,发送到搜索引擎模块;三、搜索引擎模块从源语言大句库模块中找出与输入句子相同的源语句句子,发送至句子调出模块,句子调出模块根据源语句与多义句和同义句的对应关系,在多义句库模块和同义句库模块中找出与源语句句子对应关系的多义句和同义句,将源语句、多义句和同义句发送至显示模块显示;四、使用者从显示模块的源语句、多义句和多义句中,选出与自己想要表达的语义最接近的句子,发送至使用者选择模块,使用者选择模块将使用者选出的句子转换成目标语言大句库中对应的编码,发送至目标语言大句库模块;五、目标语言大句库模块根据编码找到目标语言中的相应句子,发送至翻译输出模块。...

【技术特征摘要】
1.一种大句库翻译方法,包括以下步骤:一、设置源语言大句库模块、目标语言大句库模块、多义句库模块、同义句库模块、搜索引擎模块、句子调出模块、翻译输出模块、语音输入输出模块、文字输入输出模块、显示模块和使用者选择模块;所述源语言大句库模块通过人工或电脑统计日常生活和工作中常用源语言短句在会话中出现的频率,从出现次数最高开始排列,将最先出现的表示一个句意的句子作为源语句,删除句意相似或相同的排列在后面的句子,存储进源语言大句库模块;再按源语句句意多重表达含义和相似与相同扩展源语句,分别形成多义句库和同义句库;所述目标语言大句库模块通过人工或电脑对源语言大句库、多义句库、同义句库中句子的一一对应翻译获得,建立目标语言大句库与源语言大句库、多义句库、同义句库中句子相互对应的编码关系后,存储在目标语言大句库模块;二、使用者选择源语言和目标语言,输入需要翻译的句子,发送到搜索引擎模块;三、搜索引擎模块从源语言大句库模块中找出与输入句子相同的源语句句子,发送至句子调出模块,句子调出模块根据源语句与多义句和同义句的对应关系,在多义句库模块和同义句库模块中找出与源语句句子对应关系的多义句和同义句,将源语句、多义句和同义句发送至显示模块显示;四、使用者从显示模块的源语句、多义句和多义句中,选出与自己想要表达的语义最接近的句子,发送至使用者选择模块,使用者选择模块将使用者选出的句子转换成目标语言大句库中对应的编码,发送至目标语言大句库模块;五、目标语言大句库模块根据编码找到目标语言中的相应句子,发送至翻译输出模块。2.根据权利要求1所述的大句库翻译方法,其特征在于:所述步骤一,源语言大句库模块存储有不少于两万个句子。3.根据权利要求1所述的大句库翻译方法,其特征在于:所述步骤一,多义句库模块中通过人工或电脑对构成源语句中的词进行分解、分析,对源语句中同一词具有多重表达含义构成的词进行归纳统计,用不同含义的词代替源语...

【专利技术属性】
技术研发人员:黄中伟
申请(专利权)人:深圳大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1