一种基于句式结构的翻译方法及装置制造方法及图纸

技术编号:17442060 阅读:27 留言:0更新日期:2018-03-10 14:46
本发明专利技术公开了一种基于句式结构的翻译方法及装置,其中,该方法包括:获取源语言文本,并确定源语言文本中的谓语;对源语言文本进行语义分析,并根据语义分析结果和谓语在源语言文本中的位置确定源语言文本的一个或多个源语言单元;分别对源语言单元进行语义分析,并分别确定每个源语言单元中的源语言子单元;根据目标语言的句式结构重新排列源语言单元和谓语的顺序,并在每个源语言单元中重新排列源语言子单元的顺序;按照排列后的顺序将源语言文本翻译为目标语言文本。该方法最先确定谓语,之后采用分层排列的方式保证源语言单元和源语言子单元的排列顺序与目标语言的句式结构相一致,使得翻译后的目标语言文本更加规范。

【技术实现步骤摘要】
一种基于句式结构的翻译方法及装置
本专利技术涉及翻译方法
,特别涉及一种基于句式结构的翻译方法及装置。
技术介绍
随着国际化交流与合作的日益加深,无论在日常生活或工作中均可能需要使用不同国家的语言;因此,在进行交流与合作时,通常需要将不同源语言的文本翻译成为目标语言译本,以促进国际间交流与合作的顺利进行。由于不同的国家所使用的语言之间存在着的差异,每种语言具有自己的语法或句式结构。例如,英文“IstudyEnglishatyourschool”直接翻译为汉语为“我学习英语在你的学校”,而按照汉语的语法规则应该翻译为“我在你的学校学习英语”。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:利用现有的翻译方法将源语言翻译为目标语言时,虽然可以按照目标语言的语法规则对句子顺序进行调整,但现有翻译方法也只能调整简单句子的顺序,但对于复杂的句子仍然按照源语言的顺序进行翻译。例如,源语言为汉语,目标语言为英语;源语言为“四十个学生昨天晚上八点左右在公园的小河旁十分开心地唱了一首英文歌”,现有翻译方法翻译为英语后为“FortystudentsateightpmyesterdayeveningintheparkbesidetheriverisveryhappytosinganEnglishsong”,而用英语比较标准的表达上述句子应该为“FortystudentssanganEnglishsongveryhappilybytheriverintheparkatabout8o'clockyesterdayevening”。由于现有翻译方法对复杂句子均是按照源语言的顺序进行翻译,使得翻译后的目标语言的语序混乱,甚至存在语法错误的问题。如某些翻译软件对上述汉语的翻译结果为“Aboutfortystudentsateighto'clockyesterdayeveningintheparkneartheriverisveryhappysanganEnglishsong”,句中存在“is”和“sang”两个谓语动词。公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
本专利技术的目的在于提供一种基于句式结构的翻译方法及装置,从而克服现有翻译方法不能有效翻译复杂句子的缺陷。本专利技术实施例提供的一种基于句式结构的翻译方法,包括:获取源语言文本,并确定源语言文本中的谓语;对源语言文本进行语义分析,并根据语义分析结果和谓语在源语言文本中的位置确定源语言文本的一个或多个源语言单元;分别对源语言单元进行语义分析,并分别确定每个源语言单元中的源语言子单元;根据目标语言的句式结构重新排列源语言单元和谓语的顺序,并在每个源语言单元中重新排列源语言子单元的顺序;按照排列后的顺序将源语言文本翻译为目标语言文本。在一种可能的实现方式中,源语言单元包括:主语、宾语、方式状语、地点状语或时间状语;源语言子单元包括:子主语、子谓语、子宾语、子方式状语、子地点状语、子时间状语中的一项或多项。在一种可能的实现方式中,主语包括:第一子主语、第一子谓语、第一子宾语、第一子方式状语、第一子地点状语、第一子时间状语中的一项或多项;宾语包括:第二子主语、第二子谓语、第二子宾语、第二子方式状语、第二子地点状语、第二子时间状语中的一项或多项;方式状语包括:第三子主语、第三子谓语、第三子宾语、第三子方式状语、第三子地点状语、第三子时间状语中的一项或多项;地点状语包括:第四子主语、第四子谓语、第四子宾语、第四子方式状语、第四子地点状语、第四子时间状语中的一项或多项;时间状语包括:第五子主语、第五子谓语、第五子宾语、第五子方式状语、第五子地点状语、第五子时间状语中的一项或多项;目标语言的句式结构为:(第一子主语+第一子谓语+第一子宾语+第一子方式状语+第一子地点状语+第一子时间状语)+谓语+(第二子主语+第二子谓语+第二子宾语+第二子方式状语+第二子地点状语+第二子时间状语)+(第三子主语+第三子谓语+第三子宾语+第三子方式状语+第三子地点状语+第三子时间状语)+(第四子主语+第四子谓语+第四子宾语+第四子方式状语+第四子地点状语+第四子时间状语)+(第五子主语+第五子谓语+第五子宾语+第五子方式状语+第五子地点状语+第五子时间状语)。在一种可能的实现方式中,在分别确定每个源语言单元中的源语言子单元之后,还包括:建立n阶初始矩阵,每一个源语言子单元对应初始矩阵中的一个元素,且谓语也对应初始矩阵中的一个元素;初始矩阵的行列式不为零且n≥6;在确定源语言子单元后确定特征矩阵,特征矩阵是分别将与源语言子单元和谓语相对应的元素增加相应的预设差值后确定的矩阵;当可以确定多个特征矩阵时,将行列式最大的特征矩阵作为目标特征矩阵,并将与目标特征矩阵相对应的源语言子单元作为最终确定的源语言子单元。在一种可能的实现方式中,初始矩阵的对角线上元素的元素值为第一初始值,其他元素值为第二初始值;每个源语言单元对应初始矩阵的一个预设区域,且源语言单元中的每一个源语言子单元依次与预设区域内的一个元素相对应;预设区域为初始矩阵的一行、一列或一个九宫格。基于同样的专利技术构思,本专利技术实施例还提供一种基于句式结构的翻译装置,包括:获取模块,用于获取源语言文本,并确定源语言文本中的谓语;第一分析模块,用于对源语言文本进行语义分析,并根据语义分析结果和谓语在源语言文本中的位置确定源语言文本的一个或多个源语言单元;第二分析模块,用于分别对源语言单元进行语义分析,并分别确定每个源语言单元中的源语言子单元;排序模块,用于根据目标语言的句式结构重新排列源语言单元和谓语的顺序,并在每个源语言单元中重新排列源语言子单元的顺序;翻译模块,用于按照排列后的顺序将源语言文本翻译为目标语言文本。在一种可能的实现方式中,源语言单元包括:主语、宾语、方式状语、地点状语或时间状语;源语言子单元包括:子主语、子谓语、子宾语、子方式状语、子地点状语、子时间状语中的一项或多项。在一种可能的实现方式中,主语包括:第一子主语、第一子谓语、第一子宾语、第一子方式状语、第一子地点状语、第一子时间状语中的一项或多项;宾语包括:第二子主语、第二子谓语、第二子宾语、第二子方式状语、第二子地点状语、第二子时间状语中的一项或多项;方式状语包括:第三子主语、第三子谓语、第三子宾语、第三子方式状语、第三子地点状语、第三子时间状语中的一项或多项;地点状语包括:第四子主语、第四子谓语、第四子宾语、第四子方式状语、第四子地点状语、第四子时间状语中的一项或多项;时间状语包括:第五子主语、第五子谓语、第五子宾语、第五子方式状语、第五子地点状语、第五子时间状语中的一项或多项;目标语言的句式结构为:(第一子主语+第一子谓语+第一子宾语+第一子方式状语+第一子地点状语+第一子时间状语)+谓语+(第二子主语+第二子谓语+第二子宾语+第二子方式状语+第二子地点状语+第二子时间状语)+(第三子主语+第三子谓语+第三子宾语+第三子方式状语+第三子地点状语+第三子时间状语)+(第四子主语+第四子谓语+第四子宾语+第四子方式状语+第四子地点状语+第四子时间状语)+(第五子主语+第本文档来自技高网
...
一种基于句式结构的翻译方法及装置

【技术保护点】
一种基于句式结构的翻译方法,其特征在于,包括:获取源语言文本,并确定所述源语言文本中的谓语;对所述源语言文本进行语义分析,并根据语义分析结果和所述谓语在所述源语言文本中的位置确定所述源语言文本的一个或多个源语言单元;分别对所述源语言单元进行语义分析,并分别确定每个源语言单元中的源语言子单元;根据目标语言的句式结构重新排列所述源语言单元和所述谓语的顺序,并在每个源语言单元中重新排列所述源语言子单元的顺序;按照排列后的顺序将所述源语言文本翻译为目标语言文本。

【技术特征摘要】
1.一种基于句式结构的翻译方法,其特征在于,包括:获取源语言文本,并确定所述源语言文本中的谓语;对所述源语言文本进行语义分析,并根据语义分析结果和所述谓语在所述源语言文本中的位置确定所述源语言文本的一个或多个源语言单元;分别对所述源语言单元进行语义分析,并分别确定每个源语言单元中的源语言子单元;根据目标语言的句式结构重新排列所述源语言单元和所述谓语的顺序,并在每个源语言单元中重新排列所述源语言子单元的顺序;按照排列后的顺序将所述源语言文本翻译为目标语言文本。2.根据权利要求1所述的方法,其特征在于,所述源语言单元包括:主语、宾语、方式状语、地点状语或时间状语;所述源语言子单元包括:子主语、子谓语、子宾语、子方式状语、子地点状语、子时间状语中的一项或多项。3.根据权利要求2所述的方法,其特征在于,所述主语包括:第一子主语、第一子谓语、第一子宾语、第一子方式状语、第一子地点状语、第一子时间状语中的一项或多项;所述宾语包括:第二子主语、第二子谓语、第二子宾语、第二子方式状语、第二子地点状语、第二子时间状语中的一项或多项;所述方式状语包括:第三子主语、第三子谓语、第三子宾语、第三子方式状语、第三子地点状语、第三子时间状语中的一项或多项;所述地点状语包括:第四子主语、第四子谓语、第四子宾语、第四子方式状语、第四子地点状语、第四子时间状语中的一项或多项;所述时间状语包括:第五子主语、第五子谓语、第五子宾语、第五子方式状语、第五子地点状语、第五子时间状语中的一项或多项;所述目标语言的句式结构为:(第一子主语+第一子谓语+第一子宾语+第一子方式状语+第一子地点状语+第一子时间状语)+谓语+(第二子主语+第二子谓语+第二子宾语+第二子方式状语+第二子地点状语+第二子时间状语)+(第三子主语+第三子谓语+第三子宾语+第三子方式状语+第三子地点状语+第三子时间状语)+(第四子主语+第四子谓语+第四子宾语+第四子方式状语+第四子地点状语+第四子时间状语)+(第五子主语+第五子谓语+第五子宾语+第五子方式状语+第五子地点状语+第五子时间状语)。4.根据权利要求1-3任一所述的方法,其特征在于,在所述分别确定每个源语言单元中的源语言子单元之后,还包括:建立n阶初始矩阵,每一个源语言子单元对应所述初始矩阵中的一个元素,且所述谓语也对应所述初始矩阵中的一个元素;所述初始矩阵的行列式不为零且n≥6;在确定源语言子单元后确定特征矩阵,所述特征矩阵是分别将与所述源语言子单元和所述谓语相对应的元素增加相应的预设差值后确定的矩阵;当可以确定多个特征矩阵时,将行列式最大的特征矩阵作为目标特征矩阵,并将与所述目标特征矩阵相对应的源语言子单元作为最终确定的源语言子单元。5.根据权利要求4所述的方法,其特征在于,所述初始矩阵的对角线上元素的元素值为第一初始值,其他元素值为第二初始值;每个所述源语言单元对应所述初始矩阵的一个预设区域,且所述源语言单元中的每一个源语言子单元依次与所述预设区域内的一个元素相对应;所述预设区域为所述初始矩阵的一行、一列或一个九宫格。6.一种基于句式结构的翻译装置,其特征在于,包括:获取模块,用于获取源语言文本,并确...

【专利技术属性】
技术研发人员:张炳林
申请(专利权)人:深圳市青锋全能教育培训有限公司
类型:发明
国别省市:广东,44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1