依据语言单元的词性建立类别的翻译系统及其方法技术方案

技术编号:5197669 阅读:298 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种依据语言单元的词性建立类别的翻译系统及其方法,其通过将来源资料剖析为语言单元后,依据各个语言单元的第一词性,判断出来源资料的句型并建立相对应的第一类别,之后在依据来源资料的句型产生第二词性后,依据第二词性的排列顺序,组合相对应的第二类别中所记录的语义为目标资料的技术手段,可以准确翻译,并达成判断来源资料的文法是否正确的技术功效。

【技术实现步骤摘要】

本专利技术涉及一种翻译系统及其方法,特别涉及一种依据语言单元的词性建立类别 的翻译系统及其方法。
技术介绍
翻译软件会对输入的来源资料进行分析,然后将属于第一语言的来源资料翻译为 属于第二语言的目标资料,基本上这是一种自然语言理解的应用,也是自然语言处理技术 的一项主要目标。目前的翻译软件大多是先将来源资料中所包含的单词进行翻译后,再以预定的排 列方式排列翻译后的资料,如此便可以将属于第一语言的来源资料转变为属于第二语言的 目标资料,但是翻译软件所翻出来的目标资料通常没有办法直接理解,例如来源资料为「我 在一家公司上班」时,翻译软件翻译产生的目标资料为「I go to work at a company」,明 显的,使用者还需要自行解读后才可以获得其所需要的目标资料。另外,目前的翻译软件 也无法将意思相同,且组成相似的来源资料翻译出相同的目标资料,例如来源资料为「狗追 树」时,翻译软件产生的目标资料为「Dog chasing the tree」,来源资料为「狗追赶树」时, 翻译软件产生的目标资料为「Tree chasing a dog」,来源资料为「狗追赶着树」时,翻译软 件产生的目标资料为「The dog to catch up with the tree」,这将造成使用者无法获得正 确的目标资料。综上所述,可知现有技术中长期以来一直存在翻译技术无法将来源资料准确的翻 译为目标资料的问题,因此有必要提出改进的技术手段,来解决此一问题。
技术实现思路
有鉴于现有技术存在无法准确进行翻译的问题,本专利技术遂提供一种依据语言单元 的词性建立类别的翻译系统及其方法,其中本专利技术所提供的依据语言单元的词性建立类别的翻译系统,至少包含输入模块, 用以输入属于第一语言的一来源资料;模型建立模块,其中更包含语言剖析单元,用以将 来源资料剖析为复数语言单元;词性判断单元,用以判断各语言单元的第一词性;第一类 别建立单元,用以分别建立包含词性属性及第一语义属性的各第一类别,及用以将各语言 单元的语义分别设定为各第一类别所包含的第一语义属性,其中,各第一类别所包含的词 性属性与各第一词性相同;句型判断单元,用以依据各第一词性的排列顺序判断来源资料 的一句型;一模型解除模块,其中更包含词性产生单元,用以依据句型产生以特定顺序排 列的复数第二词性;第二类别建立单元,用以依据各第二词性分别建立包含词性属性的各 第二类别,其中,各第二类别所包含的词性属性与各第二词性相同;语意查找单元,用以依 据各第一类别包含的第一语义属性查找第二语言中的相同的语义,使第二类别建立单元将 语意查找单元所查找出的各语义分别设定为各第二类别的第二语义属性;语义组合单元, 用以依据各第二词性的排列顺序,排列各第二类别,及用以组合以排序的各第二类别包含的第二语义属性所记录的各语义为目标资料;输出模块,用以输出目标资料。本专利技术所提供的依据语言单元的词性建立类别的翻译方法,其步骤至少包括输 入属于第一语言的来源资料;剖析来源资料为复数语言单元;判断各语言单元的第一词 性;分别建立包含词性属性的各第一类别,各第一类别所包含的词性属性与各第一词性相 同;分别设定各语言单元的语义为各第一类别所包含的第一语义属性;依据各第一词性的 排列顺序判断来源资料的句型;依据来源资料的句型产生以特定顺序排列的复数第二词 性;依据各第二词性分别建立包含词性属性的各第二类别,各第二类别所包含的词性属性 与各第二词性相同;依据各第一类别包含的第一语义属性查找第二语言中的相同的语义; 分别设定各语义为各第二类别的第二语义属性;依据各第二词性的排列顺序排列各第二类 别;组合以排序的各第二类别包含的第二语义属性所记录的各语义为目标资料;输出目标 资料。本专利技术所提供的系统与方法如上,与现有技术之间的差异在于本专利技术通过将来源 资料剖析为语言单元后,依据各个语言单元对应第一语言的第一词性,判断出来源资料的 句型并建立相对应的第一类别,之后在依据来源资料的句型产生对应第二语言的第二词性 后,依据第二词性的排列顺序,组合相对应的第二类别中所记录的语义为目标资料,借以解 决现有技术所存在的问题,并可以达成判断来源资料的文法是否正确的技术功效。附图说明图IA为本专利技术所提的依据语言单元的词性建立类别的翻译系统架构图。图IB为本专利技术所提的模型建立模块的组件示意图。图IC为本专利技术所提的模型解除模块的组件示意图。图2A为本专利技术所提的依据语言单元的词性建立类别的翻译方法流程图。图2B为本专利技术所提的汇编语言单元的方法流程图。图2C为本专利技术所提的附加翻译方法流程图。图2D为本专利技术所提的设定第二类别的属性的附加方法流程图。图3为本专利技术实施例所提的描绘图像的示意图。主要组件符号说明110输入模块120模型建立模块121语言剖析单元122词性判断单元125第一类别建立单元126句型判断单元129逻辑判断单元130模型解除模块132词性产生单元135第二类别建立单元136语义查找单元137语义组合单元138语义筛选单元139时态调整单元140输出模块410第一图像420第二图像430第三图像440第四图像450第五图像具体实施例方式以下将配合图式及实施例来详细说明本专利技术的特征与实施方式,内容足以使任何 本领域技术人员能够轻易地充分理解本专利技术解决技术问题所应用的技术手段并据以实施, 借此实现本专利技术可达成的功效。本专利技术所提的第一语言以及第二语言通常属于不同语种的语言,但本专利技术并不以 此为限,例如第一语言为中文,第二语言则为英文,但本专利技术所提的第一语言、第二语言并 不分别以中文、英文为限,也可以是日文、德文等。以下先以图IA本专利技术所提的依据语言单元的词性建立类别的翻译系统的系统架 构图来说明本专利技术的系统运作。如图IA所示,本专利技术的系统含有输入模块110、模型建立模 块120、模型解除模块130、以及输出模块140。其中,模型建立模块120如图IB所示,更包 含语言剖析单元121、词性判断单元122、第一类别建立单元125、以及句型判断单元126 ;模 型解除模块130如图IC所示,更包含词性产生单元132、第二类别建立单元135、语义查找 单元136、以及语义组合单元137。输入模块110负责输入属于第一语言的来源资料,被输入模块110所输入的来源 资料通常为一个句子,但本专利技术并不以此为限,也可以是一段文章等。一般而言,来源资料 由输入模块110提供使用者输入。语言剖析单元121负责将来源资料剖析为多个语言单元。语言剖析单元121每一 次只会提取(fetch)来源资料中的一个语言元素,语言剖析单元121每次所提取的语言元 素在不同的语言中可能会有不同,例如,中文为一个「字」、英文可能为一个「字母」或是一 个「单字」、日文为一个「音」或一个「单词」等,但本专利技术所提的语言元素并不以此为限。在大部分的情况下,语言剖析单元121会将每次所提取的语言元素定义为一个语 言单元,但若语言剖析单元121在提取语言元素并定义语言单元后,判断最后定义的语言 元素可以与先前所定义的语言元素组合,则会改变原先的定义,而改以将多个语言元素定 义为一个语言单元。其中,语言剖析单元121判断是否要将多个语言单元定义为一个语言 单元的条件如下举例,但本专利技术并不本文档来自技高网...

【技术保护点】
一种依据语言单元的词性建立类别的翻译方法,其特征在于,该翻译方法至少包含下列步骤:输入属于一第一语言的一来源资料;剖析该来源资料为复数语言单元;判断各该语言单元的第一词性;分别建立包含一词性属性的各第一类别,各该第一类别所包含的该词性属性与各该第一词性相同;分别设定各该语言单元的语义为各该第一类别所包含的第一语义属性;依据各该第一词性的排列顺序判断该来源资料的一句型;依据该句型产生以特定顺序排列的复数第二词性;依据各该第二词性分别建立包含一词性属性的各第二类别,各该第二类别所包含的该词性属性与各该第二词性相同;依据各该第一类别包含的第一语义属性查找一第二语言中的相同的语义;分别设定各该语义为各该第二类别的第二语义属性;依据各该第二词性的排列顺序排列各该第二类别;组合以排序的各该第二类别包含的第二语义属性所记录的各该语义为一目标资料;及输出该目标资料。

【技术特征摘要】
1.一种依据语言单元的词性建立类别的翻译方法,其特征在于,该翻译方法至少包含 下列步骤输入属于一第一语言的一来源资料; 剖析该来源资料为复数语言单元; 判断各该语言单元的第一词性;分别建立包含一词性属性的各第一类别,各该第一类别所包含的该词性属性与各该第 一词性相同;分别设定各该语言单元的语义为各该第一类别所包含的第一语义属性; 依据各该第一词性的排列顺序判断该来源资料的一句型; 依据该句型产生以特定顺序排列的复数第二词性;依据各该第二词性分别建立包含一词性属性的各第二类别,各该第二类别所包含的该 词性属性与各该第二词性相同;依据各该第一类别包含的第一语义属性查找一第二语言中的相同的语义; 分别设定各该语义为各该第二类别的第二语义属性; 依据各该第二词性的排列顺序排列各该第二类别;组合以排序的各该第二类别包含的第二语义属性所记录的各该语义为一目标资料;及 输出该目标资料。2.如权利要求1所述的依据语言单元的词性建立类别的翻译方法,其特征在于,该翻 译方法于该剖析该来源资料为各该语言单元的步骤后,更包含组合合并后的语义不变、合 并后成为完整的单字或单词、或合并后成为词组的复数语言单元为一新语言单元的步骤。3.如权利要求1所述的依据语言单元的词性建立类别的翻译方法,其特征在于,该依 据各该第二词性的排列顺序排列各该第二类别的步骤更包含判断词性属性相同的该些第 二类别的排列顺序的步骤。4.如权利要求1所述的依据语言单元的词性建立类别的翻译方法,其特征在于,该翻 译方法于该依据各该第一类别包含的第一语义属性查找该第二语言中的相同的语义的步 骤后,更包含由查找出的复数语意中选择最适合者的步骤。5.如权利要求1所述的依据语言单元的词性建立类别的翻译方法,其特征在于,翻译 方法于该依据各该第一类别包含的第一语义属性查找该第二语言中的相同的语义的步骤 后,更包含调整各该第二类别包含的第二语义属性所记录的语义的时态的步骤。6.一种依据语言单元的词性建立类别的翻译系统,其特征在于,该翻译系统至...

【专利技术属性】
技术研发人员:邱全成邱裔俊
申请(专利权)人:英业达股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1