【技术实现步骤摘要】
【国外来华专利技术】预处理文本的方法以及用于执行该方法的预处理系统
本专利技术涉及文本翻译技术,并且更具体地,涉及一种能够通过用标准语言替换包含在翻译目标文本中的术语的预处理来提高机械翻译的准确性的预处理文本的方法以及用于执行该方法的预处理系统。
技术介绍
单词“Webtoon(网络漫画)”是Web和Cartoon的合成词,并且通常指示网络漫画平台。Webtoon与移动设备技术组合以呈现全球流行的媒体内容。由于网络漫画的普及,网络漫画已经被翻译成各种语言。如今,网络漫画翻译仍然处在人们直接阅读并翻译网络漫画的水平。网络漫画在没有系统翻译过程的情况下主要通过个人能力来翻译,并且因此考虑到文化差异而在翻译的准确性方面或者在表述方面存在问题。另外,当常规机械翻译工具(engine)翻译除了标准语言以外的语言(诸如新词、英文字母破坏语言、语言的口语化形式、拟声词、拟态词和方言)时,其翻译准确性极大地退化,并且对在每个工具的DB内构建的翻译方法和术语具有很大影响。韩国专利No.10-1099177涉及一种用于训练机械翻译机器的方法和系统,并且在韩国专利No.10-1099177中,公开了使用由 ...
【技术保护点】
一种在将输入文本翻译成另一种语言的文本之前对所述输入文本进行预处理的文本预处理系统,所述文本预处理系统包括:替换术语数据库,所述替换术语数据库存储替换术语;以及处理器,所述处理器执行预处理工具,所述预处理工具对所述输入文本进行预处理并且输出与所述输入文本的语言相同的语言的文本,其中,所述预处理工具包括:语素分析单元,所述语素分析单元以语素为单位将所述输入文本进行分隔,并且确定经分隔的语素的语音部分;术语识别单元,所述术语识别单元识别经分隔的语素是否与替换目标术语对应;替换术语搜索单元,如果经分隔的语素与替换目标术语对应,则所述替换术语搜索单元基于术语是否对应在所述替换术语数 ...
【技术特征摘要】
【国外来华专利技术】2015.06.22 KR 10-2015-00886951.一种在将输入文本翻译成另一种语言的文本之前对所述输入文本进行预处理的文本预处理系统,所述文本预处理系统包括:替换术语数据库,所述替换术语数据库存储替换术语;以及处理器,所述处理器执行预处理工具,所述预处理工具对所述输入文本进行预处理并且输出与所述输入文本的语言相同的语言的文本,其中,所述预处理工具包括:语素分析单元,所述语素分析单元以语素为单位将所述输入文本进行分隔,并且确定经分隔的语素的语音部分;术语识别单元,所述术语识别单元识别经分隔的语素是否与替换目标术语对应;替换术语搜索单元,如果经分隔的语素与替换目标术语对应,则所述替换术语搜索单元基于术语是否对应在所述替换术语数据库中搜索与所述替换目标术语对应的替换术语;以及构造分析单元,当基于术语是否对应在所述替换术语数据库中不存在对应的替换术语时,所述构造分析单元对所述输入文本的构造进行分析并且估计不存在所述替换术语的术语的含义,其中,所述替换术语搜索单元基于构造分析结果来搜索与估计的含义对应的替换术语。2.根据权利要求1所述的文本预处理系统,其中,所述预处理工具还包括文本生成器,所述文本生成器生成所述替换目标术语被搜索到的替换术语替换的文本。3.根据权利要求1所述的文本预处理系统,其中,所述构造分析单元根据语法对经分隔的语素进行分析,生成构造树结构,并且估计不存在所述替换术语的术语的含义。4.根据权利要求1所述的文本预处理系统,其中,所述预处理工具...
【专利技术属性】
技术研发人员:文炼国,李东炫,蔡承勋,尹熙花,
申请(专利权)人:电子部品研究院,
类型:发明
国别省市:韩国,KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。