【技术实现步骤摘要】
本专利技术是一种涉及文字自动翻译的技木,具体说,涉及ー种。
技术介绍
目前主流的机器翻译系统可以分为两大类基于规则的机器翻译系统和基于语料库的机器翻译系统。其中基于语料库的机器翻译系统又可以分为基于统计的机器翻译系统和基于实例的机器翻译系统。无论上述那种类型的机器翻译系统在翻译过程中完全依赖计算机最終都会陷入到歧义裁决的泥潭中。基于规则的机器翻译系统在规则不足的情况下翻译结果很难准确,但随着规则的 不断增多又会导致规则所覆盖的语言实例产生交叉最終互相干扰影响翻译结果。基于统计的翻译系统,是通过对既存语料数据利用预设的统计模型进行分析统计,依靠统计结果来消除机器翻译过程中的词义和语义上的歧义。统计方法的引入在一定程度上解决了歧义问题,但是其效果却受限于语料数据本身的特征。例如构成语料库文本的文体类型、文章所涉及的行业范畴、文章编写的时代等等,同样的词义、语义或语法现象在不同的文体或行业领域中有不同的出现概率,在A类里概率高的在B类中可能反而会很低,从而导致统计的结果相互抵消降低了歧义消除的效果。因此,基于统计的翻译系统需要有一个类别纯粹且数量足够大的语料库。基于实 ...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:江潮,
申请(专利权)人:传神联合北京信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。