【技术实现步骤摘要】
本申请涉及词典的计算机存储与查询领域,特别涉及计算机执行的低误查率的大规模词典存储与查询方法。
技术介绍
随着计算机的快速发展,利用计算机来实现不同语种之间的翻译技术,早已为人所熟知。如同人在翻译之前必须掌握两种语言的词汇和语法 一样,计算机在进行语言翻译之前,其存储器中也必定存储机器词典和机器语法。计算机在翻译过程中,首先要通过查原文词典给出所输入原文的译文代码和语法信息,然后再根据译文代码和语法信息从译文词典中找出所要翻译的译文。如中国国家专利局申请号200610136705.1的文件提出了 一种精确机器翻译的方法及其装置,如图l所示,其方法包括以下步骤S101,以句子为单位,以谓语动词为核心,对句子成分进行精确分类,从而建立"普遍语法公式"。S103,建立源语言数据库和目标语言数据库。S105,对源语言的具体句子进行分析,推导出源语言的具体句子的象数化公式。S107,将源语言的象数化公式转换为目标语言的具体句子的象数化公式。S109,在源语言数据库和目标语言数据库中——检索出相对应的词和词组,从而得到相对应的目标语言的具体句子。上述精确机器翻译的方法可以极 ...
【技术保护点】
一种低误查率的大规模词典存储方法,用以压缩并存储机器翻译时所需要的词典数据,其特征在于,包括以下步骤: 将机器翻译时所需要的现有词典数据按照设定的格式进行排列; 读取词典数据,并利用Bloomfilter技术生成一Bloomfi lter索引; 读取词典数据,并利用完美哈希算法生成一完美哈希索引。
【技术特征摘要】
【专利技术属性】
技术研发人员:侯磊,孙海涛,孙健,张勤,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:VG[英属维尔京群岛]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。