基于人名起源分类的人名音译方法技术

技术编号：8532877 阅读：287 留言：0更新日期：2013-04-04 15:54

基于人名起源分类的人名音译方法，它涉及一种翻译系统。本发明专利技术解决了中英人名音译中不同起源国家人名的音译模式不一致问题。本方法如下：一、人名起源分类；二、线性插值系统融合。本发明专利技术提出的方法将logistic多分类回归模型应用到人名起源分类中，并根据人名构成用字特征的特征模板进行人名起源分类；对于每一种起源的人名类别训练一个特定的音译(翻译)模型，再对多个音译模型的结果进行系统融合，实现双语人名互译。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种翻译系统。
技术介绍
互联网成为人们生活中不可或缺的一部分，它已经是人类信息获取、相互交流、信息传播的一个最重要的途径。我们每天都依靠互联网从中获取需要的生活服务、工作研究等信息。为了能在互联网的海量数据中更快更准更智能的为用户提供信息，信息检索、信息抽取、问答系统等技术成为近年来研究的重点。随着互联网带来的信息交流革命，人们的信息交流和获取已经不单单局限在单一语言中，能够跨语言处理互联网信息已经成为一种迫切需求，这种需要在新闻、金融等领域中显得尤为迫切。因此，机器翻译、跨语言检索、跨语言问答等技术的研究变得越来越重要。在这些研究之中，命名实体的翻译是这些技术的一个重要且基础的问题。人名，作为命名实体的一个重要的组成部分，具有相当强的表达能力，是一篇文档中的关键信息之一。但由于其开放性，人名常常是自然语言处理和机器翻译中未登陆词的主要成分。因此，正确地、自动地翻译人名将是一个有意义的工作，并且对于人工翻译也有一定的指导作用。人名翻译主要依据发音相似来进行，因此也叫做人名的音译。音译在上世纪90年代开始发展，至今已经有十几年的研究积累，主要有基于...

【技术保护点】
基于人名起源分类的人名音译方法，其人名起源分类特征、方法和多系统融合方法按照以下步骤进行：一、人名起源分类：根据人名起源特征模板采用logistic回归模型，进行计算：P(Y=k|x)=exp(wk*x)1+Σk=1K-1exp(wk*x),k＝1，2，...，K?1????????????????????????公式一P(Y=K|x)=11+Σk=1K-1exp(wk*x)公式二公式一和公式二中K的值是6，Y为1?6，其中1表示中国，2表示英美，3表示阿拉伯，4表示俄国，5表示日本，6表示韩国，x为人名起源特征模板，P表示起源的概率，w是特征的权重向量；步骤一中所述的...

【技术特征摘要】
1.基于人名起源分类的人名音译方法，其人名起源分类特征、方法和多系统融合方法按照以下步骤进行一、人名起源分类根据人名起源特征模板采用logistic回归模型，进行计算2.根据权利要求1所述的基于人名起源分类的人名音译方法，其特征在于步骤一所述中文人名起源特征模板中采用SRILM工具...

【专利技术属性】
技术研发人员：赵铁军，李婷婷，张春越，曹海龙，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人