The present invention provides a kind of automatic translation system and method, the system includes: data preprocessing module, Chinese characters phonetic mapping database, Chinese and English words mapping database, domain specific and emotional word thesaurus and automatic translation module based on Multi Strategy data; the data preprocessing module receives user input and sends the data to the automatic translation module based on Multi Strategy, the field of information and users tend to the data including the name and the name of the corresponding item belongs; the users tend to include three dimensions weights: voice weights, weights, domain specific semantic and emotional weights; the phonetic mapping relationship Chinese characters stored in pinyin Chinese characters between the words in Chinese and English; the mapping relationship between inventory put words in Chinese and English; the domain specific and domain specific words stored in emotional words and words The automatic translation module based on the multi strategy implements the automatic translation, sorting and optimization of the name based on the speech, semantic and domain emotional strategies.
【技术实现步骤摘要】
一种名称自动翻译系统及方法
本专利技术属于自然语言处理(自动翻译)领域,具体涉及一种名称自动翻译系统及方法。
技术介绍
一个翻译质量高的名称,可以给人以美妙的感受,而一个不合时宜的翻译名称,则会让人望而却步。同一个名称在不同的语言习惯和文化背景中,其涵义也许会发生完全不同的理解。全球众多的国家拥有不同的文化,其语言体系也大不相同,同一个名称在不同的语言习惯和文化背景中,其涵义也许会发生完全不同的理解。因此对名称的翻译进行研究,具有十分重要的意义。目前主流的名称翻译大多基于手工方式,采取音译、意译。音译直接、简易、又具有异国情调,特别是在中国的饮食文化和通信方面尤为突出,如:pudding(布丁)、pizza(比萨饼)、toast(土司面包)、chocolate(巧克力)、hamburger(汉堡包)、salad(沙拉)等等:另外,一些名称的翻译考虑到了感情色彩,很多都是使用带有感情色彩的美好祝愿的词来进行命名的,在汉语中,用诸如帅、酷、俊、壮等来形容男性;用美、靓、倩、兰、芳、柔等词形容女性。而英文中也有不少这样的例子,如用beautiful、lovely、nat ...
【技术保护点】
一种名称自动翻译系统,其特征在于:所述名称自动翻译系统包括:数据预处理模块、拼音汉字映射库、中英词汇映射库、特定领域与情感字词库和基于多策略的自动翻译模块;所述数据预处理模块接收用户输入的数据并将数据发送给基于多策略的自动翻译模块,所述数据包括名称和该名称对应物品所属的领域信息和用户倾向;所述用户倾向包括三个维度的权重值:语音权重值、语义权重值、特定领域与情感权重值;所述拼音汉字映射库存放拼音汉字之间的关联关系;所述中英词汇映射库存放中英词汇之间的关联关系;所述特定领域与情感字词库存放特定领域的字和词汇;所述基于多策略的自动翻译模块对数据预处理模块发送来的数据进行处理,利用 ...
【技术特征摘要】
1.一种名称自动翻译系统,其特征在于:所述名称自动翻译系统包括:数据预处理模块、拼音汉字映射库、中英词汇映射库、特定领域与情感字词库和基于多策略的自动翻译模块;所述数据预处理模块接收用户输入的数据并将数据发送给基于多策略的自动翻译模块,所述数据包括名称和该名称对应物品所属的领域信息和用户倾向;所述用户倾向包括三个维度的权重值:语音权重值、语义权重值、特定领域与情感权重值;所述拼音汉字映射库存放拼音汉字之间的关联关系;所述中英词汇映射库存放中英词汇之间的关联关系;所述特定领域与情感字词库存放特定领域的字和词汇;所述基于多策略的自动翻译模块对数据预处理模块发送来的数据进行处理,利用所述拼音汉字映射库、中英词汇映射库、特定领域与情感字词库以及用户输入的语音权重值、语义权重值、特定领域与情感权重值,将接收到的名称根据其意义、处理后的音节和特定领域给出该名称对应的候选词库。2.根据权利要求1所述的名称自动翻译系统,其特征在于:所述数据预处理模块对语音进行音节的拆分,并根据语种的发音特点推荐相似音节,然后将音节的拆分和相似音节发送给名称多策略自动翻译模块。3.根据权利要求2所述的名称自动翻译系统,其特征在于:所述特定领域与情感字词库具体如下:将所有字词按特定领域分别存放,并将每一特定领域的字词按照情感强烈程度进行分级,对每个分级中的字词分别赋予领域与情感值。4.根据权利要求3所述的名称自动翻译系统,其特征在于:所述基于多策略的自动翻译模块包括三个子模块:语音翻译子模块、语义翻译子模块、特定领域与情感翻译子模块,每个子模块均能够产生备选词库;语义翻译模块、语音翻译模块或特定领域与情感策略翻译模块分别与用户输入的语音权重值、语义权重值、特定领域与情感权重值一一对应,当对应的权重值为非零时,选择该权重值对应的子模块。5.根据权利要求4所述的名称自动翻译系统,其特征在于:所述语音翻译子模块进行语音翻译:在拼音汉字映射库中分别对音节的拆分和相似音节进行搜索,根据搜索到的汉字或词或单词与原音节的相似程度,采用两者的Levensthein距离值作为语音距离值,如果一个名称拆出多个音节,则将所有音节进行组合,各音节的距离值的数学平均值即为整个翻译词与原词的语音距离值;所述语义翻...
【专利技术属性】
技术研发人员:贾仰理,张振领,克里斯托弗·洛奇,朱利安·洛奇,位通,
申请(专利权)人:聊城大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。