The invention provides a non conventional word or phrase of non conventional judgment and translation methods, including access to the translation object, the judgment of the words or phrases Chinese Chinese belong to non conventional words or non conventional phrases, semantic segmentation, in at least one pre established foreign language corpus retrieval, obtaining at least one foreign language the translation of words corresponding to the Chinese pinyin translation and display results. The invention also discloses a system for executing the above method. Due to the mainstream media as translation corpus, translation results; in addition, in the face of multiple search results, the invention also provides a specific translation selection method to select the highest accuracy, to avoid the traditional Internet search translation out of order.
【技术实现步骤摘要】
非常规词语或非常规短句的判断以及翻译方法及其系统
本申请涉及翻译
,具体的涉及一种非常规词语或非常规短句的判断以及翻译方法,以及实现该方法的系统。
技术介绍
由于全球化进程以及互联网技术的发展,信息的传播速度比任何时候都快。随着我国经济、政治影响力的进一步提升,汉语的文化输出越来越明显,汉语的国际影响力也越来越大。为了更好的推广汉语文化,大量的汉语书籍已经被翻译为外文走向世界。然而,由于知识量的爆炸性增长,单纯的人工翻译已经远远不能满足需要,于是产生了各种翻译辅助工具,包括翻译词典、在线词典、在线翻译工具甚至自动语音翻译工作,极大的减轻了翻译工作量,加快了翻译速度。然而,上述传统的翻译辅助工具针对的翻译对象都是传统的中文词语、中文短句或者句子,其翻译原理均是基于已有的短语-外文对照表,例如各种权威词典,从中选择最合适的翻译结果。一旦要翻译的对象不在上述对照表中,上述翻译工具就会找不到翻译结果;有鉴于此,有些翻译工具还会连接上互联网,采用互联网搜索的方式得到可能的翻译结果,但是互联网搜索的结果往往千差万别,对同一个词语的翻译可能得到几十种甚至上百种不同的翻译结果,从而依然无法得到准确的翻译结果;特别是对一些非常规词语、非常规短句而言,由于其出现的频率较低,出现的时间较短,传统的翻译工具所以依靠的词典尚未收录,而单纯依靠搜索引擎得到的结果依然会不准确。因此,需要针对非常规词语或非常规短句的判断以及翻译提出一种有效的技术方案。
技术实现思路
本专利技术提供了一种非常规词语或非常规短句的判断以及翻译方法,该方法包括如下步骤:S1:获取待翻译的中文词语或者中文短句 ...
【技术保护点】
一种非常规词语或非常规短句的判断以及翻译方法,该方法包括如下步骤:S1:获取待翻译的中文词语或者中文短句;S2:判断该中文词语或者中文短句是否属于非常规词语或者非常规短句,S3:如果该中文词语或者中文短句不属于非常规词语或者非常规短句,则采用常规翻译方法获得翻译结果,进入步骤S7;否则进入步骤S4:S4:如果是中文词语,对其进行语义分析,将中文词语转化为汉语拼音;如果是中文短句,则对该短句进行语义切分,将短句切分成至少一个中文词语,将所述中文词语进行语义分析,并将所述中文词语转化为汉语拼音;S5:根据所述汉语拼音,在至少一个预先建立的外文语料库中进行检索,获得与所述汉语拼音对应的至少一个外文翻译词汇;S6:从所述至少一个外文翻译词汇中,选择一个词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果;S7:显示所述待翻译的中文词语或者中文短句翻译结果;其特征在于:步骤S2中判断该中文词语或者中文短句是否属于非常规词语或者非常规短句,是指判断该中文词语或者中文短句首次出现的时间是否晚于某一个预设时间节点,和/或,判断该中文词语或者中文短句在某一预设时间段内出现的频率是否低于某一个预设值。
【技术特征摘要】
1.一种非常规词语或非常规短句的判断以及翻译方法,该方法包括如下步骤:S1:获取待翻译的中文词语或者中文短句;S2:判断该中文词语或者中文短句是否属于非常规词语或者非常规短句,S3:如果该中文词语或者中文短句不属于非常规词语或者非常规短句,则采用常规翻译方法获得翻译结果,进入步骤S7;否则进入步骤S4:S4:如果是中文词语,对其进行语义分析,将中文词语转化为汉语拼音;如果是中文短句,则对该短句进行语义切分,将短句切分成至少一个中文词语,将所述中文词语进行语义分析,并将所述中文词语转化为汉语拼音;S5:根据所述汉语拼音,在至少一个预先建立的外文语料库中进行检索,获得与所述汉语拼音对应的至少一个外文翻译词汇;S6:从所述至少一个外文翻译词汇中,选择一个词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果;S7:显示所述待翻译的中文词语或者中文短句翻译结果;其特征在于:步骤S2中判断该中文词语或者中文短句是否属于非常规词语或者非常规短句,是指判断该中文词语或者中文短句首次出现的时间是否晚于某一个预设时间节点,和/或,判断该中文词语或者中文短句在某一预设时间段内出现的频率是否低于某一个预设值。2.如权利要求1所述的方法,步骤S5中,所述根据所述汉语拼音,在至少一个预先建立的外文语料库中进行检索,获得与所述汉语拼音对应的至少一个外文翻译词汇,具体包括:所述预先建立的外文语料库,是指利用网络爬虫程序,以所述预设时间节点为起点,在互联网外文语料中采集该预设时间节点之后出现的外文词汇;和/或,利用网络爬虫程序,在互联网外文语料中采集该预设时间段内出现的外文词汇。3.如权利要求1所述的方法,步骤S6中,从所述至少一个外文翻译词汇中,选择一个词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果,进一步包括:如果该汉语拼音来自于中文词语,则按照如下方式之一确定该中文词语的翻译结果:如果不同外文语料库中检索得到多个不同外文翻译词汇,则统计每个外文翻译词汇在每个外文语料库中出现的次数,选择出现次数最多的外文翻译词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果;或者:选择所有外文语料库中出现时间最晚的外文翻译词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果。4.如权利要求1所述的方法,步骤S6中,从所述至少一个外文翻译词汇中,选择一个词汇作为该汉语拼音对应的中文词语或者中文短句的翻译结果,进一步包括:如果该汉语拼音来自于中文短句的某一个切分中文词语,则继续获取由步骤S4得到的该中文短句的其他切分中文词语的翻译结果。5.如权利要求1-4任一项所述的方法,所述互联网外文语料库选自发布外文新闻的...
【专利技术属性】
技术研发人员:王静,
申请(专利权)人:传神语联网网络科技股份有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。