The invention relates to the technical field of Natural Language Processing, in particular to a method and a system for developing a multilingual website. Including the multi language website development method: step a: static web development of multi language website; step B: call Machine Translation interface, the dynamic data of Chinese multi language website added for multilingual translation processing; step C: read data translation, translation data loading and rendering of the multi language dynamic web page according to the. The invention adopts Machine Translation and artificial intervention corrective treatment, greatly reduce the translation error, make the page showing the effect of higher accuracy; through the Unicode encoding format selection UTF 8, to avoid the situation when rendering the page garbled generated by dynamic loading; caching mechanism, solve the real-time translation load, each time we need to call the Machine Translation interface the problem of resource consumption and load delay problem, and reduce the manual intervention.
【技术实现步骤摘要】
本专利技术涉及自然语言处理
,特别涉及一种多语言网站开发方法及系统。
技术介绍
随着互联网商业化的迅速发展,电子商务网站大量涌现,市场竞争日趋激烈。近年来,中国电子商务迅猛发展,在各领域的应用不断拓展和深化,交易额连创新高,带动相关产业蓬勃发展,相关支撑体系不断健全完善,促进了创新动力和能力的不断增强。我们知道,维吾尔语是一种年代悠久的古老文字,目前用维吾尔语写的书籍文献,历史资料非常之多。它储存了成千上万的维吾尔语化及生活信息,其历史意义和文化价值是弥足珍贵的。因此,民文信息处理技术与维吾尔语言未来的发展前景紧密相连。目前,随着维吾尔族人民的文化和知识水平的逐步提高,会制作维吾尔语网页的人也相续增多。已经有很多人或者团体建了各种类型的维吾尔语网站传播各种信息,这些网站和普通中文网站一样都提供新闻浏览,信息下载等功能,但由于建立网站时使用的维吾尔语软件的编码互不相同,这就导致维吾尔语网页一直处于万马奔腾,互不兼容地境地,大部分的维吾尔语网页信息都不能共享,同时在不同的编码间进行转换不得不耗费大量的工作时间和科研资料。新疆维吾尔自治区是一个多民族多语言居住的地方,电子商务购物成为一种流行的趋势,淘宝的成功证实这种趋势将一直流行下去,但是疆内多数购物平台都是中文版的普通网站,对于大多数不熟悉中文的维吾尔族同胞使用起来困难重重,因此迫切需要一个规范化的维汉双语的购物平台。那么,想开发一款规范的维语版的电商平台不是简简单单的静态网页的维吾尔语化,一个完善地购物机制,需要实时地动态管理,动态地增删改查,人工手动翻译无法满足这种海量数据动态变化的需求,因此,我 ...
【技术保护点】
一种多语言网站开发方法,其特征在于,包括:步骤a:开发多语言网站的静态网页;步骤b:调用机器翻译接口,对所述多语言网站中动态加入的汉语数据进行多语种翻译处理;步骤c:读取翻译数据,根据所述翻译数据加载并渲染所述多语言网站动态网页。
【技术特征摘要】
1.一种多语言网站开发方法,其特征在于,包括:步骤a:开发多语言网站的静态网页;步骤b:调用机器翻译接口,对所述多语言网站中动态加入的汉语数据进行多语种翻译处理;步骤c:读取翻译数据,根据所述翻译数据加载并渲染所述多语言网站动态网页。2.根据权利要求1所述的多语言网站开发方法,其特征在于,在所述步骤a中,所述多语言网站至少包括汉语、维吾尔语或/和哈萨克语;所述开发多语言网站的静态网页具体为:通过Unicode字符集的UTF-8编码格式进行多语言网站的静态网页开发。3.根据权利要求2所述的多语言网站开发方法,其特征在于,在所述步骤b中,所述对多语言网站中动态加入的汉语数据进行多语种翻译处理具体包括:步骤b1:封装翻译接口,批量取出网站数据库中动态加入的汉语数据,将所述汉语数据存储在文档中,对文档中的汉语数据按行读取,每读取一行调用机器翻译接口进行自动翻译;步骤b2:对所述存储的翻译数据进行人工纠正处理;步骤b3:将所述人工纠正处理的翻译数据按对应格式存储到所述网站数据库中。4.根据权利要求2所述的多语言网站开发方法,其特征在于,所述步骤c中,所述根据翻译数据加载并渲染所述多语言网站动态网页具体包括:在存储翻译数据时,将维吾尔语或哈萨克语的每个字符编码转换成四位的16进制字符串,在网页渲染时,对从网站数据库中读出的维吾尔语或哈萨克语再做一次编码转换。5.根据权利要求4所述的多语言网站开发方法,其特征在于,所述步骤c还包括:对所述加载网页进行缓存处理;所述网页缓存处理包括文件缓存和内存缓存。6.一种多语言网站开发系统,其特征在于,包括:静态网页...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。