【技术实现步骤摘要】
一种便携式的离线机器翻译智能盒子
[0001]本专利技术涉及机器翻译
,具体地说是一种便携式的离线机器翻译智能盒子。
技术介绍
[0002]机器翻译技术是将一种语言转换为另一种语言的技术,它在自然语言处理领域乃至人工智能深度学习领域都占据着非常重要的专业地位。
[0003]在现有的机器翻译技术应用场景中,一个方向是以电脑主机为载体,通过网页端或者应用程序相关的服务,向用户提供在线的机器翻译服务,另一个方向是以手机为载体,通过手机的应用程序提供或离线或在线的机器翻译服务。
[0004]但上述现有技术中如果用户处于没有网络信号覆盖,或者用户的使用场景涉密,不能够访问外网的条件下,也就无法使用在线机器翻译服务,进一步的在访问远程服务器的过程中,势必会产生数据的传输与交互,这样对于用户的隐私信息就无法保证安全性了,这其中不止是用户输入的翻译原文与译文,还包括在网络传输过程中的包括用户IP在内的其他敏感信息,这都可能会被备份到远程服务器中,造成用户的财产经济损失。
[0005]因此,需要设计一种便携式的离 ...
【技术保护点】
【技术特征摘要】
1.一种便携式的离线机器翻译智能盒子,其特征在于,包括硬件部分、软件部分和应用部分;【硬件技术】:包括基础载体和封装改进,所述基础载体为开发板,所述封装改进为使用塑料亚克力作为整体外壳,在所述开发板的散热片、电源口和网线口保留了空间待接入,所述散热片为金属散热片并且配备有风扇,去除所述开发板的USB接口和HDMI接口;【软件部分】:包括系统框架和模型服务,所述系统框架中包括以下步骤:S1:系统采用基于开发板自带系统或Windows,Mac OS;S2:手动将开发板的系统交换空间扩大,安装swapfile;S3:然后为开发板增加6GB的虚拟交换空间;S4:删除无关的应用程序,保留WEB可视化界面,对操作系统设置仅有开发者才知晓的用户名密码;S5:基本的语言环境并配置,包括基本编程语言与深度学习框架的安装;所述模型服务为使用Transformer的深度神经网络模型并根据应用场景进行改进优化,包括以下步骤:S10:模型蒸馏:将大规模参数量级的机器翻译模型压缩为小规模参数量级的机器翻译模型并在边缘计算盒子上部署运行,采用的是逐层进行参数学习,阶梯式地让小模型的每一层参数学习大模型的几层参数;S11:标记泛化:将离散化单词以特殊标记的形式进行改写,输入模型学习,达到数据泛化的目的,使模型遇到这一类的数据输入时都能够很好地保留文本原意;S12:用户定制化:通过挖掘专业词典或特殊翻译需求的对照词典时,对机器翻译模型进行定制化处理;S13:通过对S11中的标记泛化处理与指针网络技术手段,将用户所需的特殊单词进行标记替换;S14:通过词典从原始训练语料以及其他平行语料资源平台中获取到一定数量的当前领域下的平行句对,让已经训练完成的通用领域下的机器翻译模...
【专利技术属性】
技术研发人员:巢文涵,徐琳茹,
申请(专利权)人:北京间微科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。