【技术实现步骤摘要】
一种跨集群文件传输方法、系统及装置
[0001]本专利技术涉及计算机
,具体涉及一种跨集群文件传输方法
、
系统及装置
。
技术介绍
[0002]经典的文件传输协议如文件传输协议
(File Transfer Protocol
,简称
FTP)、
标准通信协议
(Standard Communication Protocol
,简称
SCP)、
安全文件传输协议
(Secure File Transfer Protocol
,简称
SFTP)
在大量数据迁移的场景下效率较低,其原因是它们均采用了全量传输协议,每次传输都要把整个文件全部发送一遍,占用大量的网络带宽和时间,导致传输效率较低
。
[0003]在实际的数据迁移场景中,经常会遇到数据更新和同步,此时并不需要传输整个文件,只需要传输“增量”部分即可
。
因此,为提高数据传输效率,出现了远程同步工具
rsync
,
rsync
在应用层算法方面进行了优化,实现了差异传输和增量传输
。
因此,
rsync
可以尽可能减少传输的数据量,并且兼容
SFTP
支持的功能,允许
SSH(Struts
,
Spring
,
Hibernate)
协议加密传输
。
但是,
...
【技术保护点】
【技术特征摘要】
1.
一种跨集群文件传输方法,其特征在于,所述方法包括:当接收到数据迁移指示时,调用主进程依次对待传输列表中的待传输文件进行自动切分,得到与所述待传输文件对应的至少一个子文件,所述待传输文件存储于第一集群;为每一个所述子文件分配线程,调用所述线程从预构建的连接池中获取与所述子文件对应的加密通道;调用所述线程创建传输子进程;采用并行方式调用所述传输子进程,按照对应的所述加密通道对所述子文件进行传输,以将所述待传输文件传输至第二集群中
。2.
根据权利要求1所述的方法,其特征在于,所述待传输列表的确定方式,包括:获取待传输文件夹;按照预设并行粒度遍历所述待传输文件夹,确定所述待传输文件;由所有所述待传输文件组成所述待传输文件列表
。3.
根据权利要求1或2所述的方法,其特征在于,所述调用主进程依次对待传输列表中的待传输文件进行自动切分,得到与所述待传输文件对应的至少一个子文件,包括:获取待传输文件的容量;将所述容量与预设阈值进行比较;当所述容量大于所述预设阈值时,调用所述主进程按照所述预设阈值对所述待传输文件进行切分,得到至少两个子文件;当所述容量小于或等于所述预设阈值时,调用所述主进程将所述待传输文件作为子文件
。4.
根据权利要求1所述的方法,其特征在于,在所述调用所述线程从预构建的连接池中获取与所述子文件对应的加密通道之前,所述方法还包括:调用所述线程对所述预构建的连接池加互斥锁
。5.
根据权利要求4所述的方法,其特征在于,在所述调用所述线程创建传输子进程之后,所述方法还包括:释放所述互斥锁;获取所述子文件的文件类型;基于所述文件类型,调用所述线程对所述子文件进行动态压缩;利用预置私钥对动态压缩后的文件进行加密,得到加密文件
。6.
根据权利要求1所述的方法,其特征在于,在所述采用并行方式调用所述传输子进程,通过所述加密通道对所述子文件进行传输的同时,所述方法还包括:调用所述线程实时获取并存储所述子文件传输过程中对应的传输记录;当接收到查询指令时,基于所述查询指令对所述传输记录进行提取<...
【专利技术属性】
技术研发人员:李俊哲,付振新,杨宏辉,樊春,马银萍,李若淼,
申请(专利权)人:北京大学长沙计算与数字经济研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。