文件传输方法、装置、系统、电子设备及存储介质制造方法及图纸

技术编号:36883200 阅读:11 留言:0更新日期:2023-03-15 21:19
本发明专利技术公开一种文件传输方法、装置、系统、电子设备及存储介质,该方法应用于数据消费端,包括:从分布式数据库获取多个文件切片中每个文件切片的元数据,多个文件切片和每个文件切片的元数据由数据生产端对原始文件进行切分处理得到;根据每个文件切片的元数据从消息发布与订阅系统的主题分区获取匹配的文件切片,得到多个文件切片;创建文件处理流,并利用文件处理流根据每个文件切片的元数据将多个文件切片合并,得到目标文件。即本发明专利技术可以将大文件切片,将文件切片通过消息发布与订阅系统传输,将文件切片的元数据存储在分布式数据库中,借助文件切分技术和分布式数据库实现了利用消息发布与订阅系统传输大文件,提高了文件传输效率。文件传输效率。文件传输效率。

【技术实现步骤摘要】
文件传输方法、装置、系统、电子设备及存储介质


[0001]本专利技术涉及数据传输技术,尤其涉及一种文件传输方法、装置、系统、电子设备及存储介质。

技术介绍

[0002]Kafka是一种分布式消息发布与订阅系统,它具有高吞吐量、低延时、可用性高等优点。Kafka传输的一般为日志类的结构化数据,Kafka默认传输的每条数据大小不超过1MB,这导致比较大二进制文件(比如视频、图片、压缩包等)无法通过Kafka进行传输。

技术实现思路

[0003]本专利技术提供一种文件传输方法、装置、系统、电子设备及存储介质,能够实现利用消息发布与订阅系统传输大文件,提高了文件传输效率。
[0004]第一方面,本专利技术提供一种文件传输方法,应用于数据消费端,所述方法包括:
[0005]从分布式数据库获取多个文件切片中每个文件切片的元数据,所述多个文件切片和所述每个文件切片的元数据由数据生产端对原始文件进行切分处理得到;
[0006]根据所述每个文件切片的元数据从消息发布与订阅系统的主题分区获取所述多个文件切片;
[0007]创建文件处理流,并利用所述文件处理流根据所述每个文件切片的元数据将所述多个文件切片合并,得到目标文件。
[0008]第二方面,本专利技术提供一种文件传输方法,应用于数据生产端,所述方法包括:
[0009]获取原始文件,并将所述原始文件进行切分处理,得到多个文件切片和每个文件切片的元数据;
[0010]将所述多个文件切片发送至消息发布与订阅系统的主题分区,并将所述每个文件切片的元数据存入分布式数据库,以使得数据消费端在从所述分布式数据库获取所述每个文件切片的元数据并从所述主题分区获取所述多个文件切片之后,根据所述每个文件切片的元数据将所述多个文件切片合并,从而得到目标文件。
[0011]第三方面,本专利技术提供一种文件传输装置,应用于数据消费端,所述装置包括:
[0012]第一获取模块,用于从分布式数据库获取多个文件切片中每个文件切片的元数据,所述多个文件切片和所述每个文件切片的元数据由数据生产端对原始文件进行切分处理得到;
[0013]第二获取模块,用于根据所述每个文件切片的元数据从消息发布与订阅系统的主题分区获取所述多个文件切片;
[0014]合并模块,用于创建文件处理流,并利用所述文件处理流根据所述每个文件切片的元数据将所述多个文件切片合并,得到目标文件。
[0015]第四方面,本专利技术提供一种文件传输装置,应用于数据生产端,所述装置包括:
[0016]切分模块,用于获取原始文件,并将所述原始文件进行切分处理,得到多个文件切
片和每个文件切片的元数据;
[0017]发送模块,用于将所述多个文件切片发送至消息发布与订阅系统的主题分区;
[0018]存储模块,用于将所述每个文件切片的元数据存入分布式数据库,以使得数据消费端在从所述分布式数据库获取所述每个文件切片的元数据并从所述主题分区获取所述多个文件切片之后,根据所述每个文件切片的元数据将所述多个文件切片合并,从而得到目标文件。
[0019]第五方面,本专利技术提供一种文件传输系统,包括用于执行本专利技术任一实施例所述的文件传输方法的数据消费端和数据生产端。
[0020]第六方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术任一实施例所述的文件传输方法。
[0021]第七方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任一实施例所述的文件传输方法。
[0022]本专利技术的方案中,可以从分布式数据库获取多个文件切片中每个文件切片的元数据,多个文件切片和每个文件切片的元数据由数据生产端对原始文件进行切分处理得到;根据每个文件切片的元数据从消息发布与订阅系统的主题分区获取多个文件切片;创建文件处理流,并利用文件处理流根据每个文件切片的元数据将多个文件切片合并,得到目标文件。即本专利技术可以将大文件切片,将文件切片通过消息发布与订阅系统传输,将文件切片的元数据存储在分布式数据库中,数据消费端可以根据从分布式数据库获取的元数据从消息发布与订阅系统获取文件切片,对文件切片合并即可得到所需的目标文件,从而借助文件切分技术和分布式数据库实现了利用消息发布与订阅系统传输大文件,提高了文件传输效率。
附图说明
[0023]为了更清楚地说明本专利技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0024]图1是本专利技术提供的文件传输方法的一个流程示意图;
[0025]图2是本专利技术提供的文件传输方法的另一流程示意图;
[0026]图3是本专利技术提供的文件传输方法的另一流程示意图;
[0027]图4是本专利技术提供的文件传输方法的示例性流程图;
[0028]图5是本专利技术提供的文件传输装置的一个结构示意图;
[0029]图6是本专利技术提供的文件传输装置的另一个结构示意图;
[0030]图7是本专利技术提供的电子设备的一个结构示意图。
具体实施方式
[0031]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是
本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0032]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]图1是本专利技术提供的文件传输方法的一个流程示意图,该方法可以由本专利技术提供的文件传输装置来执行,该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中,该装置可以集成在数据消费端,具体地,可以集成在数据消费端的电子设备中,电子设备比如可以是计算机。以下实施例将以该装置集成在数据消费端的电子设备中为例进行说明。
[0034]在介绍数据消费端的处理过程之前,先介绍一下数据生产端的处理过程,具体可以如下:
[0035]本实施例中,数据生产端待传输的文件可以是视频、图片、压缩包等大文件,待传本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件传输方法,其特征在于,应用于数据消费端,所述方法包括:从分布式数据库获取多个文件切片中每个文件切片的元数据,所述多个文件切片和所述每个文件切片的元数据由数据生产端对原始文件进行切分处理得到;根据所述每个文件切片的元数据从消息发布与订阅系统的主题分区获取匹配的文件切片,得到所述多个文件切片;创建文件处理流,并利用所述文件处理流根据所述每个文件切片的元数据将所述多个文件切片合并,得到目标文件。2.根据权利要求1所述的文件传输方法,其特征在于,在从分布式数据库获取多个文件切片中每个文件切片的元数据之前,还包括:查询所述分布式数据库获取多个文件的信息摘要码;将所述多个文件的信息摘要码写入预设集合,得到原始摘要码集合;对所述原始摘要码集合进行去重处理,得到目标摘要码集合。3.根据权利要求2所述的文件传输方法,其特征在于,所述从分布式数据库获取多个文件切片中每个文件切片的元数据,包括:从所述目标摘要码集合中识别出所述原始文件的信息摘要码;根据所述原始文件的信息摘要码从所述分布式数据库获取多个文件切片中每个文件切片的元数据。4.根据权利要求1所述的文件传输方法,其特征在于,所述元数据中包括对应文件切片的序列号和对应文件切片在所述主题分区的偏移量,所述根据所述每个文件切片的元数据从消息发布与订阅系统的主题分区获取匹配的文件切片,得到所述多个文件切片,包括:根据所述每个文件切片的序列号查找对应文件切片在所述主题分区的偏移量;根据所述每个文件切片在所述主题分区的偏移量从所述主题分区获取匹配的文件切片,得到所述多个文件切片。5.根据权利要求4所述的文件传输方法,其特征在于,所述元数据中还包括对应文件切片的信息摘要码,在利用所述文件处理流根据所述每个文件切片的元数据将所述多个文件切片合并之前,还包括:根据所述元数据中包括的对应文件切片的信息摘要码对所述多个文件切片进行校验;在所述多个文件切片均校验通过时,触发执行利用所述文件处理流根据所述每个文件切片的元数据将所述多个文件切片合并的步骤。6.根据权利要求4所述的文件传输方法,其特征在于,所述利用所述文件处理流根据所述每个文件切片的元数据将所述多个文件切片合并,得到目标文件,包括:利用所述文件处理流根据所述每个文件切片的序列号将所述多个文件切片中的数据写入指定文件,得到所述目标文件。7.根据权利要求3所述的文件传输方法,其特征在于,所述方法还包...

【专利技术属性】
技术研发人员:官祥臻王钰涵赵天武桂林
申请(专利权)人:卡奥斯工业智能研究院青岛有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1