The invention discloses a transmission method and system of a sparse data file to solve the problem that the transmission speed of the sparse data file is slow and the bandwidth is wasted seriously by the existing technology. The method includes: judging whether the current data file is a sparse data file, if the singular value of the sparse data file is decomposed to obtain the feature vector, the binary symbol is compressed to generate the compression feature vector and the compressed singular value of the feature vector, and the compressed feature vector is transmitted and described. Compress the singular value. The characteristic vector is obtained by the singular value decomposition of the sparse data file, the compressed feature vector and the singular value are transmitted, the transmission speed is improved and the bandwidth is saved.
【技术实现步骤摘要】
一种稀疏型数据文件的传输方法及系统
本专利技术涉及数据传输
,尤其涉及一种稀疏型数据文件的传输方法及系统。
技术介绍
稀疏文件是UNIX类和NTFS等文件系统的一个特性。开始时,一个稀疏文件不包含用户数据,也没有分配到用来存储用户数据的磁盘空间。当数据被写入稀疏文件时,NTFS逐渐地为其分配磁盘空间。一个稀疏文件有可能增长得很大。稀疏文件以64KB(不同文件系统不同)为单位增量增长,因此磁盘上稀疏文件的大小总是64KB的倍数。稀疏文件就是在文件中留有很多空余空间,留备将来插入数据使用。如果这些空余空间被ASCII码的NULL字符占据,并且这些空间相当大,那么,这个文件就被称为稀疏文件,而且,并不分配相应的磁盘块。在计算机科学方面,稀疏文件是文件系统中的一种文件存储方式,在创建一个文件的时候,就预先分配了文件需要的连续存储空间,其空间内部大多都还未被数据填充现在有很多文件系统都支持稀疏文件,包括大部分的Unix和NTFS。稀疏文件被普遍用来磁盘镜像,数据库快照,日志文件,还有其他科学运用上。现有技术对于稀疏型文件数据采用二进制符号的压缩方式后进行传输,文件的恢 ...
【技术保护点】
一种稀疏型数据文件的传输方法,其特征在于,包括步骤:判断当前数据文件是否为稀疏型数据文件,若是,对所述稀疏型数据文件进行奇异值分解以获得特征向量;对所述特征向量进行二进制符号的压缩以生成压缩特征向量及压缩奇异值;传输所述压缩特征向量及所述压缩奇异值。
【技术特征摘要】
1.一种稀疏型数据文件的传输方法,其特征在于,包括步骤:判断当前数据文件是否为稀疏型数据文件,若是,对所述稀疏型数据文件进行奇异值分解以获得特征向量;对所述特征向量进行二进制符号的压缩以生成压缩特征向量及压缩奇异值;传输所述压缩特征向量及所述压缩奇异值。2.根据权利要求1所述的一种稀疏型数据文件的传输方法,其特征在于,所述对所述稀疏型数据文件进行奇异值分解以获得特征向量的步骤具体包括:假设一个大小为m×n的矩阵A,AAT=PA1PT,ATA=QA2QT,则所述矩阵A的奇异值分解为:A=P∑QT;其中,矩阵的大小为m×m,列向量是AAT的特征向量;矩阵的大小为n×n;矩阵∑的大小为m×n,位于对角线上的元素为奇异值。3.根据权利要求1所述的一种稀疏型数据文件的传输方法,其特征在于,所述对所述特征向量进行二进制符号的压缩以生成压缩特征向量及压缩奇异值的步骤具体包括:通过哈夫曼编码对所述特...
【专利技术属性】
技术研发人员:夏德兴,王欣洁,
申请(专利权)人:横琴国际知识产权交易中心有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。