一种二次判别函数分类器存储空间的压缩方法技术

技术编号:14273601 阅读:115 留言:0更新日期:2016-12-23 18:16
本发明专利技术公开了一种二次判别函数分类器存储空间的压缩方法,包括:多字典学习,将二次判别函数分类器所存储的特征向量这一参数平均分成若干份,每一份特征向量学习一个字典,不同份的特征向量则学习不同的字典;稀疏编码,结合已学习得到的多个字典对二次判别函数分类器存储的特征向量进行稀疏编码,在存储稀疏编码时,只存储非零编码及指示下标。本发明专利技术不仅能保证二次判别函数分类器仍然保持有较高的分类精度,而且大大减少了二次判别函数分类器的存储空间。

【技术实现步骤摘要】

本专利技术涉及数据压缩
,特别涉及一种二次判别函数分类器所存储的参数的压缩方法。
技术介绍
二次判别函数分类器被广泛地运用于数量较大,且类别较多的数据中,并对这些数据进行分类处理。特别是在对手写中文汉字单字图像的分类上有着非常重大的贡献。在所有距离分类器当中,二次判别函数分类器在对手写中文汉字单字图像的分类上分类效果最佳。但是,随着数据类别的增大,二次判别函数分类器需要存储大量的参数,即所占用的存储空间会随之增大。比如,在对手写中文汉字单字图像数据库CASIA-HWDB1.1的样本进行分类时,二次判别函数分类器需要占用大约140MB的存储空间。这样的分类器不适合广泛地应运于目前正在飞速发展和流行的移动设备当中,因为移动设备的存储空间仍然是非常有限的。近年来,有学者对二次判别函数分类器的存储参数进行研究,提出了不同的压缩方法,比如向量量化技术或参数聚类方法等。虽然这些方法极大的降低了二次判别函数分类器的存储空间大小,但同时二次判别函数的分类效果也受到了比较严重的影响。为此,许多学者仍然致力于研究在压缩数据的同时,尽可能的减少由于数据压缩而造成的原有精度的损失的方法。其中,稀疏编码在对大类别数据的分析上取得了非常好的效果,并被广泛应运于数据分类,压缩或去噪等方面。
技术实现思路
本专利技术的目的是针对现有技术的不足而提供的一种二次判别函数分类器存储空间的压缩方法,该方法降低了二次判别函数分类器的存储空间大小,同时也能够保证二次判别函数分类器仍然保持有较高的分类精度。本专利技术的目的是这样实现的:一种二次判别函数分类器存储空间的压缩方法,该方法包括以下具体步骤:步骤1:多字典学习将二次判别函数分类器所存储的特征向量这一参数平均分成若干份,每一份特征向量学习一个字典,不同份的特征向量则学习不同的字典;步骤2:稀疏编码结合已学习得到的多个字典对二次判别函数分类器存储的特征向量进行稀疏编码,在存储稀疏编码时,只存储非零编码及指示下标;其中,步骤1所述将二次判别函数分类器所存储的特征向量这一参数平均分成若干份是:将二次判别函数分类器所存储的特征向量这一参数平均分成K份,K等于二次判别函数分类器对每一类数据所存储的特征向量的数目,在不同类的数据中,相同序列的特征向量为一份,用于学习同一字典,不同序列的特征向量则用于学习不同的字典;其中,步骤2所述只存储非零编码及指示下标是:除了存储非零编码,用于指示某个编码是否为零的下标也需要进行存储。用下标ι∈{0,1本文档来自技高网...
一种二次判别函数分类器存储空间的压缩方法

【技术保护点】
一种二次判别函数分类器存储空间的压缩方法,其特征在于,该方法包括以下具体步骤:步骤1:多字典学习将二次判别函数分类器所存储的特征向量这一参数平均分成若干份,每一份特征向量学习一个字典,不同份的特征向量则学习不同的字典;步骤2:稀疏编码结合已学习得到的多个字典对二次判别函数分类器存储的特征向量进行稀疏编码,在存储稀疏编码时,只存储非零编码及指示下标。

【技术特征摘要】
1.一种二次判别函数分类器存储空间的压缩方法,其特征在于,该方法包括以下具体步骤:步骤1:多字典学习将二次判别函数分类器所存储的特征向量这一参数平均分成若干份,每一份特征向量学习一个字典,不同份的特征向量则学习不同的字典;步骤2:稀疏编码结合已学习得到的多个字典对二次判别函数分类器存储的特征向量进行稀疏编码,在存储稀疏编码时,只存储非零编码及指示下标。2.如权利要求1所述的二次判别函数分类器存储空间的压缩方法,其特征在于,步骤1所述将二次判别函数分类...

【专利技术属性】
技术研发人员:吕岳韦箫华吕淑静
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1