一种森林压缩编码器的实现方法技术

技术编号：16878249 阅读：66 留言：0更新日期：2017-12-23 15:04

本发明专利技术公开了一种森林压缩编码器的实现方法，该方法基于决策树集成学习器实现，通过将输入放入已训练好的决策树集成学习器(随机森林或完全随机森林)，获取每棵树对应的叶子结点的标记数，从而获得编码；对已编码好的信号，通过反向回溯各棵决策树的决策路径，计算最大兼容规则，从而进行解码。森林压缩编码器一方面可以达到甚至超越深度神经网络自编码器的性能；另一方面，该装置可快速压缩输入信号，将压缩过的编码信号进行解码后，重构误差小，并且不需要额外的图形加速卡进行辅助运算以及容易确定参数的取值范围。

The implementation of a forest compression coder

The invention discloses a method for realizing forest compression encoder, the method based on decision tree ensemble learning is implemented through the input in the decision tree trained integrated learning device (random forest or completely random forest), for each tree leaf node corresponding to the standard notation, which has the signal encoding; good decision path encoding, backtracking the decision tree through the reverse, the calculation of the maximum compatibility rules, so as to decode. A forest compression encoder can achieve performance even beyond the depth of the neural network from the encoder; on the other hand, the device can quickly compress the input signal, the signal compression encoding decoding and reconstruction error is small, and does not require additional graphics cards for auxiliary operation and easy to determine the parameter range.

全部详细技术资料下载

【技术实现步骤摘要】
一种森林压缩编码器的实现方法
本专利技术涉及一种基于决策树集成的高效机器学习自编码器实现方法，称为森林压缩编码器，属于大规模数据下的人工智能与模式识别任务

技术介绍
自编码器是一类重要的深度学习模型，在图像理解，语音识别与自然语言处理等方面取得了广泛应用。其主要应用场景包括特征学习、降维、以及无监督学习等方面。现有的自编码器均基于神经网络实现，具有训练时间长、参数难确定，以及需要昂贵硬件进行辅助计算等不足。基于此，本专利技术提出了一种以决策树集成为基础的森林压缩编码器。该森林压缩编码器一方面可以达到甚至超越深度神经网络自编码器的性能；另一方面，该装置可快速压缩输入信号，将压缩过的编码信号进行解码后，重构误差小，并且不需要额外的图形加速卡进行辅助运算以及容易确定参数的取值范围。
技术实现思路
专利技术目的：针对现有技术中存在的问题与不足，本专利技术提供一种森林压缩编码器的实现方法。技术方案：一种森林压缩编码器的实现方法，基于决策树集成学习器实现，通过将输入放入已训练好的决策树集成学习器(随机森林或完全随机森林)，获取每棵树对应的叶子结点的标记数，从而获得编码；对已编码好的信号，通过反向回溯各棵决策树的决策路径，计算最大兼容规则，从而进行解码。森林压缩编码器针对训练数据，进行监督或无监督的决策树集成学习。其流程主要包括两个部分：(1)编码过程：将输入样本放进决策树集成器，获得每颗决策树对应的叶子结点序号，以该编号作为属于样本的编码输出。(2)解码过程：通过编码确定每颗决策树对应的决策路径，并分别计算每个决策路径所对应的二元决策规则序列。将所有决策规则序列...
一种森林压缩编码器的实现方法

【技术保护点】
一种森林压缩编码器的实现方法，其特征在于：基于决策树集成学习器实现，通过将输入放入已训练好的决策树集成学习器，获取每棵树对应的叶子结点的标记数，从而获得编码；对已编码好的信号，通过反向回溯各棵决策树的决策路径，计算最大兼容规则，从而进行解码。

【技术特征摘要】
1.一种森林压缩编码器的实现方法，其特征在于：基于决策树集成学习器实现，通过将输入放入已训练好的决策树集成学习器，获取每棵树对应的叶子结点的标记数，从而获得编码；对已编码好的信号，通过反向回溯各棵决策树的决策路径，计算最大兼容规则，从而进行解码。2.如权利要求1所述的森林压缩编码器的实现方法，其特征在于：进行监督或无监督的决策树集成学习。3.如权利要求1所述的森林压缩编码器的实现方法，其特征在于：森林压缩编码器的编码过程为：将输入样本放进决策树集成器，获得每颗决策树对应的叶子结点序号，以该编号作为属于样本的编码输出。4.如权利要求1所述的森林压缩编码器的实现方法，其特征在于：森林压缩编码器的解码过程为：通过编码确定每颗决策树对应的决策路径，并分别计算每个决策路径所对应的二元决策规则序列；将所有决策规则序列进...

【专利技术属性】
技术研发人员：周志华，冯霁，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人