数据分析系统以及方法技术方案

技术编号：13145674 阅读：127 留言：0更新日期：2016-04-10 08:59

本发明专利技术提供一种数据分析系统以及方法，包括模型建立单元、特征撷取单元、处理单元以及输出单元。模型建立单元利用训练数据通过机器学习演算法建立预测模型。特征撷取单元撷取输入数据的多个特征数据，并将特征数据分类为多个群组。处理单元利用群组之一所对应的特征数据，并通过机器学习演算法取得输入数据对应于预测模型的机率值，并判断机率值。当机率值小于既定值时，则选取未被选取群组之一所对应的特征数据通过机器学习演算法，更新输入数据对应于预测模型的机率值，当机率值大于或等于既定值，则根据机率值分类输入数据。输出单元输出分类结果。本发明专利技术根据输入数据的特征值的权重将部分特征值输入机器学习演算法中，提高了数据处理效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是有关于一种数据分析系统及方法，特别是有关于一种根据输入数据的不同特征值，更新输入数据与预测模型间的机率值。
技术介绍
随着科技的进步，我们已有能力将大量数据转换为有意义的信息，并利用特定的演算法进行行为的预测。而通过机器学习演算法的运作，我们可以根据数据的数据建立一样版模型，再借由判断输入数据与样版模型的关联性来分类输入数据类型。由于预测准确度与演算法的复杂度有关，因此为了维持预测的准确度，演算法的计算通常需要大量数据以及时间。因此，如何在维持预测准确度的条件下，提升演算法运作效率为目前使用者所需解决之问题。
技术实现思路
本专利技术的目的在于提供一种数据分析系统，以在维持预测准确度的条件下，提升演算法运作效率。本专利技术一实施例提供的数据分析系统，包括一模型建立单元、一特征擷取单元、一处理单元以及一输出单元。模型建立单元利用一训练数据通过一机器学习演算法建立一预测模型。特征擷取单元擷取输入数据的多个特征数据，并将特征数据分类为多个群组。处理单元利用群组之一所对应的特征数据通过机器学习演算法取得输入数据对应于预测模型的机率值，并判断机率值。当机率值小于一既定值时，则选取未选取群组之一所对应的特征数据通过机器学习演算法更新输入数据对应于预测模型的机率值，当机率值大于或等于既定值，则根据机率值分类输入数据。输出单元输出一分类结果。本专利技术另一实施例提供一种数据分析方法，步骤包括:利用一训练数据通过一机器学习演算法建立一预测模型；接收一笔输入数据，其中输入数据具有多个特征数据；擷取输入数据的特征数据，并将特征数据分类为多个群组；选取群组之...

【技术保护点】
一种数据分析系统，其特征在于，包括：一模型建立单元，利用一训练数据通过一机器学习演算法建立一预测模型；一特征撷取单元，撷取一输入数据的多个特征数据，并将所述特征数据分类为多个群组；一处理单元，利用所述群组之一所对应的所述特征数据通过所述机器学习演算法取得所述输入数据对应于所述预测模型的一机率值，并判断所述机率值，其中当所述机率值小于一既定值时，则选取未选取的所述群组之一所对应的所述特征数据通过所述机器学习演算法更新所述输入数据对应于所述预测模型的所述机率值，当所述机率值大于或等于所述既定值，则根据所述机率值分类所述输入数据；以及一输出单元，输出一分类结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：张锡嘉，廖彦钦，
申请(专利权)人：华邦电子股份有限公司，
类型：发明
国别省市：中国台湾;71

全部详细技术资料下载我是这个专利的主人