平衡数据建模中的起源和准确性权衡的方法和系统技术方案

技术编号：11639227 阅读：103 留言：0更新日期：2015-06-24 14:49

本发明专利技术涉及一种平衡数据建模中的起源和准确性权衡的方法和系统。生成数据模型可以包括接收原始数据集，以及基于所述原始数据集的第一特性集生成第一库，基于所述第一库的特性的聚合生成具有第二特性集的第二库，以及基于所述第一和第二特性集生成具有第三特性集的第三库。可以基于所述模型的准确性和起源之间的权衡，生成所述数据模型。

全部详细技术资料下载

【技术实现步骤摘要】

本公开一般地涉及计算机化建模，更具体地说，涉及大型分析模型。
技术介绍
计算机化数据建模可以用于促进更好地理解大型数据集。数据建模技术的应用很广泛，并且可以包括金融、保险、医疗保健、教育等领域。尽管在创建分析模型中收集信息是一项挑战，但同样重要的挑战是呈现信息以使其有用的方式。
技术实现思路
本专利技术的各实施例提供一种用于生成计算机化分析模型的方法、系统和计算机程序产品，所述计算机化分析模型接收具有定义的第一特性集的原始数据集。基于将领域知识集应用于所述第一特性集，定义第二特性集，以及基于所述第一和第二特性集的特性之间的关系，生成特性层次结构。从所述特性层次结构中选择特性集，其中将所述第二特性集的尽可能多的特性结合到所述分析模型中，同时维持定义的准确性值。基于所选择的特性集，生成计算机化分析模型。【附图说明】图IA是根据本公开的一个实施例的数据建模环境的组件的示意框图；图IB是示出根据本公开的一个实施例的图IA的数据建模环境的选择组件的示意框图；图2示出根据本公开的一个实施例的示例性特性层次结构；图3A是根据本公开的一个实施例的特性层次结构的示意框图；图3B是根据本公开的一个实施例的决策树模型的示意框图；图4A是示出根据本公开的一个实施例的用于生成分析模型的方法的步骤的流程图；图4B是示出根据本公开的一个实施例的图4A的方法的其它步骤的流程图；图5是根据本公开的一个实施例的计算机系统的示意框图；图6是根据本公开的一个实施例的示例性云计算环境的框图；以及图7是根据本公开的一个实施例的图6的示例性云计算环...
<a href="http://www.xjishu.com/zhuanli/55/CN104731843.html" title="平衡数据建模中的起源和准确性权衡的方法和系统原文来自X技术">平衡数据建模中的起源和准确性权衡的方法和系统</a>

【技术保护点】
一种用于生成分析模型的计算机实现的方法，所述方法包括：接收具有定义的第一特性集的数据集；基于将领域知识数据集应用于所述第一特性集，定义第二特性集；基于所述第一和第二特性集的特性之间的关系，生成特性层次结构；以及基于从所述特性层次结构中选择特性，生成分析模型，其中所述分析模型包括在维持定义的准确性值时最高数量的所述第二特性集的特性。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：C·古特曼，孙行智，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人