用于管理含有具有缺失值的记录的数据库的方法和系统技术方案

技术编号：11307868 阅读：73 留言：0更新日期：2015-04-16 03:31

提供一种方法，所述方法包括：从数据集中选择包括缺失值的目标记录；将数据集的记录划分成为包括互相关数据的至少两个组，所述划分后记录包括具有与目标记录中的缺失值相同字段的值的记录，基于与划分后记录相关联的所述至少两个组中的每一个中的字段之间的关系预测缺失值，以及将目标记录的缺失值设置为该预测值。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】提供一种方法，所述方法包括：从数据集中选择包括缺失值的目标记录；将数据集的记录划分成为包括互相关数据的至少两个组，所述划分后记录包括具有与目标记录中的缺失值相同字段的值的记录，基于与划分后记录相关联的所述至少两个组中的每一个中的字段之间的关系预测缺失值，以及将目标记录的缺失值设置为该预测值。【专利说明】用于管理含有具有缺失值的记录的数据库的方法和系统
实施例涉及管理含有具有缺失值（missing value)的记录的数据库。更具体地，实施例涉及输入用于记录中的缺失值的值。
技术介绍
在数据库（或其他数据存储，例如XML文件）的任一数据集（例如，数据表或查询结果）中，存在含有具有缺失值的记录（或记录集）的条目的可能性。例如，因为在数据收集的时间该值未知，所以收集的数据可以是缺失值。例如，在基于数据的分析或研究中，缺失数据影响数据的质量。作为一个例子，个人健康记录（PHR)数据库在促进医学和灾害研究中扮演重要角色，并且提供用于个人保健的分析服务。例如，PHR可以根据来自数据库的历史数据来提供个人的健康分析。在各种类型的健康促进机构中，历史数据可以为顾问和指导员提供支持。此外，可以通过PHR分析来安排和提醒通过健身巡回医疗带来的健康养护周期。此外，数据可用于创建用于推荐最佳健身计划或健康每日菜单的预测模型。通常，可以基于三个主要的方法来收集PHR数据：来自个人体重计的每日健康记录，来自健身中心的顾客记录以及来自大学和研究中心的统计数据库。然而，缺失值发生在PHR数据库中，在收集用于所有人的完整数...

【技术保护点】
一种方法，包括：从数据集中选择包括缺失值的目标记录；将数据集的记录划分成为包括互相关数据的至少两组，划分后的记录包括具有与目标记录中的缺失值相同字段的值的记录；基于与划分后记录相关联的至少两个组中的每一个中的字段之间的关系来预测缺失值；以及将目标记录的缺失值设置为预测值。

【技术特征摘要】

【专利技术属性】
技术研发人员：黎文宪，程羽，
申请(专利权)人：SAP欧洲公司，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人