用户数据的修正方法技术

技术编号:16819233 阅读:25 留言:0更新日期:2017-12-16 12:42
本发明专利技术公开了一种用户数据的修正方法,根据医学指导信息和大数据信息,建立逻辑库;将个人信息数据带入逻辑库中,当个人信息的数据与逻辑库的参考数据不匹配时,则该数据为虚假数据;根据个人信息中的有效数据,对虚假数据进行推算,结合逻辑库获取虚假数据的最佳可能性结果;同时根据个人信息的有效数据对个人信息的缺失数据进行推断,结合逻辑库获取缺失数据的最佳可能性结果;当最佳可能性结果满足关联度需求时,将最佳可能性结果标记为推论数据;并提醒客户对推论数据进行完善。通过本发明专利技术,提高了虚假数据检验和修正的准确率以及缺失数据填充的准确率,保证用户数据的有效性。

User data correction method

The invention discloses a method for the correction of user data, according to the medical guidance information and data information, establish logical library; personal information data into logical library, reference data when personal information and data logic library does not match, the data for the false data; according to the data of personal information. The false data are calculated, the best possible results to obtain false data binding logic library; at the same time that according to the effective data of personal information of missing data on personal information, the best possible results to obtain the missing data with logic library; when the best possible correlation results meet the demand, will be the best possible results marked inference and data; to remind the customer data to improve the inference. Through the invention, the accuracy of false data inspection and correction and the accuracy of missing data filling are improved to ensure the effectiveness of the user's data.

【技术实现步骤摘要】
用户数据的修正方法
本专利技术涉及数据处理
,更具体地,涉及一种用户数据的修正方法。
技术介绍
随着社会经济的发展,人们膳食结构和生活习惯的改变,致使肥胖、高血压、糖尿病等疾病的发病率呈直线上升,因此疾病的有效预防成为社会各界最为关注的问题。根据世界卫生组织的研究报告,人类1/3的疾病能通过预防保健得以避免,1/3的疾病早期发现可以得到有效控制,1/3的疾病通过有效沟通可以提高治疗效果。对于疾病,治疗不是唯一的途径,通过健康管理有效预防、控制疾病并提升疾病治疗的效率才是人类健康的根本。现有技术多通过对搜集到的用户个人信息进行健康评估,以建立个性化的健康预防方案。然而,由于用户的个人信息数据在录入时易出现遗漏或错误等问题,导致搜集到的用户数据存在数据缺失、虚假数据或逻辑不符等问题。缺失数据和虚假数据不仅损害了数据的完整性、还会导致数据分析的结论出现偏差。为了避免出现这种情况往往会预先填充这些缺失的数据,然而传统的大数据补充/验证方法普遍存在缺失数据填充和虚假数据验证的准确率低的问题。因此,针对上述问题,本专利技术提供了一种用户数据的修正方法,提高虚假数据检验和修正的准确率以及缺失数据填充的准确率,保证用户数据的有效性。
技术实现思路
有鉴于此,本专利技术提供了一种用户数据的修正方法,提高虚假数据检验和修正的准确率以及缺失数据填充的准确率,保证用户数据的有效性。为了解决上述技术问题,本专利技术提出一种用户数据的修正方法,包括:根据医学指导信息和大数据信息,建立逻辑库;其中,所述逻辑库为常规因子与参考数据之间的关联度;获取用户的个人信息数据,将所述个人信息数据带入所述逻辑库中,检验所述个人信息数据是否与所述逻辑库中的参考数据相匹配;当所述个人信息的数据与所述逻辑库对应的参考数据相匹配时,则所述个人信息的数据为真实数据,并将所述数据标记为有效数据;当所述个人信息的数据与所述逻辑库对应的参考数据不匹配时,则所述个人信息的数据为虚假数据;根据所述个人信息中的有效数据,对所述虚假数据进行推算,获取至少一个所述虚假数据的可能性结果,将所述可能性结果带入所述逻辑库中,获取所述可能性结果与对应所述用户标签的关联度,并将所述关联度按照优先级排序,获得所述虚假数据的最佳可能性结果;设定所述最佳可能性结果与对应所述用户标签的关联度阈值,当获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当获取的所述最佳可能性结果与对应所述用户标签的关联度小于所述关联度阈值时,依据所述大数据信息对所述个人信息中的虚假数据进行推算,获取所述虚假数据的最佳可能性结果,将所述最佳可能性结果带入所述逻辑库,获取所述最佳可能性结果与对应所述用户标签的关联度,当所述关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当所述关联度小于所述关联度阈值时,则依据所述大数据信息对所述个人信息中的虚假数据进行再次推算,直到获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值为止。进一步地,还包括:当所述个人信息中存在数据缺失时,根据所述个人信息中的有效数据,对缺失数据进行推算,获取至少一个缺失数据的可能性结果,将所述可能性结果带入所述逻辑库中,获取所述可能性结果与对应所述用户标签的关联度,并将所述关联度按照优先级排序,获得所述缺失数据的最佳可能性结果;设定所述最佳可能性结果与对应所述用户标签的关联度阈值,当获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当获取的所述最佳可能性结果与对应所述用户标签的关联度小于所述关联度阈值时,依据所述大数据信息对所述个人信息中的缺失数据进行推算,获取所述缺失数据的最佳可能性结果,将所述最佳可能性结果带入所述逻辑库,获取所述最佳可能性结果与对应所述用户标签的关联度,当所述关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当所述关联度小于所述关联度阈值时,则依据所述大数据信息对所述个人信息中的缺失数据进行再次推算,直到获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值为止。进一步地,还包括:当所述用户未对所述推论数据做完善处理时,根据所述个人信息的有效数据及所述逻辑库定期对所述推论数据进行验证和修改。进一步地,还包括:当所述用户对所述推论数据进行修改完善后,将获得的最新数据再次放入所述逻辑库中,检验完善的所述最新数据是否与所述逻辑库中的参考数据相匹配;当所述最新数据与所述逻辑库中的参考数据相匹配时,则将所述最新数据标记为有效数据;当所述最新数据与所述逻辑库中的参考数据不匹配时,则所述最新数据为虚假数据。进一步地,还包括:动态监测所述医学指导信息和所述大数据信息的更新状态,根据更新后的所述医学指导信息和所述大数据信息,对所述逻辑库进行实时更新;更新后的所述逻辑库对所述个人信息的数据进行实时验证和修正。优选地,所述医学指导信息,进一步包括:佛明翰心血管事件风险评估模型、TIMI评分模型、汉密尔顿抑郁量表及中国糖尿病防治指南。优选地,所述大数据信息,进一步为:全球人口信息统计的大数据。优选地,所述关联度分为:直接关联和间接关联,所述直接关联包括:直接一级关联、直接二级关联和直接三级关联;所述间接关联包括:间接一级关联、间接二级关联和间接三级关联;其中,关联度的优先级关系为:直接一级关联大于直接二级关联大于直接三级关联大于间接一级关联大于间接二级关联大于间接三级关联。进一步地,所述个人信息,进一步包括:个人基本信息、个人主诉信息、个人健康信息和个人基因信息;其中,所述个人基本信息,包括:性别、年龄、身高、体重等自然情况类信息;所述个人主诉信息,包括:生活习惯、情绪、既往病史、现病史、过敏史、症状体征、家族史、化学因素、物理因素和社会因素;所述个人健康信息,包括:生化指标、影像数据、手术情况、病理切片和重大事件;所述个人基因信息,包括:疾病、药物和营养。与现有技术相比,本专利技术的一种用户数据的修正方法,实现了如下的有益效果:(1)本专利技术所述的一种用户数据的修正方法,通过建立逻辑库,依据大数据信息以及用户信息的有效数据,对用户数据进行校验,及时发现个人信息中的虚假数据,并对用户数据中的虚假数据和缺失数据进行及时修正和完善,保证用户数据的完整性和有效性。(2)本专利技术所述的一种用户数据的修正方法,及时更新医学指导信息和大数据信息,对逻辑库进行实时调整,进而提高对用户数据校验和填充的准确率,进一步提升了用户数据的有效性。当然,实施本专利技术的任一产品必不特定需要同时达到以上所述的所有技术效果。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1为本专利技术实施例1提供的用户数据的修正方法的流程示意图;图2为本专利技术实施例2提供的用户数据的修正方法的流程示意图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发本文档来自技高网...
用户数据的修正方法

【技术保护点】
一种用户数据的修正方法,其特征在于,包括:根据医学指导信息和大数据信息,建立逻辑库;其中,所述逻辑库为常规因子与参考数据之间的关联度;获取用户的个人信息数据,将所述个人信息数据带入所述逻辑库中,检验所述个人信息数据是否与所述逻辑库中的参考数据相匹配;当所述个人信息的数据与所述逻辑库对应的参考数据相匹配时,则所述个人信息的数据为真实数据,并将所述数据标记为有效数据;当所述个人信息的数据与所述逻辑库对应的参考数据不匹配时,则所述个人信息的数据为虚假数据;根据所述个人信息中的有效数据,对所述虚假数据进行推算,获取至少一个所述虚假数据的可能性结果,将所述可能性结果带入所述逻辑库中,获取所述可能性结果与对应所述用户标签的关联度,并将所述关联度按照优先级排序,获得所述虚假数据的最佳可能性结果;设定所述最佳可能性结果与对应所述用户标签的关联度阈值,当获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当获取的所述最佳可能性结果与对应所述用户标签的关联度小于所述关联度阈值时,依据所述大数据信息对所述个人信息中的虚假数据进行推算,获取所述虚假数据的最佳可能性结果,将所述最佳可能性结果带入所述逻辑库,获取所述最佳可能性结果与对应所述用户标签的关联度,当所述关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当所述关联度小于所述关联度阈值时,则依据所述大数据信息对所述个人信息中的虚假数据进行再次推算,直到获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值为止。...

【技术特征摘要】
1.一种用户数据的修正方法,其特征在于,包括:根据医学指导信息和大数据信息,建立逻辑库;其中,所述逻辑库为常规因子与参考数据之间的关联度;获取用户的个人信息数据,将所述个人信息数据带入所述逻辑库中,检验所述个人信息数据是否与所述逻辑库中的参考数据相匹配;当所述个人信息的数据与所述逻辑库对应的参考数据相匹配时,则所述个人信息的数据为真实数据,并将所述数据标记为有效数据;当所述个人信息的数据与所述逻辑库对应的参考数据不匹配时,则所述个人信息的数据为虚假数据;根据所述个人信息中的有效数据,对所述虚假数据进行推算,获取至少一个所述虚假数据的可能性结果,将所述可能性结果带入所述逻辑库中,获取所述可能性结果与对应所述用户标签的关联度,并将所述关联度按照优先级排序,获得所述虚假数据的最佳可能性结果;设定所述最佳可能性结果与对应所述用户标签的关联度阈值,当获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当获取的所述最佳可能性结果与对应所述用户标签的关联度小于所述关联度阈值时,依据所述大数据信息对所述个人信息中的虚假数据进行推算,获取所述虚假数据的最佳可能性结果,将所述最佳可能性结果带入所述逻辑库,获取所述最佳可能性结果与对应所述用户标签的关联度,当所述关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当所述关联度小于所述关联度阈值时,则依据所述大数据信息对所述个人信息中的虚假数据进行再次推算,直到获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值为止。2.根据权利要求1所述的用户数据的修正方法,其特征在于,还包括:当所述个人信息中存在数据缺失时,根据所述个人信息中的有效数据,对缺失数据进行推算,获取至少一个缺失数据的可能性结果,将所述可能性结果带入所述逻辑库中,获取所述可能性结果与对应所述用户标签的关联度,并将所述关联度按照优先级排序,获得所述缺失数据的最佳可能性结果;当获取的所述最佳可能性结果与对应所述用户标签的关联度大于等于所述关联度阈值时,将所述最佳可能性结果标记为推论数据;当获取的所述最佳可能性结果与对应所述用户标签的关联度小于所述关联度阈值时,依据所述大数据信息对所述个人信息中的缺失数据进行推算,获取所述缺失数据的最佳可能性结果,将所述最佳可能性结果带入所述逻辑库,获取所述最佳可能性结果与对应所述用户标签的关联度,当所述关...

【专利技术属性】
技术研发人员:姜涵予
申请(专利权)人:北斗云谷北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1