数据评价方法及装置、存储介质及电子设备制造方法及图纸

技术编号:17563605 阅读:60 留言:0更新日期:2018-03-28 13:38
本发明专利技术公开了一种数据评价方法及装置、存储介质及电子设备,涉及数据处理技术领域。该数据评价方法包括:确定数据中的关键信息;获取预设数量个数据样本并提供给评分人员以便所述评分人员对各所述数据样本进行评分,得到各所述数据样本的评分结果;判断各所述数据样本是否存在所述关键信息并根据判断结果生成针对各数据样本的关键信息向量;通过回归算法对所述评分结果和所述关键信息向量进行训练以生成训练模型;以及获取待评价数据并针对所述待评价数据运行所述训练模型,以得到所述待评价数据的评分结果作为评价结果。本公开在可以减少人工参与过程的同时,数据评价的稳定性和效率得到了提高。

Data evaluation methods and devices, storage media and electronic equipment

The invention discloses a data evaluation method and device, a storage medium and an electronic device, which relates to the field of data processing technology. Including the evaluation method of the data: determine the key information in data acquisition; a preset number of data samples and provide the personnel staff to score score score for each of the sample data, the sample data obtained the grading results of each data sample; judge whether or not there is the key information according to the judgment result generated for each the sample data of key information vector; through regression algorithm of evaluation and the key information of the training vector to generate training model; and to acquire the evaluation data and for the evaluation of data run the training model, in order to get the evaluation data as a result of the evaluation score results. While this disclosure can reduce the process of manual participation, the stability and efficiency of data evaluation has been improved.

【技术实现步骤摘要】
数据评价方法及装置、存储介质及电子设备
本公开涉及数据处理
,具体而言,涉及一种数据评价方法、数据评价装置、存储介质及电子设备。
技术介绍
随着信息化社会的发展,大数据理念已经渗入到各行各业中。在大数据领域中,如何整理出信息完整且有针对性的数据已成为大数据分析的关键,在此过程中,需要对数据进行评价以确定数据是否能够较好地满足分析要求。以医疗行业中病历数据为例,随着医院的患者数据越来越多,为了更好地利用历史治疗经验,对病历数据进行归纳、总结、整理越来越重要。然而,目前医院对病历数据的整理工作,主要由相关人员(例如,病案室的工作人员)进行人工整理,归类,一方面,这种数据整理需要持续不断的人力投入,效率较低;另一方面,相关人员由于其专业领域的限制,难以面向各种疾病以专业的角度评价病历数据。鉴于此,需要一种数据评价方法、数据评价装置、存储介质及电子设备。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种数据评价方法、数据评价装置、存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本公开的一个方面,提供一种数据评价方法,包括:确定数据中的关键信息;获取预设数量个数据样本并提供给评分人员以便所述评分人员对各所述数据样本进行评分,得到各所述数据样本的评分结果;判断各所述数据样本是否存在所述关键信息并根据判断结果生成针对各数据样本的关键信息向量;通过回归算法对所述评分结果和所述关键信息向量进行训练以生成训练模型;以及获取待评价数据并针对所述待评价数据运行所述训练模型,以得到所述待评价数据的评分结果作为评价结果。在本公开的一种示例性实施例中,通过回归算法对所述评分结果和所述关键信息向量进行训练包括:通过回归算法对各所述数据样本的所述评分结果和所述关键信息向量进行拟合分析以得到各所述数据样本的得分;根据各所述数据样本的所述评分结果并结合各所述数据样本的得分确定对评分进行分档的得分阈值。在本公开的一种示例性实施例中,所述关键信息包含第一关键信息和/或第二关键信息;其中,所述第一关键信息包含基于数据完整性的信息,所述第二关键信息包含与评价维度对应的指标信息。在本公开的一种示例性实施例中,确定数据中的关键信息包括:根据预设数据规范确定所述第一关键信息;以及/或者将所述评分人员指定的指标信息确定为所述第二关键信息。根据本公开的一个方面,提供一种数据评价装置,包括:关键信息确定模块,用于确定数据中的关键信息;数据样本评分模块,用于获取预设数量个数据样本并提供给评分人员以便所述评分人员对各所述数据样本进行评分,得到各所述数据样本的评分结果;关键信息向量生成模块,用于判断各所述数据样本是否存在所述关键信息并根据判断结果生成针对各数据样本的关键信息向量;训练模型生成模块,用于通过回归算法对所述评分结果和所述关键信息向量进行训练以生成训练模型;以及数据评价模块,用于获取待评价数据并针对所述待评价数据运行所述训练模型,以得到所述待评价数据的评分结果作为评价结果。在本公开的一种示例性实施例中,所述训练模型生成模块包括:得分获取单元,用于通过回归算法对各所述数据样本的所述评分结果和所述关键信息向量进行拟合分析以得到各所述数据样本的得分;得分阈值确定单元,用于根据各所述数据样本的所述评分结果并结合各所述数据样本的得分确定对评分进行分档的得分阈值。在本公开的一种示例性实施例中,所述关键信息包含第一关键信息和/或第二关键信息;其中,所述第一关键信息包含基于数据完整性的信息,所述第二关键信息包含与评价维度对应的指标信息。在本公开的一种示例性实施例中,所述关键信息确定模块包括:第一关键信息确定单元,用于根据预设数据规范确定所述第一关键信息;以及/或者第二关键信息确定单元,用于将所述评分人员指定的指标信息确定为所述第二关键信息。根据本公开的一个方面,提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的数据评价方法。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的数据评价方法。在本公开的一些实施例所提供的技术方案中,获取数据样本的评分结果并生成数据样本的关键信息向量,通过回归算法对数据样本的评分结果和关键信息向量进行训练,并根据生成的训练模型对待评价数据进行评价,一方面,在评分人员人为对数据样本进行评分后,本方案不再存在人为参与的过程,解决了现有技术中需要人为不断进行数据评价的问题;另一方面,由于减少了人为参与的过程,因此,可以减少由于评分人员主观因素带来的数据评价不稳定的问题;再一方面,由于减少了人为参与,可以提高数据评价的效率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1示意性示出了根据本公开的示例性实施方式的数据评价方法的流程图;图2示意性示出了根据本公开的示例性实施方式的数据评价方法的一个实施例的整个过程的流程图;图3示意性示出了根据本公开的示例性实施方式的数据评价装置的方框图;图4示意性示出了根据本公开的示例性实施方式的训练模型生成模块的方框图;图5示意性示出了根据本公开的示例性实施方式的关键信息确定模块的方框图;图6示出了根据本公开的示例性实施方式的存储介质的示意图;以及图7示意性示出了根据本公开的示例性实施方式的电子设备的方框图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情本文档来自技高网...
数据评价方法及装置、存储介质及电子设备

【技术保护点】
一种数据评价方法,其特征在于,包括:确定数据中的关键信息;获取预设数量个数据样本并提供给评分人员以便所述评分人员对各所述数据样本进行评分,得到各所述数据样本的评分结果;判断各所述数据样本是否存在所述关键信息并根据判断结果生成针对各数据样本的关键信息向量;通过回归算法对所述评分结果和所述关键信息向量进行训练以生成训练模型;以及获取待评价数据并针对所述待评价数据运行所述训练模型,以得到所述待评价数据的评分结果作为评价结果。

【技术特征摘要】
1.一种数据评价方法,其特征在于,包括:确定数据中的关键信息;获取预设数量个数据样本并提供给评分人员以便所述评分人员对各所述数据样本进行评分,得到各所述数据样本的评分结果;判断各所述数据样本是否存在所述关键信息并根据判断结果生成针对各数据样本的关键信息向量;通过回归算法对所述评分结果和所述关键信息向量进行训练以生成训练模型;以及获取待评价数据并针对所述待评价数据运行所述训练模型,以得到所述待评价数据的评分结果作为评价结果。2.根据权利要求1所述的数据评价方法,其特征在于,通过回归算法对所述评分结果和所述关键信息向量进行训练包括:通过回归算法对各所述数据样本的所述评分结果和所述关键信息向量进行拟合分析以得到各所述数据样本的得分;根据各所述数据样本的所述评分结果并结合各所述数据样本的得分确定对评分进行分档的得分阈值。3.根据权利要求1或2所述的数据评价方法,其特征在于,所述关键信息包含第一关键信息和/或第二关键信息;其中,所述第一关键信息包含基于数据完整性的信息,所述第二关键信息包含与评价维度对应的指标信息。4.根据权利要求3所述的数据评价方法,其特征在于,确定数据中的关键信息包括:根据预设数据规范确定所述第一关键信息;以及/或者将所述评分人员指定的指标信息确定为所述第二关键信息。5.一种数据评价装置,其特征在于,包括:关键信息确定模块,用于确定数据中的关键信息;数据样本评分模块,用于获取预设数量个数据样本并提供给评分人员以便所述评分人员对各所述数据样本进行评分,得到各所述数据样本的评分结果;关键信息向量生成模块,...

【专利技术属性】
技术研发人员:杜硕
申请(专利权)人:医渡云北京技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1