数据结构化评估方法、装置、存储介质及电子设备制造方法及图纸

技术编号:20796982 阅读:26 留言:0更新日期:2019-04-06 10:34
本公开涉及一种数据结构化评估方法、数据结构化评估装置、计算机可读存储介质及电子设备。本公开实施例提供的数据结构化评估方法包括:获取对原始数据进行结构化处理后的结构化结果以及对所述原始数据进行标注后的标注结果;对比所述结构化结果和所述标注结果得到差异结果;根据所述差异结果计算所述结构化处理的准确率和召回率;将所述结构化处理的结构化配置以及所述准确率和召回率进行关联并做版本化处理。本公开实施例提供的数据结构化评估方法避免了结构化与评估之间的反复,提高了对结构化结果进行评估的效率。

Data Structured Assessment Method, Device, Storage Media and Electronic Equipment

The present disclosure relates to a data structured evaluation method, a data structured evaluation device, a computer readable storage medium and an electronic device. The data structured evaluation method provided in the present disclosure embodiment includes: obtaining structured results after structured processing of the original data and labeling results after labeling the original data; obtaining different results by comparing the structured results with the labeling results; calculating the accuracy and recall rate of the structured processing based on the difference results; and computing the structure. The structured configuration of the chemical processing and the accuracy and recall rates are correlated and versioned. The data structured evaluation method provided in the present disclosure embodiment avoids the repetition between structured and evaluation, and improves the efficiency of evaluating structured results.

【技术实现步骤摘要】
数据结构化评估方法、装置、存储介质及电子设备
本公开涉及计算机
,具体涉及一种数据结构化评估方法、数据结构化评估装置、计算机可读存储介质及电子设备。
技术介绍
结构化技术是NLP(NaturalLanguageProcessing,自然语言处理)中的最重要的一项技术,对结构化结果进行评估是结构化中最费时费力的事情,涉及的流程非常多,而且为了获得良好的结构化效果,此流程还必须反复进行。现有的对结构化结果进行评估的方法主要是采用线下模式,由开发人员把结构化结果通过excel表格导出给医学人员,医学人员进行评估后再返回给开发人员,如此反复多次,需要大量交互,无法自动化。一方面开发人员与医学人员反复的沟通交互,非常耗费时间;另一方面结构化可能需要医学人员多次进行评估,而且评估结果都只能用excel表格线下保存,且进行反复对比分析的时候,有可能后一次的修改结构化出来的结果效果更差,无法追踪上一次配置是怎么修改的。由此可见,如何改变结构化结果评估费时费力的现状是目前亟待解决的问题。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种数据结构化评估方法、数据结构化评估装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个技术问题。根据本公开的一个方面,提供一种数据结构化评估方法,其特殊之处在于,包括:获取对原始数据进行结构化处理后的结构化结果以及对所述原始数据进行标注后的标注结果;对比所述结构化结果和所述标注结果得到差异结果;根据所述差异结果计算所述结构化处理的准确率和召回率;将所述结构化处理的结构化配置以及所述准确率和召回率进行关联并做版本化处理。在本公开的一种示例性实施方式中,在对比所述结构化结果和所述标注结果得到差异结果之后,所述方法还包括:生成包含所述结构化结果和所述标注结果的展示图表;对所述差异结果和所述结构化结果中的其他结果进行差异化显示。在本公开的一种示例性实施方式中,在根据所述差异结果计算所述结构化处理的准确率和召回率之后,所述方法还包括:判断所述准确率和召回率是否满足预设条件;若判断所述准确率和召回率不满足预设条件,则根据所述差异结果调整所述结构化处理的结构化配置;使用调整后的结构化配置对所述原始数据进行结构化处理。在本公开的一种示例性实施方式中,所述对比所述结构化结果和所述标注结果得到差异结果包括:对比原始数据的整体结构化结果和整体标注结果,得到整体差异结果;对比原始数据中各个字段集合的集合结构化结果和集合标注结果,得到集合差异结果;对比原始数据中各个字段的字段结构化结果和字段标注结果,得到字段差异结果。在本公开的一种示例性实施方式中,所述根据所述差异结果计算所述结构化处理的准确率和召回率包括:根据所述整体差异结果计算整体准确率和整体召回率;根据所述集合差异结果计算集合准确率和集合召回率;根据所述字段差异结果计算字段准确率和字段召回率。在本公开的一种示例性实施方式中,所述准确率包括对内准确率和对外准确率;其中,所述对内准确率是不包含空值的准确率,所述对外准确率是包含空值的准确率。在本公开的一种示例性实施方式中,所述召回率包括对内召回率和对外召回率;其中,所述对内召回率是不包含空值的召回率,所述对外召回率是包含空值的召回率。根据本公开的一个方面,提供一种数据结构化评估装置,其特殊之处在于,包括:获取模块,被配置为获取对原始数据进行结构化处理后的结构化结果以及对所述原始数据进行标注后的标注结果;对比模块,被配置为对比所述结构化结果和所述标注结果得到差异结果;计算模块,被配置为根据所述差异结果计算所述结构化处理的准确率和召回率;版本模块,被配置为将所述结构化处理的结构化配置以及所述准确率和召回率进行关联并做版本化处理。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特殊之处在于,所述计算机程序被处理器执行时实现以上任一所述的数据结构化评估方法。根据本公开的一个方面,提供一种电子设备,其特殊之处在于,包括处理器和存储器;其中,存储器用于存储所述处理器的可执行指令,所述处理器被配置为经由执行所述可执行指令来执行以上任一所述的数据结构化评估方法。在本公开实施例所提供的数据结构化评估方法中,通过对比结构化结果和标注结果可以计算得到结构化处理的准确率和召回率,在将结构化处理的准确率和召回率与对应的结构化配置进行关联并做版本化处理之后可以对同一批次的原始数据按照结构化配置生成不同版本的结构化结果,而且各个版本之间的结构化配置以及准确率和召回率均可以进行直观对比,各个版本之间的结构化配置均可以相互追溯,避免了结构化与评估之间的反复,提高了对结构化结果进行评估的效率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开一种示例性实施方式中数据结构化评估方法的步骤流程图。图2示意性示出本公开另一种示例性实施方式中数据结构化评估方法的部分步骤流程图。图3示意性示出本公开另一种示例性实施方式中数据结构化评估方法的部分步骤流程图。图4示意性示出本公开另一种示例性实施方式中数据结构化评估方法的部分步骤流程图。图5示意性示出本公开示例性实施方式中数据结构化评估方法在一种应用场景下的流程框图。图6示意性示出本公开示例性实施方式中数据结构化评估装置的组成框图。图7示意性示出本公开示例性实施方式中一种电子设备的模块示意图。图8示意性示出本公开示例性实施方式中一种程序产品的示意图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施例使得本公开将更加全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本公开的示例性实施方式中首先提供一种数据结构化评估方法,该方法采用线上处理的模式,可以为原始数据的结构化处理结果提供评估依据,所获得的评估结果可以用于衡量结构化处理的效果。本示例性实施方式中涉及的数据结构化可以是对医疗数据的结构化处理,另外也可以是对其他任意数据的结构化处理,本示例性实施方式对此不做特殊限定。参考图1所示,本示例性实施方式提供的数据结构化评估方法主要可以包括以下步骤:步骤S110.获取对原始数据本文档来自技高网...

【技术保护点】
1.一种数据结构化评估方法,其特征在于,包括:获取对原始数据进行结构化处理后的结构化结果以及对所述原始数据进行标注后的标注结果;对比所述结构化结果和所述标注结果得到差异结果;根据所述差异结果计算所述结构化处理的准确率和召回率;将所述结构化处理的结构化配置以及所述准确率和召回率进行关联并做版本化处理。

【技术特征摘要】
1.一种数据结构化评估方法,其特征在于,包括:获取对原始数据进行结构化处理后的结构化结果以及对所述原始数据进行标注后的标注结果;对比所述结构化结果和所述标注结果得到差异结果;根据所述差异结果计算所述结构化处理的准确率和召回率;将所述结构化处理的结构化配置以及所述准确率和召回率进行关联并做版本化处理。2.根据权利要求1所述的数据结构化评估方法,其特征在于,在对比所述结构化结果和所述标注结果得到差异结果之后,所述方法还包括:生成包含所述结构化结果和所述标注结果的展示图表;对所述差异结果和所述结构化结果中的其他结果进行差异化显示。3.根据权利要求1所述的数据结构化评估方法,其特征在于,在根据所述差异结果计算所述结构化处理的准确率和召回率之后,所述方法还包括:判断所述准确率和召回率是否满足预设条件;若判断所述准确率和召回率不满足预设条件,则根据所述差异结果调整所述结构化处理的结构化配置;使用调整后的结构化配置对所述原始数据进行结构化处理。4.根据权利要求1所述的数据结构化评估方法,其特征在于,所述对比所述结构化结果和所述标注结果得到差异结果包括:对比原始数据的整体结构化结果和整体标注结果,得到整体差异结果;对比原始数据中各个字段集合的集合结构化结果和集合标注结果,得到集合差异结果;对比原始数据中各个字段的字段结构化结果和字段标注结果,得到字段差异结果。5.根据权利要求4述的数据结构化评估方法,其特征在于,所述根据所述差异...

【专利技术属性】
技术研发人员:滕召荣
申请(专利权)人:金色熊猫有限公司
类型:发明
国别省市:中国香港,81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1