数据自动标注方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:25691701 阅读:50 留言:0更新日期:2020-09-18 21:03
本发明专利技术公开了数据自动标注方法、装置、计算机设备及存储介质,涉及数据处理技术领域。该方法包括预先设置若干个子标签组成子标签库,每一个子标签用于定义至少一项标签属性;从所述子标签库中选出一个或者多个子标签;通过一种或者多种运算关系,将所述选出的子标签构建为多个不同的标签;根据所述子标签以及所述子标签之间的运算关系,计算每个所述标签的运算值;通过预设的哈希函数,计算待标注数据对应的哈希值;使用所述运算值与所述哈希值相同的标签标注所述待标注数据。该方法实现了精确定义标签体系的构建,可以很好的满足实际使用的需求,能够在不同的维度上进行标记和定义,提供客观的评价体系,并且便于调整和维护。

【技术实现步骤摘要】
数据自动标注方法、装置、计算机设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种数据自动标注方法、装置、计算机设备及存储介质。
技术介绍
随着电子信息技术的不断发展,信息化和数据化操作的系统平台开始越来越多的被广泛应用在保险、金融、行政管理等多个领域。这些系统平台通常都集成有大量的流程、业务和数据。例如,对于财产保险理赔系统而言,该管理系统包含了核心环节中报案、电话查勘、查勘、立案、立案调整、定责、定损、核赔前置、理算、自主理算、多次赔付理算、审核等多个流程,涉及业务复杂。由于现有的系统平台普遍存在流程繁多,业务复杂等的特点。因此,对系统平台的数据观察和统计分析造成了极大的困难,难以进行全面和完善的分析,确定真实的数据情况。现有的一些系统平台可以提供额外的标签体系或者自动标注等数据分析功能。但是,这些标签体系高度依赖于数据模型的分析结果,无法在复杂应用场景下给出准确的结果,难以对数据对象给出精确的刻画结果。同时,在应用场景发生变动或者标签需要进行修改时,只能手工添加规则,不便于维护和管理。例如,在财产保险理赔系本文档来自技高网...

【技术保护点】
1.一种数据自动标注方法,其特征在于,包括:/n预先设置若干个子标签组成子标签库,每一个子标签用于定义至少一项标签属性;/n从所述子标签库中选出一个或者多个子标签;/n通过一种或者多种运算关系,将所述选出的子标签构建为多个不同的标签;/n根据所述子标签以及所述子标签之间的运算关系,计算每个所述标签的运算值;/n通过预设的哈希函数,计算待标注数据对应的哈希值;/n使用所述运算值与所述哈希值相同的标签标注所述待标注数据。/n

【技术特征摘要】
1.一种数据自动标注方法,其特征在于,包括:
预先设置若干个子标签组成子标签库,每一个子标签用于定义至少一项标签属性;
从所述子标签库中选出一个或者多个子标签;
通过一种或者多种运算关系,将所述选出的子标签构建为多个不同的标签;
根据所述子标签以及所述子标签之间的运算关系,计算每个所述标签的运算值;
通过预设的哈希函数,计算待标注数据对应的哈希值;
使用所述运算值与所述哈希值相同的标签标注所述待标注数据。


2.根据权利要求1所述的方法,其特征在于,在使用所述运算值与所述哈希值相同的标签标注所述待标注数据之后,所述方法还包括:
根据用户的编辑指令,编辑所述子标签和/或所述子标签之间的运算关系。


3.根据权利要求2所述的方法,其特征在于,所述根据用户的编辑指令,编辑所述子标签和/或所述子标签之间的运算关系,具体包括:
增加、删除或者修改所述子标签定义的标签属性,并且;
修改所述子标签之间的运算关系。


4.根据权利要求1所述的方法,其特征在于,所述子标签的数据类型包括:数值、字符串和布尔值;所述运算关系包括关系操作符、逻辑运算符以及数学操作符。


5.根据权利要求4所述的方法,其特征在于,所述通过一种或者多种运算关系,将所述选出的子标签构建为多个不同的标签,具体包括:
根据所述选出的子标签的数据类型,确定可用的运算关系;
通过所述可用的运算关系,组合所述选出的子标签以生成对应的标签;每一种可用的运算关系与一个标签对应。


6.根据权利要求4所述的方法,其特征在于,所述待标注数据的数据类型选自数值、字符串和布尔值中的一种或多种;
所述通过预设的哈希函数,计算待标注数...

【专利技术属性】
技术研发人员:田鹏
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1