一种模糊信息的可重复标注方法、系统及装置制造方法及图纸

技术编号：37057957 阅读：18 留言：0更新日期：2023-03-29 19:34

本发明专利技术公开了一种模糊信息的可重复标注方法系统及装置，该方法包括：获取标注任务并确定标注模式、待标注样本和标注主体；基于标注模式，标注主体对待标注样本进行标注，得到对应的模糊隶属度将多个标注主体对应的模糊隶属度进行整合，得到初始模糊隶属度张量；预估模糊隶属度分布和标注主体偏好并对初始模糊隶属度张量进行校正，得到最终模糊隶属度矩阵。该系统包括：获取模块、标注模块、整合模块和校正模块。该装置包括存储器以及用于执行上述模糊信息的可重复标注方法的处理器。通过使用本发明专利技术，能够从重复的模糊信息的标注中校正模糊标注数据，降低缺失数据对标注质量的影响。本发明专利技术可广泛应用于数据信息标注领域。本发明专利技术可广泛应用于数据信息标注领域。本发明专利技术可广泛应用于数据信息标注领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种模糊信息的可重复标注方法、系统及装置

[0001]本专利技术涉及信息标注领域，尤其涉及一种模糊信息的可重复标注方法、系统及装置。

技术介绍

[0002]目前，模糊信息众包标注工作一般涉及以下几个问题：1、单个样本可由多个标注人员重复标注模糊信息，样本的标注结果无法统一标准；2、同批待标注样本的涉及的标注人员众多，且存在个人标注偏好差异和标注知识差异问题，所以样本间的标注标准很难做到一致；基于以上原因，从而产生了大量的带不同偏好信息和缺失信息的异源无约束模糊信息的可重复标注数据，迫切需要一种模糊数据处理方法能从重复的模糊信息标注中校正模糊标注，同时降低模糊信息中部分数据缺失的影响。

技术实现思路

[0003]为了解决上述技术问题，本专利技术的目的是提供一种模糊信息的可重复标注方法、系统及装置，能够从重复的模糊信息的标注中校正模糊标注数据，降低缺失数据对标注质量的影响。
[0004]本专利技术所采用的第一技术方案是：一种模糊信息的可重复标注方法，包括以下步骤：
[0005]获取标注任务并确定标注模式、待标注样本和标注主体；
[0006]基于标注模式，标注主体对待标注样本进行标注，得到对应的模糊隶属度；
[0007]将多个标注主体对应的模糊隶属度进行整合，得到初始模糊隶属度张量；
[0008]预估模糊隶属度分布和标注主体偏好并对初始模糊隶属度张量进行校正，得到最终模糊隶属度矩阵。
[0009]进一步，所述待标注样本为可重复标注样本，所述标注主体为不同偏好的...

【技术保护点】

【技术特征摘要】
1.一种模糊信息的可重复标注方法，其特征在于，包括以下步骤：获取标注任务并确定标注模式、待标注样本和标注主体；基于标注模式，标注主体对待标注样本进行标注，得到对应的模糊隶属度；将多个标注主体对应的模糊隶属度进行整合，得到初始模糊隶属度张量；预估模糊隶属度分布和标注主体偏好并对初始模糊隶属度张量进行校正，得到最终模糊隶属度矩阵。2.根据权利要求1所述一种模糊信息的可重复标注方法，其特征在于，所述待标注样本为可重复标注样本，所述标注主体为不同偏好的标注专家，所述模糊隶属度的标注约束条件为无约束标注条件。3.根据权利要求2所述一种模糊信息的可重复标注方法，其特征在于，所述将多个标注主体对应的模糊隶属度进行整合，得到初始模糊隶属度张量这一步骤，其具体包括：根据多个标注专家对应的模糊隶属度构建不同标注专家的模糊隶属度矩阵；汇总所有标注专家的模糊隶属度矩阵，组成初始模糊隶属度张量。4.根据权利要求3所述一种模糊信息的可重复标注方法，其特征在于，所述预估模糊隶属度分布和标注主体偏好并对初始模糊隶属度张量进行校正，得到最终模糊隶属度矩阵这一步骤，其具体包括：基于大数定律，预估待标注样本和模糊隶属度服从正态分布函数，得到模糊隶属度分布函数；根据初始模糊隶属度张量获取模糊隶属度最大值和最小值；根据模糊隶属度最大值和最小值预估标注专家的偏好系数，得到专家偏好系数预估值；根据模糊隶属度分布函...

【专利技术属性】
技术研发人员：王振友，朱元浩，徐圣兵，肖云浩，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人