一种基于AI的数据标注处理方法、系统及AI中台技术方案

技术编号:37346994 阅读:19 留言:0更新日期:2023-04-22 21:41
本发明专利技术提供的一种基于AI的数据标注处理方法、系统及AI中台,涉及数据标注处理技术领域。本发明专利技术对该第一用户行为描述文本组合进行关键信息挖掘处理,以输出该第一用户行为描述文本组合对应的第一组合场景行为描述向量;对该第二用户行为描述文本组合进行关键信息挖掘处理,以输出该第二用户行为描述文本组合对应的第二组合场景行为描述向量;分析出第一用户和第二用户之间是否具有用户行为层面的用户关联关系。本发明专利技术提高了基于AI中台的关联标注的可靠度,只需要通过少量的数据标注,即可在AI中台上实现对同种类型数据的自动智能化标注功能,提升效率的同时保证AI中台上数据标注的准确性,提高AI中台的数据智能化标注效率。率。率。

【技术实现步骤摘要】
一种基于AI的数据标注处理方法、系统及AI中台


[0001]本专利技术涉及数据标注处理
,具体而言,涉及一种基于AI的数据标注处理方法、系统及AI中台。

技术介绍

[0002]随着AI能力的应用越来越广泛和细化,对AI能力进行有效管理成为了一个重要的课题,AI中台应运而生。并成为创新型企业运转不可或缺的基础设施,在未来,AI 中台将融入企业成长的全生命周期,企业建设、应用和运营 AI 中台的能力,将成为衡量未来发展潜力和成长价值的关键指标,助力构筑企业核心竞争力。AI中台系统主要由应用层、能力层和基础层构成。其中,基础层提供数据存取,容器管理、镜像管理以及负载均衡等多种底层支撑技术;能力层包括AI能力的数据标注、模型训练和部署,以及从第三方AI厂商购买的AI能力。能力层实现了AI接口统一,方便应用接入和升级AI能力;应用层是AI中台提供的管理功能,包括AI资产管理、客户管理、应用管理等多个功能模块。
[0003]在AI中台上,对数据进行标注的技术,有较多的应用场景,例如,可以用于对用户之间是否关联进行标注,使得可以基于标注的关联关系,进行用户的关联处理,如媒体资源的关联推送等,包括但不限于,图像信息、文本信息的关联推送,如将用户A关注的图像信息推送给与用户A关联的用户B。但是,在现有技术中,存在这关联标注的可靠度不佳的问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种基于AI的数据标注处理方法、系统及AI中台,以在一定程度上提高关联标注的可靠度。
[0005]为实现上述目的,本专利技术实施例采用如下技术方案:一种基于AI的数据标注处理方法,包括:确定出待进行关系标注的第一用户和第二用户,并确定出所述第一用户在多个应用场景中分别具有的第一用户行为描述文本,以及,确定出所述第二用户在所述多个应用场景中分别具有的第二用户行为描述文本;对于每两个第一用户行为描述文本,将该两个第一用户行为描述文本进行数据组合处理,以形成对应的一个第一用户行为描述文本组合,以及,对于每两个第二用户行为描述文本,将该两个第二用户行为描述文本进行数据组合处理,以形成对应的一个第二用户行为描述文本组合;对于每一个所述第一用户行为描述文本组合,对该第一用户行为描述文本组合进行关键信息挖掘处理,以输出该第一用户行为描述文本组合对应的第一组合场景行为描述向量,以及,对于每一个所述第二用户行为描述文本组合,对该第二用户行为描述文本组合进行关键信息挖掘处理,以输出该第二用户行为描述文本组合对应的第二组合场景行为描述向量;基于全部的第一组合场景行为描述向量和全部的第二组合场景行为描述向量,分
析出所述第一用户和所述第二用户之间是否具有用户行为层面的用户关联关系,以及,在所述第一用户和所述第二用户之间具有用户行为层面的用户关联关系的情况下,对所述第一用户和所述第二用户进行关联标注,对于关联标注的用户,用于在用户之间进行关注图像或关注文本的相互推送,所述关注图像和所述关注文本属于所述多个应用场景。
[0006]在一些优选的实施例中,在上述基于AI的数据标注处理方法中,所述对于每一个所述第一用户行为描述文本组合,对该第一用户行为描述文本组合进行关键信息挖掘处理,以输出该第一用户行为描述文本组合对应的第一组合场景行为描述向量的步骤,包括:将所述第一用户行为描述文本组合中的一个第一用户行为描述文本标记为第一维度用户行为描述文本、另一个第一用户行为描述文本标记为第二维度用户行为描述文本;将第一用户行为描述文本组合中的第一维度用户行为描述文本进行关键信息挖掘处理,输出对应的第一维度场景行为描述向量,以及,将所述第一用户行为描述文本组合中的第二维度用户行为描述文本进行关键信息挖掘处理,输出对应的第二维度场景行为描述向量;对所述第一维度场景行为描述向量和所述第二维度场景行为描述向量进行级联组合处理,形成对应的组合维度场景行为描述向量;将所述组合维度场景行为描述向量进行多次特征空间投射处理,以输出对应的多个特征空间投射描述向量;以及,基于所述多个特征空间投射描述向量,分析出对应的待处理特征空间投射描述向量;将所述待处理特征空间投射描述向量、所述第二维度场景行为描述向量和所述第一维度场景行为描述向量进行向量聚合处理,形成所述第一用户行为描述文本组合对应的第一组合场景行为描述向量;其中,所述将所述待处理特征空间投射描述向量、所述第二维度场景行为描述向量和所述第一维度场景行为描述向量进行向量聚合处理,形成所述第一用户行为描述文本组合对应的第一组合场景行为描述向量的步骤,包括:将所述待处理特征空间投射描述向量和所述第二维度场景行为描述向量进行向量聚合处理,以形成对应的第一向量聚合处理结果;将所述待处理特征空间投射描述向量和所述第一维度场景行为描述向量进行向量聚合处理,以形成对应的第二向量聚合处理结果;以及,将所述第一向量聚合处理结果和所述第二向量聚合处理结果进行向量聚合处理,以形成所述第一用户行为描述文本组合对应的第一组合场景行为描述向量。
[0007]在一些优选的实施例中,在上述基于AI的数据标注处理方法中,所述将所述组合维度场景行为描述向量进行多次特征空间投射处理,以输出对应的多个特征空间投射描述向量的步骤,包括:通过多个特征空间投射模型,将所述组合维度场景行为描述向量分别进行特征空间投射处理,以形成多个特征空间投射描述向量,所述特征空间投射描述向量一一对应于所述特征空间投射模型;每两个所述特征空间投射描述向量之间的向量层级一致,每两个所述特征空间投射描述向量之间包括的描述向量参数不一致。
[0008]在一些优选的实施例中,在上述基于AI的数据标注处理方法中,所述基于所述多个特征空间投射描述向量,分析出对应的待处理特征空间投射描述向量的步骤,包括:
确定出包括多个标准描述向量的标准描述向量集合;分别对每一个所述特征空间投射描述向量与所述标准描述向量集合中的每一个标准描述向量进行分析,输出每一个所述特征空间投射描述向量与所述标准描述向量集合中的每一个标准描述向量之间的向量匹配度;依据每一个所述特征空间投射描述向量与所述标准描述向量集合中的每一个标准描述向量之间的向量匹配度,分析输出每一个所述特征空间投射描述向量对应的向量重要性表征系数;依据每一个所述特征空间投射描述向量对应的向量重要性表征系数,将所述多个特征空间投射描述向量进行融合处理,以形成对应的待处理特征空间投射描述向量。
[0009]在一些优选的实施例中,在上述基于AI的数据标注处理方法中,所述标准描述向量集合中标准描述向量的数量等于第一数量,所述特征空间投射描述向量的数量等于第二数量,第二数量个所述特征空间投射描述向量排列形成有特征空间投射描述向量有序集合,所述第二数量不小于2,所述第一数量不小于2;所述确定出包括多个标准描述向量的标准描述向量集合的步骤,包括:对所述特征空间投射描述向量有序集合中前第一数值个特征空间投射描述向量的平均描述向量进行确定,以及,通过将所述第一数值进行轮询,以形成第二数量个平均描述向量,所述第一数值为不超过所述第二数量;在所述第二数量不大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于AI的数据标注处理方法,其特征在于,包括:确定出待进行关系标注的第一用户和第二用户,并确定出所述第一用户在多个应用场景中分别具有的第一用户行为描述文本,以及,确定出所述第二用户在所述多个应用场景中分别具有的第二用户行为描述文本;对于每两个第一用户行为描述文本,将该两个第一用户行为描述文本进行数据组合处理,以形成对应的一个第一用户行为描述文本组合,以及,对于每两个第二用户行为描述文本,将该两个第二用户行为描述文本进行数据组合处理,以形成对应的一个第二用户行为描述文本组合;对于每一个所述第一用户行为描述文本组合,对该第一用户行为描述文本组合进行关键信息挖掘处理,以输出该第一用户行为描述文本组合对应的第一组合场景行为描述向量,以及,对于每一个所述第二用户行为描述文本组合,对该第二用户行为描述文本组合进行关键信息挖掘处理,以输出该第二用户行为描述文本组合对应的第二组合场景行为描述向量;基于全部的第一组合场景行为描述向量和全部的第二组合场景行为描述向量,分析出所述第一用户和所述第二用户之间是否具有用户行为层面的用户关联关系,以及,在所述第一用户和所述第二用户之间具有用户行为层面的用户关联关系的情况下,对所述第一用户和所述第二用户进行关联标注,对于关联标注的用户,用于在用户之间进行关注图像或关注文本的相互推送,所述关注图像和所述关注文本属于所述多个应用场景。2.如权利要求1所述的基于AI的数据标注处理方法,其特征在于,所述对于每一个所述第一用户行为描述文本组合,对该第一用户行为描述文本组合进行关键信息挖掘处理,以输出该第一用户行为描述文本组合对应的第一组合场景行为描述向量的步骤,包括:将所述第一用户行为描述文本组合中的一个第一用户行为描述文本标记为第一维度用户行为描述文本、另一个第一用户行为描述文本标记为第二维度用户行为描述文本;将第一用户行为描述文本组合中的第一维度用户行为描述文本进行关键信息挖掘处理,输出对应的第一维度场景行为描述向量,以及,将所述第一用户行为描述文本组合中的第二维度用户行为描述文本进行关键信息挖掘处理,输出对应的第二维度场景行为描述向量;对所述第一维度场景行为描述向量和所述第二维度场景行为描述向量进行级联组合处理,形成对应的组合维度场景行为描述向量;将所述组合维度场景行为描述向量进行多次特征空间投射处理,以输出对应的多个特征空间投射描述向量;以及,基于所述多个特征空间投射描述向量,分析出对应的待处理特征空间投射描述向量;将所述待处理特征空间投射描述向量、所述第二维度场景行为描述向量和所述第一维度场景行为描述向量进行向量聚合处理,形成所述第一用户行为描述文本组合对应的第一组合场景行为描述向量;其中,所述将所述待处理特征空间投射描述向量、所述第二维度场景行为描述向量和所述第一维度场景行为描述向量进行向量聚合处理,形成所述第一用户行为描述文本组合对应的第一组合场景行为描述向量的步骤,包括:将所述待处理特征空间投射描述向量和所述第二维度场景行为描述向量进行向量聚合处理,以形成对应的第一向量聚合处理结果;将所述待处理特征空间投射描述向量和所
述第一维度场景行为描述向量进行向量聚合处理,以形成对应的第二向量聚合处理结果;以及,将所述第一向量聚合处理结果和所述第二向量聚合处理结果进行向量聚合处理,以形成所述第一用户行为描述文本组合对应的第一组合场景行为描述向量;所述将所述组合维度场景行为描述向量进行多次特征空间投射处理,以输出对应的多个特征空间投射描述向量的步骤,包括:通过多个特征空间投射模型,将所述组合维度场景行为描述向量分别进行特征空间投射处理,以形成多个特征空间投射描述向量,所述特征空间投射描述向量一一对应于所述特征空间投射模型;每两个所述特征空间投射描述向量之间的向量层级一致,每两个所述特征空间投射描述向量之间包括的描述向量参数不一致。3.如权利要求2所述的基于AI的数据标注处理方法,其特征在于,所述基于所述多个特征空间投射描述向量,分析出对应的待处理特征空间投射描述向量的步骤,包括:确定出包括多个标准描述向量的标准描述向量集合;分别对每一个所述特征空间投射描述向量与所述标准描述向量集合中的每一个标准描述向量进行分析,输出每一个所述特征空间投射描述向量与所述标准描述向量集合中的每一个标准描述向量之间的向量匹配度;依据每一个所述特征空间投射描述向量与所述标准描述向量集合中的每一个标准描述向量之间的向量匹配度,分析输出每一个所述特征空间投射描述向量对应的向量重要性表征系数;依据每一个所述特征空间投射描述向量对应的向量重要性表征系数,将所述多个特征空间投射描述向量进行融合处理,以形成对应的待处理特征空间投射描述向量。4.如权利要求3所述的基于AI的数据标注处理方法,其特征在于,所述标准描述向量集合中标准描述向量的数量等于第一数量,所述特征空间投射描述向量的数量等于第二数量,第二数量个所述特征空间投射描述向量排列形成有特征空间投射描述向量有序集合,所述第二数量不小于2,所述第一数量不小于2;所述确定出包括多个标准描述向量的标准描述向量集合的步骤,包括:对所述特征空间投射描述向量有序集合中前第一数值个特征空间投射描述向量的平均描述向量进行确定,以及,通过将所述第一数值进行轮询,以形成第二数量个平均描述向量,所述第一数值为不超过...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:广州佰锐网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1