System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能化生成画像标签的方法技术_技高网

一种智能化生成画像标签的方法技术

技术编号:39999390 阅读:4 留言:0更新日期:2024-01-09 03:09
本申请公开的属于模型训练技术领域,具体为一种智能化生成画像标签的方法,包括数据准备、模型微调、模型部署应用、圈选目标人群等多个步骤,本发明专利技术首先基于场景积累的数据,对大模型进行了微调,使大模型可以理解该垂直场景的问题,并通过大模型的推理,让业务人员可以直接快速的生成对应业务的标签,降低了CDP的使用门槛,且极大程度提高了画像标签构建的效率,从而提高运营人员的效率和运营效果。

【技术实现步骤摘要】

本申请涉及模型训练,具体为一种智能化生成画像标签的方法


技术介绍

1、dmp:data management platform,数据管理平台,是把分散的多方数据进行整合纳入统一的技术平台,并对这些数据进行标准化和细分,让用户可以把这些细分结果推向现有的互动营销环境里的平台;

2、crm:customer relation management,客户关系管理,是指企业为提高核心竞争力,利用相应的信息技术以及互联网技术协调企业与顾客间在销售、营销和服务上的交互,从而提升其管理方式,向客户提供创新式的个性化的客户交互和服务的过程;

3、cdp:customer data platform,面向营销领域的新型管理客户数据的平台,可以理解成为crm和dmp的集合版,目标是汇集所有客户数据并将数据存储在统一的、可多部门访问的数据平台中,让企业各个部门都可以轻松使用;

4、chatglm2-6b:支持中文的开源大模型;

5、adapter:一种轻量级的训练方法,以一个较小的训练和存储代价就可以取得和全模型微调相当的结果,通过在原始的预训练模型中的每个transformer block中加入一些参数可训练的模块实现;

6、企业在做数字化营销时,通常会基于cdp构建并汇总客户的数据,并让企业的各个部门可以轻松使用,特别是在营销领域,会给不同的客户提供不同的运营方案,目的是给客户提供个性化的服务,通过提高客户的满意度从而提高最后的转化率。但在使用cdp去圈选运营的目标人群时,需要基于运营人员和技术人员的深入沟通,运营人员需要对各个指标提供对应的业务知识支持,再交由技术人员通过写sql的方式,将业务语言转换成技术语言,去给不同的客户打上不同属性的标签,之后通过运营人员对不同标签的阈值进行判断和组合,汇总生成对应的人群之后,再去做对应的运营活动。整个过程会消耗大量运营人员和技术人员的时间和精力,由于大模型技术的出现,可以改变人和软件的交互方式,但直接使用通用大模型的能力,也没办法理解具体场景的具体问题,往往返回的结果没办法让cdp理解。


技术实现思路

1、本申请的目的在于提供一种智能化生成画像标签的方法,以解决上述
技术介绍
中提出的直接使用大模型无法理解具体场景的具体问题,返回的结果没办法让cdp理解的问题。

2、为实现上述目的,本申请提供如下技术方案:一种智能化生成画像标签的方法,包括以下步骤:

3、步骤1,数据准备:对实际场景中的标签生成的历史数据进行提取;

4、步骤2,模型微调,基于chatglm2-6b模型做该垂直应用领域的微调,为模型添加调节器权重,训练embedding的同时也同步更新对应的权重参数,将chatglm2-6b的权重量化到4bit,对所有线性层后面都插入adapter,并提高adapter的秩,最后将微调的权重合并回基础模型;

5、步骤3,模型部署应用:将微调后的模型部署到线上,实时响应业务人员发过来的对目标人群的文字描述的需求,并将需求转换成条件的组合返回给cdp系统并进行界面化展示,业务人员对条件组合的阈值进行配置和调整后,再把最终的条件组合以及表结构输入到模型中,输出可执行的数据查询语句,再交给cdp系统,由cdp执行语句,并生成对应的画像标签;

6、步骤4,圈选目标人群:依据步骤3生成的画像标签,在cdp系统上圈选对应的目标人群,并依据业务人员的策略做个性化的营销运营。

7、优选的,所述步骤1中的历史数据包括以下内容:

8、内容1,业务人员提出的对目标人群的需求,以自然语言的形式存储的内容;

9、内容2,生成目标人群的标签的配置文件内容,配置文件内容中包含了生成对应标签需要的各个条件以及各个条件的组合,并对条件中的阈值进行特殊的虚化处理,通过掩码的形式进行替换;

10、内容3,生成对应标签需要的sql语句,和内容2中各个条件的组合一一对应。

11、优选的,所述步骤2中采用了步骤1中的数据内容用于让大模型学习到标签需求的自然语言描述和对应条件组合之间的语义关联关系,并结合sql语句中的表结构信息学习到条件与数据字段之间的关联关系,最后将微调的权重合并回基础模型。

12、与现有技术相比,本申请的有益效果是:

13、1)本专利技术首先基于场景积累的数据,对大模型进行了微调,使大模型可以理解该垂直场景的问题,并通过大模型的推理,让业务人员可以直接快速的生成对应业务的标签,降低了cdp的使用门槛,且极大程度提高了画像标签构建的效率,从而提高运营人员的效率和运营效果。

14、2)本专利技术降低了数据运营的门槛,使业务人员可以直接和cdp平台进行交互,通过简单的阈值配置就可以生成对应的画像标签,并圈选对应的运营目标人群。

本文档来自技高网...

【技术保护点】

1.一种智能化生成画像标签的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种智能化生成画像标签的方法,其特征在于:所述步骤1中的历史数据包括以下内容:

3.根据权利要求1所述的一种智能化生成画像标签的方法,其特征在于:所述步骤2中采用了步骤1中的数据内容用于让大模型学习到标签需求的自然语言描述和对应条件组合之间的语义关联关系,并结合SQL语句中的表结构信息学习到条件与数据字段之间的关联关系,最后将微调的权重合并回基础模型。

【技术特征摘要】

1.一种智能化生成画像标签的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种智能化生成画像标签的方法,其特征在于:所述步骤1中的历史数据包括以下内容:

3.根据权利要求1所述的一种智能化生成画像...

【专利技术属性】
技术研发人员:李翔张娟琦夏曦
申请(专利权)人:珠海市卓轩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1