一种基于智能营销场景的文本分类方法及装置制造方法及图纸

技术编号:36391557 阅读:18 留言:0更新日期:2023-01-18 09:56
本发明专利技术公开了一种基于智能营销场景的文本分类方法及装置,涉及数据处理领域,主要目的在于实现提高对于智能营销场景的文本分类准确率,进而提高在智能营销场景中判别用户的意图准确率。本发明专利技术主要的技术方案为:获取所述智能营销场景的文本;将所述智能营销场景的文本放入预设分类模型进行文本分类,所述预设分类模型至少包括特征提取功能和特征计算功能;利用所述预设分类模型的特征提取功能获取基础特征;基于所述基础特征利用所述预设分类模型的特征计算功能获取目标特征,所述目标特征为具有判别力的特征;根据所述目标特征进行文本分类。本发明专利技术用于智能营销场景的文本分类。类。类。

【技术实现步骤摘要】
一种基于智能营销场景的文本分类方法及装置


[0001]本专利技术涉数据处理
,尤其涉及一种基于智能营销场景的文本分类方法及装置。

技术介绍

[0002]在智能营销场景中,需要通过机器人与人的沟通对话判别用户的意图进行营销推荐。
[0003]目前,采用BERT(英文全称为Bidirectional Encoder Representation from Transformers,是一个预训练的语言表征模型)作为分类模型进行机器学习或者深度学习,通过构造语料,模型训练,部署模型,最后在云端基于机器人与人沟通对话的全部对话文本进行实时预测用户的意图。
[0004]但是,BERT作为分类模型虽然自身包含自注意力机制,可以有效的关注到有效特征上面,但是,BERT作为分类模型对于在智能营销场景中产生的包含较多口语化词汇的对话文本进行分类的准确率却较低,导致在智能营销场景中判别用户的意图准确率也较低。

技术实现思路

[0005]鉴于上述问题,本专利技术提供一种基于智能营销场景的文本分类方法及装置,主要目的是为了实现提高对于智能营销场景的文本分类准确率,进而提高在智能营销场景中判别用户的意图准确率。
[0006]为解决上述技术问题,本专利技术提出以下方案:
[0007]第一方面,本专利技术提供一种基于智能营销场景的文本分类方法,所述方法包括:
[0008]获取所述智能营销场景的文本;
[0009]将所述智能营销场景的文本放入预设分类模型进行文本分类,所述预设分类模型至少包括特征提取功能和特征计算功能;
[0010]利用所述预设分类模型的特征提取功能获取基础特征;
[0011]基于所述基础特征利用所述预设分类模型的特征计算功能获取目标特征,所述目标特征为具有判别力的特征;
[0012]根据所述目标特征进行文本分类。
[0013]优选地,所述预设分类模型至少包括特征提取器、正交投影层和梯度反转层;
[0014]所述利用所述预设分类模型的特征提取功能获取基础特征,包括:
[0015]利用所述预设分类模型的特征提取器从所述预处理数据中获取基础特征。
[0016]优选地,所述基于所述基础特征利用所述预设分类模型的特征计算功能获取目标特征,包括:
[0017]根据所述基础特征利用所述预设分类模型的梯度反转层计算得到无区分性特征;
[0018]根据所述基础特征和所述无区分性特征利用所述预设分类模型的正交投影层计算得到目标特征。
[0019]优选地,所述正交投影层具有获取有区分性特征的功能和获取目标特征的功能;
[0020]所述根据所述基础特征和所述无区分性的特征利用所述预设分类模型的正交投影层计算得到目标特征,包括:
[0021]根据所述基础特征利用所述正交投影层的获取有区分性特征的功能得到所述有区分性特征;
[0022]根据所述有区分性特征和所述无区分性特征利用所述正交投影层的获取目标特征的功能得到所述目标特征。
[0023]优选地,所述方法还包括:
[0024]根据BERT特征提取器和FP

NET网络结构构建所述预设分类模型;
[0025]根据预设训练集、预设测试集和预设验证集对所述预设分类模型进行训练,得到所述预设分类模型的目标参数。
[0026]优选地,在所述根据预设训练集、预设测试集和预设验证集对所述预设分类模型进行训练,得到所述预设分类模型的目标参数之前,所述方法还包括:
[0027]获取原始数据,所述原始数据是预设智能营销场景的对话文本;
[0028]删除所述原始数据的预设词汇得到目标原始数据,所述预设词汇为无意义词汇;
[0029]根据预设标注类别将所述目标原始数据进行分类标注,得到标注数据,所述预设标注类别至少包括强肯定意图、弱肯定意图、已处理意图、忙碌状态意图、电话助理意图、明确拒绝意图和用户辱骂意图;
[0030]将所述标注数据按照预设比例分配为预设训练集、预设测试集和预设验证集。
[0031]优选地,所述根据预设训练集、预设测试集和预设验证集对所述预设分类模型进行训练,得到所述预设分类模型的目标参数,包括:
[0032]监测基于所述预设训练集训练所述预设分类模型的步数是否到达预设步数;
[0033]当所述基于所述预设训练集训练所述预设分类模型的步数到达预设步数时,基于所述预设验证集对所述预设分类模型的分类结果进行检验,得到检验结果;
[0034]判断所述检验结果是否到达预设条件;
[0035]若所述检验结果到达预设条件,则停止训练所述预设分类模型,且基于所述预设测试集对所述预设分类模型进行测试,计算出所述预设分类模型的准确率和召回率;
[0036]判断所述准确率和所述召回率是否达到预设条件;
[0037]若所述准确率和所述召回率达到预设条件,则将所述预设分类模型经训练得到的参数确定为所述目标参数。
[0038]第二方面,本专利技术提供一种基于智能营销场景的文本分类装置,所述装置包括:
[0039]第一获取单元,用于获取所述智能营销场景的文本;
[0040]放入单元,用于将所述智能营销场景的文本放入预设分类模型进行文本分类,所述预设分类模型至少包括特征提取功能和特征计算功能;
[0041]第二获取单元,用于利用所述预设分类模型的特征提取功能获取基础特征;
[0042]第三获取单元,用于基于所述基础特征利用所述预设分类模型的特征计算功能获取目标特征,所述目标特征为具有判别力的特征;
[0043]分类单元,用于根据所述目标特征进行文本分类。
[0044]优选地,所述预设分类模型至少包括特征提取器、正交投影层和梯度反转层;所述
第二获取单元,包括:
[0045]用于利用所述预设分类模型的特征提取器从所述预处理数据中获取基础特征。
[0046]优选地,所述第三获取单元,包括:
[0047]第一计算模块,用于根据所述基础特征利用所述预设分类模型的梯度反转层计算得到无区分性特征;
[0048]第二计算模块,用于根据所述基础特征和所述无区分性特征利用所述预设分类模型的正交投影层计算得到目标特征。
[0049]优选地,所述正交投影层具有获取有区分性特征的功能和获取目标特征的功能;所述第二计算模块,包括:
[0050]第一获取子模块,用于根据所述基础特征利用所述正交投影层的获取有区分性特征的功能得到所述有区分性特征;
[0051]第二获取子模块,用于根据所述有区分性特征和所述无区分性特征利用所述正交投影层的获取目标特征的功能得到所述目标特征。
[0052]优选地,所述装置还包括:
[0053]构建单元,用于根据BERT特征提取器和FP

NET网络结构构建所述预设分类模型;
[0054]训练单元,用于根据预设训练集、预设测试集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于智能营销场景的文本分类方法,其特征在于,所述方法包括:获取所述智能营销场景的文本;将所述智能营销场景的文本放入预设分类模型进行文本分类,所述预设分类模型至少包括特征提取功能和特征计算功能;利用所述预设分类模型的特征提取功能获取基础特征;基于所述基础特征利用所述预设分类模型的特征计算功能获取目标特征,所述目标特征为具有判别力的特征;根据所述目标特征进行文本分类。2.根据权利要求1所述的方法,其特征在于,所述预设分类模型至少包括特征提取器、正交投影层和梯度反转层;所述利用所述预设分类模型的特征提取功能获取基础特征,包括:利用所述预设分类模型的特征提取器从所述预处理数据中获取基础特征。3.根据权利要求2所述的方法,其特征在于,所述基于所述基础特征利用所述预设分类模型的特征计算功能获取目标特征,包括:根据所述基础特征利用所述预设分类模型的梯度反转层计算得到无区分性特征;根据所述基础特征和所述无区分性特征利用所述预设分类模型的正交投影层计算得到目标特征。4.根据权利要求3所述的方法,其特征在于,所述正交投影层具有获取有区分性特征的功能和获取目标特征的功能;所述根据所述基础特征和所述无区分性的特征利用所述预设分类模型的正交投影层计算得到目标特征,包括:根据所述基础特征利用所述正交投影层的获取有区分性特征的功能得到所述有区分性特征;根据所述有区分性特征和所述无区分性特征利用所述正交投影层的获取目标特征的功能得到所述目标特征。5.根据权利要求1

4任一项所述的方法,其特征在于,所述方法还包括:根据BERT特征提取器和FP

NET网络结构构建所述预设分类模型;根据预设训练集、预设测试集和预设验证集对所述预设分类模型进行训练,得到所述预设分类模型的目标参数。6.根据权利要求5所述的方法,其特征在于,在所述根据预设训练集、预设测试集和预设验证集对所述预设分类模型进行训练,得到所述预设分类模型的目标参数之前,所述方法还包括:获取原始数据,所述原始数据是预设智能营销场景的对话文本;删除所述原始数据的预设词汇得到目标原始数...

【专利技术属性】
技术研发人员:冯鑫
申请(专利权)人:百融至信北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1