一种多轮对话产品分类方法、装置及存储介质制造方法及图纸

技术编号：42426464 阅读：25 留言：0更新日期：2024-08-16 16:40

本发明专利技术公开了一种多轮对话产品分类方法、装置及存储介质，方法包括：根据多轮长对话文本中获取输入文本；结合字符向量、片段向量，以及分层位置编码向量进行建模，提取序列特征向量；将序列特征向量中每个句子，输入模型后输出的向量，作为该句子的句向量；通过注意力机制获取用户产品信息对于句向量的注意力权重，对句向量进行加权融合，以获取长文本特征向量；将长文本特征向量与用户产品信息进行拼接，作为文本表示特征向量；根据文本表示特征向量进行产品分类，获得最终产品分类结果。本发明专利技术通过将绝对位置编码通过分层转化为相对位置编码，并且通过注意力机制对句向量进行融合表示，进而提升产品分类的性能，可广泛应用于自然语言处理领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自然语言处理领域，尤其涉及一种多轮对话产品分类方法、装置及存储介质。

技术介绍

1、文本分类是自然语言处理中最基本和最重要的任务之一，是一项基于文本序列进行数据挖掘的技术。早期的文本分类任务多局限于keyword匹配等基于规则或统计学习的方法。近年来，随着bert、roberta、xlnet以及ernie等预训练语言模型的迅速崛起，学术界与产业界开始利用海量的互联网文本数据对这些模型进行预训练，学习通用的语言表示和先验知识。再通过微调的方式进一步获取与特定任务相关的知识。大量研究已经证实，这种预训练+微调的两阶段方法非常有效。

2、对于本文对应的多轮长对话文本产品分类任务，对话语句非常多，而且并非每一个对话语句所含的语义信息都同样地与产品分类相关。其次，由于主流的bert模型由于绝对编码的限制，最多能处理512个token，而多轮长对话文本x的长度几乎全超过了这个限制，若使用截断法强行将输入保留为512，将很大程度丢失原文的信息，目前尚缺少一种技术方案解决该问题。

技术实现思路>

1、本文档来自技高网...

【技术保护点】

1.一种多轮对话产品分类方法，其特征在于，包括以下步骤：
2.根据权利要求1所述的一种多轮对话产品分类方法，其特征在于，所述模型采用无监督的方式进行训练，其中训练数据采用以下方式进行标注：
3.根据权利要求1所述的一种多轮对话产品分类方法，其特征在于，所述多轮对话产品分类方法还包括对多轮长对话文本进行预处理的步骤：
4.根据权利要求1所述的一种多轮对话产品分类方法，其特征在于，所述结合字符向量、片段向量，以及针对多轮长对话文本设计的分层位置编码向量进行建模，并通过编码器提取序列特征向量，记为Encoder(X)，包括：
5.根据权利要求1所...

【技术特征摘要】

1.一种多轮对话产品分类方法，其特征在于，包括以下步骤：
2.根据权利要求1所述的一种多轮对话产品分类方法，其特征在于，所述模型采用无监督的方式进行训练，其中训练数据采用以下方式进行标注：
3.根据权利要求1所述的一种多轮对话产品分类方法，其特征在于，所述多轮对话产品分类方法还包括对多轮长对话文本进行预处理的步骤：
4.根据权利要求1所述的一种多轮对话产品分类方法，其特征在于，所述结合字符向量、片段向量，以及针对多轮长对话文本设计的分层位置编码向量进行建模，并通过编码器提取序列特征向量，记为encoder(x)，包括：
5.根据权利要求1所述的一种多轮对话产品分类方法，其特征在于，所述通过注意力机制获取用户产品信息clsproduct对于句向量clstext的注意力权重，对句向量clst...

【专利技术属性】
技术研发人员：苏锦钿，冯浩，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种农业污水处理系统技术方案
下一篇：一种由串联式风轮构成的风力发电装置制造方法及图纸

相关技术

一种含甲烷和二氧化碳的低热值气体高值...

一种复合电荷传输材料和量子点发光二极...

一种面向分层扬声器阵列的三维空间声重...

一种基于物理机制嵌入的深度学习模型在...

一种利用乙酸合成对香豆酸的重组酿酒酵...

自动驾驶公交协同编队动态调度方法技术

一种基于双驱动城市洪涝模型的城市洪涝...

在未知开放环境下的机器人自动建图方法...

一类新型双呋喃基紫外与可见光引发剂及...

非特异性过氧合酶突变体及其应用制造技...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

基于区块链技术的铁路冷链物流运输系统...

考试测评方法、系统、介质、电子设备及...

一种图像去雾方法及系统技术方案

一种基于CID平台的交易运维管理方法...

乡村空间要素配置方法及装置制造方法及...

一种基于Python的新型人力资源平...

一种配电网设备图模参数化设计方法、系...

图书推荐方法及其装置、设备、介质制造...