System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其是一种海关报关单的分类方法、装置、设备及存储介质。
技术介绍
1、目前,海关报关单的分类依靠人工审核完成,然而,人工审核方式受到审关员的知识和经验背景,对商品类目的熟悉程度,以及人为操作等主客观因素的影响,存在分类效率低下和分类准确性不稳定的缺陷。
技术实现思路
1、本申请的目的是提供一种海关报关单的分类方法、装置、设备及存储介质,旨在提高海关报关单的分类效率和分类准确性。
2、本申请实施例提供一种海关报关单的分类方法,包括:
3、对海关报关单进行文本提取处理,得到所述海关报关单中待分类商品的商品描述文本;
4、利用预训练的特征提取模型,从多个预设的商品要素维度对所述商品描述文本进行特征提取处理,得到特征提取结果;所述预训练的特征提取模型通过few-shot学习方法训练得到;
5、利用预训练的识别模型,根据所述特征提取结果,对所述待分类商品进行商品类别识别处理,得到识别结果;所述识别结果包含多个商品类别;
6、对所述识别结果进行可视化处理,获取用户通过人机交互选择所述识别结果中的商品类别所产生的交互信息,根据所述交互信息输出选择结果,以对所述海关报关单进行分类。
7、在一些实施例中,所述预训练的特征提取模型包括编码器网络和解码器网络;
8、所述利用预训练的特征提取模型,从多个预设的商品要素维度对所述商品描述文本进行特征提取处理,得到特征提取结果,包括:
9、对所述
10、利用所述编码器网络,提取所述预处理后的文本数据每个词语基于自注意力机制的上下文信息和文本特征信息,得到上下文向量和词语特征向量;
11、利用所述解码器网络,以所述词语特征向量作为值项和键项,以所述上下文向量作为查询项,生成文本所述商品描述文本在多个预设的商品要素维度的分类文本表示,得到所述特征提取结果。
12、在一些实施例中,所述对所述商品描述文本进行预处理,得到预处理后的文本数据,包括:
13、对所述商品描述文本进行分词处理,得到若干商品描述词语文本;
14、对所述商品描述词语文本进行编码处理,得到词语特征向量;
15、对所述词语特征向量进行位置编码处理,得到所述预处理后的文本数据。
16、在一些实施例中,所述预训练的识别模型包括识别网络和线性映射网络,所述线性映射网络具有多个具有层级关系的线性映射层;
17、所述利用预训练的识别模型,根据所述特征提取结果,对所述待分类商品进行商品类别识别处理,得到识别结果,包括:
18、利用所述识别网络,基于多头注意力机制和前馈机制,提取所述特征提取结果的商品要素特征信息,得到商品要素特征向量;
19、利用所述线性映射网络,在各所述线性映射层中对所述商品要素特征向量进行线性映射分类处理和编码搜索处理,得到所述识别结果。
20、在一些实施例中,所述利用所述线性映射网络,在各所述线性映射层中对所述商品要素特征向量进行线性映射分类处理和编码搜索处理,得到所述识别结果,包括:
21、将输入要素特征向量输入当前层级的线性映射层,进行线性映射分类处理,得到当前层级的分类结果;所述输入要素特征向量为所述商品要素特征向量或上一层级的线性映射层输出的分类结果;
22、根据预设的编码规则,对所述当前层级的分类结果进行编码搜索处理,以搜索出所述当前层级的分类结果所对应的商品类别编码;
23、将所述当前层级的分类结果及其商品类别编码输出至下一层级的线性映射层,进行线性映射分类处理,直至最后一层级的线性映射层输出最后一层级的分类结果及其商品类别编码,得到所述识别结果。
24、在一些实施例中,所述预训练的识别模型的评价公式为:
25、,
26、 ,
27、 ,
28、其中,f为预训练的识别模型的评分,precision为精确率,recall为召回率,tp为真正例的数量,fp为假正例的数量,fn为假负例的数量。
29、在一些实施例中,所述海关报关单的分类方法,还包括:
30、将所述商品描述文本输入预设的商品名称知识库,以对所述待分类商品的商品类别进行模糊搜索匹配,得到模糊搜索结果;
31、对所述模糊搜索结果进行可视化处理,获取用户通过人机交互选择所述模糊搜索结果中的商品类别所产生的交互信息,根据所述交互信息输出选择结果,以对所述海关报关单进行分类。
32、本申请实施例还提供一种海关报关单的分类装置,包括:
33、第一模块,用于对海关报关单进行文本提取处理,得到所述海关报关单中待分类商品的商品描述文本;
34、第二模块,用于利用预训练的特征提取模型,从多个预设的商品要素维度对所述商品描述文本进行特征提取处理,得到特征提取结果;所述预训练的特征提取模型通过few-shot学习方法训练得到;
35、第三模块,用于利用预训练的识别模型,根据所述特征提取结果,对所述待分类商品进行商品类别识别处理,得到识别结果;所述识别结果包含多个商品类别;
36、第四模块,用于对所述识别结果进行可视化处理,获取用户通过人机交互选择所述识别结果中的商品类别所产生的交互信息,根据所述交互信息输出选择结果,以对所述海关报关单进行分类。
37、本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的海关报关单的分类方法。
38、本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的海关报关单的分类方法。
39、本申请的有益效果:利用通过few-shot学习方法训练的特征提取模型,从多个预设的商品要素维度对待分类商品的商品描述文本进行特征提取处理,再利用预训练的识别模型,根据提取得到的特征提取结果对待分类商品进行商品类别识别处理,得到包含多个商品类别的识别结果,由用户从识别结果选择出最准确的商品类别,作为该待分类商品的商品类别,从而对海关报关单进行分类,简化海关报关单分类的工作量和分类难度,提高海关报关单的分类效率和分类准确性。
本文档来自技高网...【技术保护点】
1.一种海关报关单的分类方法,其特征在于,包括:
2.根据权利要求1所述的海关报关单的分类方法,其特征在于,
3.根据权利要求1所述的海关报关单的分类方法,其特征在于,
4.根据权利要求1所述的海关报关单的分类方法,其特征在于,
5.根据权利要求4所述的海关报关单的分类方法,其特征在于,
6.根据权利要求1所述的海关报关单的分类方法,其特征在于,
7.根据权利要求1所述的海关报关单的分类方法,其特征在于,
8.一种海关报关单的分类装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的海关报关单的分类方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的海关报关单的分类方法。
【技术特征摘要】
1.一种海关报关单的分类方法,其特征在于,包括:
2.根据权利要求1所述的海关报关单的分类方法,其特征在于,
3.根据权利要求1所述的海关报关单的分类方法,其特征在于,
4.根据权利要求1所述的海关报关单的分类方法,其特征在于,
5.根据权利要求4所述的海关报关单的分类方法,其特征在于,
6.根据权利要求1所述的海关报关单的分类方法,其特征在于,
7.根据权利要求1所述的海关报关...
【专利技术属性】
技术研发人员:陈大伟,曾伟祥,何中卿,
申请(专利权)人:深圳市明心数智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。