一种HS编码转译方法技术

技术编号:20389711 阅读:13 留言:0更新日期:2019-02-20 02:47
针对现有技术的不足,本发明专利技术提供一种HS编码转译方法,能即时填报进口国和输出国的HS编码,对此本发明专利技术一种HS编码转译方法,首先获得商品的名称或属性描述,通过商品名称或属性描述构建基于商品描述的商品本体,并从国际贸易商品本体库和出口国的HS编码目录中根据商品本体描述获取对应该商品本体的出口国的HS编码;将出口国的HS编码转化为对应的公共代码描述后与进口国HS编码目录中的公共代码重新匹配,发现对应进口国的HS编码。通过这样的技术方案,引入了公共代码的概念,从而架设起桥梁实现出口国和进口国的双向HS编码,并能通过最终的结果自行学习调整HS编码的分类可信度,最终实现高准确度的双向自动的HS编码。

【技术实现步骤摘要】
一种HS编码转译方法
本专利技术涉及产品自动分类方法,具体涉及一种HS编码转译方法。
技术介绍
HS目录是一种国际通用的进出口商品分类体系。HS目录通过5-7个层次的分类,系统地对国际贸易中的商品进行了归类,并为各层次类别定义了数字编码(即HS编码)以供查找和统计。依照HS目录体系,各类进出口商品都可通过其商品名定义在HS目录中确定唯一的8~10位HS编码。作为各国海关进出口监管和统计的基础,HS编码在国际贸易中得到了广泛应用。HS编码已成为执行各类监管政策和进行进出口统计的基础体系,是海关和检验检疫部门判断商品适用政策的直接依据,进出口监管对于不同HS编码的商品名采取不同的监管措施。由于其可靠性,它的应用还涉及到了拍卖等行业,更为广泛。但是HS编码的查询和确认工作枯燥耗时,需要很大的工作量和专业的业务知识,且容易出错,成为当前影响货物通关效率的重要因素。由于进口国和出口国之间的语言、文化、商品分类等差异,HS编码现阶段无法实现直接的转换和生成。现有技术中虽然也有便于控制的产品分类系统,例如技术TWM555499U《产品分类系统》中就设计了一种单向的将货品分类的方法。此方法虽然能在出口时对商品进行自动分类,但是到了进口国后还是需要人工进行匹配。由于HS编码的智能生成/转译对实现检验检疫业务流程自动化、提高通关效率具有重要意义。而现有技术中并没有能统一转换出口国和进口国的HS编码的方法,导致这个转换工作还是需要人工参与。
技术实现思路
针对现有技术的不足,本专利技术提供一种HS编码转译方法,能即时填报进口国和输出国的HS编码,减少填写HS编码时的偏差,降低不同国家的商品分类不同导致编码有误的可能,提高了报关的效率。为实现以上目的,本专利技术通过以下技术方案予以实现:一种HS编码转译方法,首先获得商品的名称或属性描述,通过商品名称或属性描述构建基于商品描述的商品本体,并从国际贸易商品本体库和出口国的HS编码目录中根据商品本体描述获取对应该商品本体的出口国的HS编码;将出口国的HS编码转化为对应的公共代码描述后与进口国HS编码目录中的公共代码重新匹配,发现对应进口国的HS编码。优选的,所述转化过程中所应用到的公共代码采用基于世贸组织库中不同国别的商品英语语言描述之间的近似度为基准。在现阶段,世贸组织库中不同国别的商品英语语言由于其官方背景和被各个国家的接受,是作为公共代码的最佳选择。但是在一些特别情况,例如法语系国家之间进行的外贸时,也可以直接将法语作为公共代码。优选的,商品本体的具体获得方式为,从商品的概念出发,映射到商品领域,并且发掘商品概念之间的多种关系,从商品概念中提取出商品的属性,并将其划分类别,找出这些类别中的关联。这样的分类方法不仅仅从商品的名称上进行分类,也不仅仅从商品属性中进行分类,而进一步关注商品实际属性之间的相互关联,通过这个关联体现商品的本质,增加了商品分类的可靠性。优选的,所述划分列类别的具体方法为:从商品概念中获得商品属性数据后,对这些数据进行预处理,汇总处理结果得到一个商品候选属性词汇集,再对此词汇集的进行分类特征分析的研究,得到分类特征集,汇总这些实验特征库,从中提取有效分类特征集,构造对应的分类特征库,再依据此特征库构建分类模型,获得商品属性的分类,形成分类后的细粒度商品文档。这样的商品文档不仅能解决当时的HS编码,同时也留有备份,为以后的HS编码工作提供先例,便于系统学习。进一步的,语义Web与知识图谱技术相结合形成国际贸易商品本体库。优选的,商品本体描述对应HS编码不唯一时,国际贸易商品本体库结合HS编码目录提供多个HS编码组成的可能结果集,每个HS编码均带有相应的编码置信度。在一些无法通过商品名称和商品属性关联直接分析区分的场合,需要设置编码置信度进行备案,通过最后报关的结果来调整编码置信度,为下次申报提供支持。进一步的,所述国际贸易商品本体库记录每次所选的HS编码,并根据选择的HS编码最终使用结果返回HS目录中调整其对应的编码置信度。这是调整编码置信度的具体方法。优选的,商品属性翻译为公共代码的具体步骤为:确定用于匹配的来源国商品描述文本和目标国商品描述文本;对文本进行预处理后筛选关键词;对关键词进行文本相似度计算;选取相似度最大的文本所对应的HS编码作为转译的HS编码;如出现错误依次选取相似度仅次的文本对应的HS编码;直至匹配成功。进一步的,记录最终的正确结果作为学习结果。优选的,筛选关键词采用TF-IDF算法。筛选关键词可选用的算法其实很多,但是TF-IDF(termfrequency–inversedocumentfrequency)作为一种用于信息检索与数据挖掘的常用加权技术的优势在于①算法简单、易于实现,降低搜索成本、提高检索速度;⑵在SEO搜索引擎优化、文本分类方面有许多成功应用,可靠性已经得以验证;③契合于本专利技术采用文本对商品描述的场景。本专利技术通过这样的技术方案,引入了公共代码的概念,从而架设起桥梁实现出口国和进口国的双向HS编码,并能通过最终的结果自行学习调整HS编码的分类可信度,最终实现高准确度的双向自动的HS编码。从而由根本上解决了用户输入信息不准、信息不全、信息模糊、信息歧义以及商品名称不唯一等产生的用户检索效率低的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一种HS编码转译方法的转译流程图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。HS编码是基于《商品名称及编码协调制度》而设置的。编码协调制度由国际海关理事会制定,英文名称为TheHarmonizationSystemCode(HS-Code),是对各种不同产品出入境应征/应退关税税率进行量化管理的制度。各国海关、商品出入境管理机构确认商品类别、进行商品分类管理、审核关税标准、检验商品品质指标的基本要素就是进出口商品通用的身份证明——HS编码。由于其权威性,也被逐渐使用到拍卖等领域。HS编码共有22大类98章。国际通行的2位码、4位码及6位码HS编码由国际海关理事会制定。6位码以上的编码及对应商品由各国自定,6位以上各国编码存在差别。同时国际海关理事会要求各国每年报送本国最新HS编码的英文语言版本,并对商品的英文描述进行规范和修订。因此本地语言的HS编码本地语言版本权威,英文商品描述的HS编码国际海关理事会的英文版权威。我国的最终HS编码表来自于WTO和中国海关,每年都需要进行更新。正是由于6位以上各国编码存在差别,且HS编码和具体对应的商品并不是一一对应的关系,因此直接转换是带来较大的误差,现阶段需要人工操作。但是这个工作对操作人员的技能要求非常高,不仅要求操作人员熟悉出口国的HS编码,本文档来自技高网...

【技术保护点】
1.一种HS编码转译方法,首先获得商品的名称或属性描述,其特征在于:通过商品名称或属性描述构建基于商品描述的商品本体,并从国际贸易商品本体库和出口国的HS编码目录中根据商品本体描述获取对应该商品本体的出口国的HS编码;将出口国的HS编码转化为对应的公共代码描述后与进口国HS编码目录中的公共代码重新匹配,发现对应进口国的HS编码。

【技术特征摘要】
1.一种HS编码转译方法,首先获得商品的名称或属性描述,其特征在于:通过商品名称或属性描述构建基于商品描述的商品本体,并从国际贸易商品本体库和出口国的HS编码目录中根据商品本体描述获取对应该商品本体的出口国的HS编码;将出口国的HS编码转化为对应的公共代码描述后与进口国HS编码目录中的公共代码重新匹配,发现对应进口国的HS编码。2.如权利要求1所述的一种HS编码转译方法,其特征在于:所述转化过程中所应用到的公共代码采用基于世贸组织库中不同国别的商品英语语言描述之间的近似度为基准。3.如权利要求1所述的一种HS编码转译方法,其特征在于:商品本体的具体获得方式为,从商品的概念出发,映射到商品领域,并且发掘商品概念之间的多种关系,从商品概念中提取出商品的属性,并将其划分类别,找出这些类别中的关联。4.如权利要求3所述的一种HS编码转译方法,其特征在于:所述划分列类别的具体方法为:从商品概念中获得商品属性数据后,对这些数据进行预处理,汇总处理结果得到一个商品候选属性词汇集,再对此词汇集的进行分类特征分析的研究,得到分类特征集,汇总这些实验特征库,从中提取有效分类特征集,构造对应的分类特征库,再依据此特征库构建分类模型,获得商品属性的分类,形成...

【专利技术属性】
技术研发人员:张为志
申请(专利权)人:杭州推点科技发展有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1