使用人工神经网络来从给定文本中查找唯一协调制度代码的方法和用于实现该方法的系统技术方案

技术编号:27695595 阅读:14 留言:0更新日期:2021-03-17 05:18
特此公开的发明专利技术通常涉及一种用于根据但不限于作为国际有效通用商品命名法标准的协调制度(HS)来为任何建议的物品分配具体/唯一编号的方法、以及一种实现用于将所述具体/唯一编号指定给建议的物品或货物的所述方法(即一种能够以概念方式处理给定文本以产生准确且精确的预测的面向机器学习的方法)的系统。

【技术实现步骤摘要】
【国外来华专利技术】使用人工神经网络来从给定文本中查找唯一协调制度代码的方法和用于实现该方法的系统
特此公开的专利技术通常涉及一种用于根据诸如作为国际有效通用商品命名法标准的协调制度(HS)的建立标准组来为任何建议的物品分配具体/唯一编号的方法、以及一种实现所述方法以便将所述具体/唯一标识编号指定给任何建议的物品或货物的系统。
技术介绍
通常称为“协调制度”或简称为“HS”的协调商品描述与编码系统是由世界海关组织(WCO)开发的多用途国际产品命名法。在进出口过程中,采购机构相应地按所述制度采取行动以便对于实际上每一国家和地区采用不同的关税方案,因此寻求用于准确地且精确地计算和分配任何货物、物品或商品的海关关税编号的方法是至关重要的。尽管已在逻辑和法律结构方面布置了源于大量商品组(大约5000个)的数据处理负载的大小,但是在此阶段在技术中存在相当大的人为误差易感性。为了解决这些担忧,本专利技术着重于以技术严谨性为手段的基于监督学习的方法;即,基于已用能够确信概念分类的五种聚类的数据进行训练的神经网络的决策机制。关于现有技术,公开号为KR101571041(B1)的文献公开了一种用于货物的协调制度(HS)分类的系统,该系统具有选择接口以进行输入接收的接口处理单元;具有HS代码对应信息的数据库;和HS代码确定单元。所述公开服从于诸如包括/排除的系统明智的规则和约束的集合,并且需要显式用户输入。US2016275446(A1)公开了一种用于确定HS代码、从用户接收可选择的确定因素并且通过与存储器存储进行比较来求取(ascertain)相似性的装置和方法。被标识为本
中的公开之一的WO2016057000(A1)定义了一种面向学习的分类方法,该方法陈述随后采用的adhoc学习规则以便提高对多种货品的整体处理能力。诸如EP2704066(A1)的其他现有技术文献涉及基于对多个变量的分析的交易分类,其被视为促进物品的标识和归类。US20050222883(A1)公开了一种用于经纪运营支持的一般系统和方法,该系统和方法遵循包括接收与具体国家的运价有关的信息的步骤,并且通过包含有人值守和无人值守的服务器和不同工作站的架构来表征。专利技术目的本专利技术的主要目的是为了提供一种用于根据协调制度(HS)向物品和货物分配海关关税编号的方法和系统,该方法和系统通过专用于按5种聚类的概念化类别而训练的基于人工神经网络的监督学习应用来表征,继而在紧随现有技术考虑时提出强大且更准确的又更精确的替代方案。
技术实现思路
在所提出的专利技术中,实现了一种物品分类和唯一标识符分配方案,该方案主要以人工神经网络即监督学习算法为中心;然而在减小误差并改进完整性的同时,使用户干预和对显式输入的需要最小化。与通常优先考虑的人工检查的标准方法相反,处理单元与数据库与用于要在海关验证的有待贸易物品的输入手段协调地工作。作为所公开的专利技术的主要部分的机器学习方法受到由实际人类执行的人工检查的前述标准方法启发并在其之后建模,其不确定性导致发布和处理起来花时间的联编报告。在这方面,作为缺点在具有稀疏模式可见性和诸如此类的参数范围的情况下利用全文本搜索的机器学习方法开发了给出具有相当大的误差的输出的模型。为了解决这个,以树状方式概述概念上定义的参数集,该参数集用于通过在下文中为每个具体级别和步骤建立专用训练集来提高训练严谨性。本专利技术提出一系列处理事件,该一系列处理事件与学习应用共线,使得能够以概念方式处理物品分类和分配的问题:物品可以假定的任何排名或可能的状态被划分成较小的部分,其背后逻辑是为了减小可能完全地由数据集的表观大小所引起的不确定性和误差,这与有关实际上讨论中的物品的组件中的任一个的技术特性和规格有关。从头开始,这意味着大量数据可能看起来无关且无法被呈现。如将在以下部分中详细说明的,可将要分配给某种物品的编号划分为四对和四位字节,该四位字节在被分别组合在一起时构成类别、章节、位置、子位置并最终构成完整编号。这种五重结构被维护在人工神经网络结构中,每一人工神经网络结构本身包含输入层、隐藏层和输出层。最初,由于一系列预处理步骤而形成查询。文本变成全部小写的并被解析,随后转换为全部UTF8字符,此后它们被分解为音节并以音素和词素的形式重新组织,稍后分成两个和三个的词组。接下来,对所有所述音素、词素和词组的组合进行向量转换,随后使其归一化。后面的步骤是人工神经网络的训练,其与输出层函数组合以使误差最小化并减少过/欠拟合,一旦被实现模型就作为文件被保存在本地磁盘上。编号分配的一般方法导致编号建议/预测结构的逐步建模:要根据基于HS的数据来训练的模型是根据对编号的导致创建训练的不同划分的先前提及的分组来设计的。因此,类别建议神经网络的输出被馈送到章节建议/预测神经网络,其输出被继而馈送到位置建议/预测神经网络等。然后,在屏幕上向人类用户显示最终建议/预测集。附图说明附图是仅仅为了举例说明唯一标识编号分配方法和用于实现所述方法的系统而给出的,该方法和系统优于现有技术的优点在上面被概述并将在下文中进行简要的说明。附图不意在界定如权利要求中所标识的保护范围,也不应该单独引用附图,以企图在不依靠本专利技术的说明书中的技术公开的情况下解释所述权利要求中标识的范围。图1演示了关于根据本专利技术的海关编号分配方法的可能的关系图。图2演示了根据本专利技术的在训练阶段之前执行的预处理步骤。图3演示了根据本专利技术的关于用于假想物品的人工神经网络的训练集的文件层次。图4演示了根据本专利技术的用于在向物品建议编号时示出有关不同人工神经网络的声称信息流的示例性示图。图5演示了根据本专利技术的人工神经网络在每一级别上的重要预处理步骤和训练过程。图6演示了根据本专利技术的总体上包括预处理、训练和预测/建议的整个人工智能模型。具体实施方式本专利技术公开了一种用于基于形成的查询向贸易物品或货物自动地分配唯一编号的方法和一种实现相同方法的系统。人工神经网络被用作该方法的关键要素以便对于原本严格且复杂的过程实现灵活性增强,以及对于更广泛直接的方法实现误差减小。要归因于讨论中的物品的唯一编号可以具有数字格式的不同组件,其中不同组承载与所述物品的不同方面或特征有关的信息。这样的过程具有许多因素要考虑并且具有许多特性以及约束要仔细研究;从而使过程变得费力且费时。为此,公开的方法和系统包括数据处理的特征,该数据处理被显著地布置为在处理各种信息的处理机制上利用机器学习概念,从而代替执行前述任务的实际人类。不同物品提出不同特性和使用区域,这在向它们指派唯一标识符时成为考虑的问题,从而常常需要大量查找表(LUT)和附带实验室检查。公开的专利技术全部解决这些问题,同时提出了一种利用适用于讨论中的系统和问题的概念分类特性的系统和程序性编号/标识符分配方案。存在于所公开的专利技术中的技术的强度建立在这样的前提上,即所述命名法过程的概念分类用来对解决方案进行建模以生成可靠且精确的输出:在需要对众多物品进行分类和标识的区域中,所述系统和方法能本文档来自技高网
...

【技术保护点】
1.一种用于以系统化和概念化方式向物品和货物分配唯一标识编号的方法,包括以下步骤:/n设计具有全连接隐藏层的至少一个人工神经网络;/n用形式为训练集的文件训练所述人工神经网络并且产生由此而得到的模型;/n形成所述人工神经网络的基于重要性的分层序列,即,所述神经网络中的一个神经网络的输出是下一个神经网络的输入;/n引入预处理的文本向量作为所述人工神经网络序列的第一级别的输入;以及/n获得对讨论中的物品/货物的唯一标识编号预测。/n

【技术特征摘要】
【国外来华专利技术】1.一种用于以系统化和概念化方式向物品和货物分配唯一标识编号的方法,包括以下步骤:
设计具有全连接隐藏层的至少一个人工神经网络;
用形式为训练集的文件训练所述人工神经网络并且产生由此而得到的模型;
形成所述人工神经网络的基于重要性的分层序列,即,所述神经网络中的一个神经网络的输出是下一个神经网络的输入;
引入预处理的文本向量作为所述人工神经网络序列的第一级别的输入;以及
获得对讨论中的物品/货物的唯一标识编号预测。


2.根据权利要求1所述的用于向物品和货物分配唯一标识编号的方法,还包括:
建立与之进行通信至少一个外部模块,以用于接受原始文本输入。


3.根据权利要求1所述的用于向物品和货物分配唯一标识编号的方法,还包括:
用于从原始文本查询来产生输入兼容向量的预处理步骤。


4.根据权利要求1所述的用于向物品和货物分配唯一标识编号的方法,其特征在于,所述预处理步骤包括以下更进一步的不同步骤:
小写处理,其中,所述原始文本查询中的每一字符被转换为小写字母并且重现词被消除;
解析,其中,词被解析并转换为UTF8格式,标点符号和非字符被抛弃,词被分解为音节和词素并且以两个和三个为一组排列,从而形成记号;
向量转换,其中,先前步骤中的数据的标记化实例和非标记化实例被转换为数字向量;以及
归一化,其中,到目前为止形成的向量被归一化以便被局限于具体区间。


5.根据权利要求1所述的用于...

【专利技术属性】
技术研发人员:阿西姆·贝尔林
申请(专利权)人:索迈兹古鲁科穆萨维立吉股份公司
类型:发明
国别省市:土耳其;TR

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1