一种基于机器学习的物流信息查询方法、装置及系统制造方法及图纸

技术编号：39967627 阅读：8 留言：0更新日期：2024-01-09 00:32

本发明专利技术提出了一种基于机器学习的物流信息查询方法、装置及系统，通过生成对抗网络和注意力机制，用于解决自然语言查询物流信息时无法准确匹配查询意图和物流信息系统中的数据,无法获取到完整且准确的物流信息，生成基于注意力的生成对抗网络通过对抗训练学习内在特征，改进了利用自然语言进行物流信息查询的质量和效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及物流，尤其是涉及到一种基于机器学习的物流信息查询方法、装置及系统。

技术介绍

1、现有技术中利用自然语言直接查询物流信息系统存在词汇覆盖面有限的问题。因为物流信息系统中的数据结构和字段都是事先定义好的,与自然语言的表达存在差距。这会导致使用自然语言作为查询时无法准确匹配查询意图和物流信息系统中的数据,无法获取到完整且准确的物流信息。

2、我们注意到生成对抗网络可以通过对抗训练的方式获得查询物流信息系统的内在映射特征,实现从无标注数据到产生逼真物流信息的过程。生成对抗网络的生成器学习到编码真实分布信息的潜在表示。这样,生成对抗网络可以不依赖自然语言的表达,直接建模物流信息系统中的模式,产生信息查询所需的关键数据特征,从而实现准确查询。

3、此外,结合注意力机制的生成对抗网络可以在训练过程中关注物流信息中的关键字段,对比号、地点、状态等最重要的特征。注意力机制使得生成的信息更加真实,也增强了判别器正确判断真伪信息的能力。最终形成的查询系统可以更加精确地捕捉信息特征,实现对物流信息的准确无偏查询。

4、所以,利用生成对抗学习尤其是注意力机制的生成对抗网络,可以有效解决现有技术中利用自然语言直接查询的词汇匹配有限,查询结果不准确的问题。

5、鉴于此，我们提出了一种基于机器学习的物流信息查询方法、装置、及系统。

技术实现思路

1、鉴于现有技术中利用自然语言进行物流信息查询中的问题，本专利技术提供了一种基于机器学习的物流信息查询方法，具体包括如下步骤：

2、步骤1：设计一个能够生成假的物流单号和物流信息的生成网络；该生成网络由编码器和解码器组成,编码器输入随机噪声向量,解码器输出假的物流信息；为了使生成的信息更加真实,在解码器中引入注意力机制,使其能够在生成信息时关注输入向量的不同部分。

3、具体包括如下步骤：

4、步骤1.1：生成网络的输入为随机噪声向量z,其中每个元素服从高斯分布或均匀分布；生成网络的输出为假的物流信息,其中包含m个字段,每个字段用一个向量xi表示,即生成网络输出为向量序列(x1,x2,...,xm)；

5、步骤1.2：编码器结构设计编码器由多层全连接层组成,每层使用relu激活函数；第l层编码器的变换公式如下：hl = relu(wlh(l-1)+bl) 其中wl和bl分别为第l层的权重矩阵和偏置向量；编码器的最后一层输出即为映射到隐空间的向量h；

6、步骤1.3：对于解码器的第i步,定义注意力权重：αi,j = softmax(vttanh(w1hi+w2hj)) 其中v, w1和w2为学习的参数；注意力权重反映了解码器在当前步关注输入向量h的不同部分；

7、步骤1.4：基于注意力机制,解码器在第i步的输入为：ci = σjαi,jhj 解码器将ci通过多层网络映射为输出向量xi；

8、步骤1.5：生成网络的优化目标为最小化所生成物流信息被判别器判断为假的概率,即最小化交叉熵损失。

9、步骤2：构建一个能对输入的物流信息进行真伪判断的判别网络；该网络使用卷积神经网络提取输入信息的特征表示,然后在特征的基础上判断特征是否属于真实物流信息的分布；同样在判别网络中使用注意力机制,使其能关注物流信息中的关键字段(如单号、地点等),以提高判断准确度。

10、具体包括如下步骤：

11、步骤2.1：判别网络的输入为物流信息,包含m个字段,每个字段是一个向量；输入记为(x1,x2,...,xm),判别网络输出一个概率p∈[0,1],表示输入信息被判断为真实物流信息的概率；

12、步骤2.2：判别网络使用卷积神经网络提取输入各字段的特征；对第i个字段xi,通过卷积层提取特征：fi = relu(conv(xi)) 其中conv表示卷积操作；

13、步骤2.3：定义注意力权重：βi = softmax(uttanh(wfi + b)) 其中u,w,b为学习参数；注意力权重反映了不同字段对判断结果的重要性；最终得到特征融合：f = σiβifi；

14、步骤2.4：得到融合特征f后,通过多层全连接网络得到真伪概率：p = sigmoid(w'f + b')，其中w'和b'为全连接层参数；真伪判断的优化目标是最大化判断正确的对数似然。

15、步骤3：使用真实的物流数据集提前训练判别器,使其熟悉真实物流信息的特征分布,能够较准确地判断输入信息的真伪。

16、具体包括如下步骤：

17、步骤3.1：收集大量真实的物流单号和物流信息,构建判别器的训练数据集；数据集包括输入字段：(单号、地点、状态等),以及标签(真/假)；

18、步骤3.2：初始化判别网络中的卷积层、全连接层等所有的权重矩阵和偏置向量；权重矩阵初始化为小的随机数,偏置向量初始化为0；

19、步骤3.3：判别器的训练目标是最大化判断真实物流信息为真的概率,同时最大化判断假的信息为假的概率；损失函数定义为二元交叉熵损失：l = -[ylogp + (1-y)log(1-p)] 其中y为真实标签,p为判断结果；

20、步骤3.4：使用rmsprop自适应学习率的优化算法来更新判别器中的参数，通过梯度下降法不断减小损失函数,优化判别效果；

21、步骤3.5：设置训练的early stopping策略；当模型在验证集上的指标(如accuracy)连续n个epoch不再改善,则终止训练,避免过拟合，保存效果最好的模型参数。

22、步骤4：在判别器参数固定的情况下,训练生成器以提高其生成真实信息的能力,目的是最大化骗过判别器的概率。

23、具体包括如下步骤：

24、步骤4.1：在判别器的参数(卷积层和全连接层权重)不变的情况下,只优化生成器的参数；

25、步骤4.2：生成网络的目标是生成逼真的假信息来欺骗判别器；因此其损失函数定义为：l_g = -log(d(g(z))) 其中g表示生成器模型,d表示判别器模型,z是生成器的随机噪声输入；损失函数表示最大化欺骗判别器判断为真实的概率；

26、步骤4.3：将随机噪声向量输入生成器生成假的物流信息,然后将这些假信息输入判别器计算生成器损失函数l_g；基于l_g通过梯度下降更新生成器中的编码器和解码器的模型参数,最小化l_g,优化生成逼真假信息的能力。

27、步骤5：当生成器参数固定后,使用更新的参数再次训练判别器,使其能从更新的生成信息中学习,进一步提升对真实信息特征的判断能力。

28、具体包括如下步骤：

29、步骤5.1：在生成器的模型参数固定的条件下,只优化判别器中的参数；

30、步骤5.2：使用在步骤4中优化过的参数的生成器,输入随机噪声生成新的假的物流数据；

31、步骤5.3：将生成器生成的新的假数据与真实物流数据组本文档来自技高网...

【技术保护点】

1.一种基于机器学习的物流信息查询方法，其特征在于，所述方法包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，所述步骤1具体为：

3.根据权利要求1所述的方法，其特征在于，所述步骤2具体为：

4.根据权利要求1所述的方法，其特征在于，所述步骤3具体为：

5.根据权利要求1所述的方法，其特征在于，所述步骤4具体为：

6.根据权利要求1所述的方法，其特征在于，所述步骤5具体为：

7.根据权利要求1所述的方法，其特征在于，所述步骤6具体为：

8.一种基于机器学习的物流信息查询装置，其特征在于，所述装置为提供查询界面的任何电子设备，所述电子设备用以执行如权利要求1-7任一方法中的步骤。

9.一种基于机器学习的物流信息查询系统，其特征在于，所述系统包括前端子系统，传输子系统以及后端子系统，所述前端子系统用来接收物流信息查询请求，所属传输子系统将所述物流信息查询请求传输至所述后端子系统，所述后端子系统用来执行如上述权利要求1-7中任一方法中的步骤得到查询结果，并将查询结果通过所述传输子系统传回到前端子系统。

...

【技术特征摘要】

1.一种基于机器学习的物流信息查询方法，其特征在于，所述方法包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，所述步骤1具体为：

3.根据权利要求1所述的方法，其特征在于，所述步骤2具体为：

4.根据权利要求1所述的方法，其特征在于，所述步骤3具体为：

5.根据权利要求1所述的方法，其特征在于，所述步骤4具体为：

6.根据权利要求1所述的方法，其特征在于，所述步骤5具体为：

7.根据权利要求1所述的方法，其特征在于，所述步...

【专利技术属性】
技术研发人员：刘利，王鹏飞，刘炯伟，黄颖琴，
申请(专利权)人：运易通科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人