一种基于迁移学习的运输投送知识问答方法技术

技术编号:28837810 阅读:28 留言:0更新日期:2021-06-11 23:35
本发明专利技术涉及一种基于迁移学习的运输投送知识问答方法,获取运输投送相关知识。将运输投送过程中接收到的结构化数据、半结构化数据、非结构化数据、图像、话音、视频等分类处理为实体、属性、关系;构建关系抽取网络,抽取实体间的关系,生成RDF三元组,针对自动生成的三元组进行人工处理,实体对齐、消歧后分类存储;使用迁移学习框架对无标注的运输投送数据进行学习,支撑运输投送系统的知识问答。本发明专利技术构建基于问答模式的运输投送系统知识图谱,通过迁移学习在仅有小样本标注数据的情况下,自学习不同承运、不同投送方式的问答序列,从而对相关用户提问快速提供运输投送方案,在运输投送领域具备普适性和泛化能力。

【技术实现步骤摘要】
一种基于迁移学习的运输投送知识问答方法
本专利技术涉及机器学习
,更具体地说,涉及一种基于迁移学习的运输投送知识问答方法。
技术介绍
运输投送系统逐渐成为物流配送、跨国投送,甚至军用机动控制的核心系统,该系统不仅包含常规的立体投送规划功能,还包含装卸载方案规划、换乘换装方案规划功能,随着大数据、机器学习、知识图谱各类相关技术的兴起,运输投送系统不断转型升级,运输投送系统的智能知识问答功能应运而生。本专利提出一种基于迁移学习的运输投送知识问答方法,该方法针对不同规模、不同规格的被承运物(人)如何智能计算装卸载方案、换乘换装方案,以及在不同投送方式、不同规划目标下如何智能规划混合投送路径的问题,构建基于问答模式的运输投送系统知识图谱,通过迁移学习在仅有小样本标注数据的情况下,自学习不同承运、不同投送方式的问答序列,从而对相关用户提问快速提供运输投送方案。知识问答的核心在于信息检索,然而,以关键字为基础的索引、匹配算法尽管简单易行,但毕竟停留在语言的表层,没有触及语义,因此效果很难进一步提高。随着5G网络及智能话音设备的飞速发展,运输投送系统需要高效、准确、垂直领域的交互问答服务,传统基于结构化数据的问答、基于自由文本的问答、基于问题答案对的问答,需要依赖源数据结构化表示、大规模人工标注、对轮模式等基于规则的大量样本数据,现有的知识问答系统在运输投送领域不具备普适性和泛化能力,而针对运输投送这一垂直领域,属于专业性较强的垂直领域,无法使用CuratedKBs知识库、ExtractedKBs知识库等常用知识库。
技术实现思路
本专利技术解决上述技术问题所采用的技术方案是:构造一种基于迁移学习的运输投送知识问答方法,包括:获取运输投送知识并进行分类;运输投送知识分类步骤中,将运输投送知识分为文本、图像、视频;基于分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性;基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库;构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率;将得到的实体关系进行人工核查,按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配,生成符合标准的RDF三元组;将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域;将静态规划环境域作为迁移学习模型的源域,将静态规划环境域模型计算的约束参数迁移到动态规划环境域中,作为迁移学习模型的目标域;挖掘源域和目标域的相似性,微调静态方案规划环境域的参数并确定发生变化的数据相应的参数,通过人在回路的方式微调动态规划环境域的网络参数;将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统,解析实时的问题,提取问题中的关键字并输入运输投送知识问答系统,输出的实体作为问题答案的关键字,组成系统回复。其中,在获取运输投送知识的步骤中,运输投送知识包括立体投送知识和装卸载、换装换乘知识;其中,立体投送知识是立体投送路径规划,分为陆地路径规划、空中航迹规划和海上航线规划。其中,在对分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性的步骤中,文本知识空间构建:将获取的文本,按结构化数据、半结构化数据和非结构化数据的类型分类;其中,简短的指令通过文档标题直接归类,文书通过标题或将长篇文书分段归类;将文本知识输入jieba分词器,进行细粒度运输投送词汇的切分,利用人工标注实体及实体属性;图像知识空间构建:将获取的图像知识进行目标识别,将识别的目标进行图像配准,将分析计算后的目标属性转为格式化数据;将图像转化的格式化数据利用人工标注实体及实体属性;视频知识空间构建:将获取的视频知识进行帧处理,提取集中出现某实体的数帧图像,进行目标识别与图像配准,将分析计算后的目标属性转为格式化数据;将视频转化的格式化数据,利用人工标注实体及实体属性。其中,在基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库的步骤中,包括步骤:使用Skip-gram模型,将标注的实体作为中心词W(t)进行预测;模型输入值中心词的one-hot编码形式,输出为softmax转换后的概率;Word2vec模型训练后得到运输投送知识的所有实体的词向量,同时人工标注各实体间的关系,作为运输投送知识标注后的语料库。其中,在构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率的步骤中,关系抽取网络包含embedding层、transform层、cov1D层、maxPooling1D层、dropout层、liner层和softmax输出层;运输投送知识的词向量按Batch块输入embedding层,得到Batch*length*Embed大小的多维向量,通过transform层转置多维向量为一条句子一个向量块输入cov1D层,通过一个CNN结构对句子向量进行特征提取,通过maxPooling1D层最大池化得到降维后的向量块,加入一层dropout层防止过拟合后输入liner层,学习句子关系与目标关系的线性相关性,最后输入softmax层得到实体关系匹配概率。其中,将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域的步骤中,包括步骤:将来自路径规划知识库、装卸载换车换乘知识库的不同来源的实体进行对齐或消歧,将等价实例、等价类/子类、等价属性/子属性三类融合;将运输投送知识分类为输送路线搜索、纵梯队自动划分、输送装卸载三类知识库;将各类知识按照语义空间划分为不同子类,将对齐后的实体、关系、属性分类收集、更新,构建运输投送分类树;将对齐融合后的运输投送RDF三元组,采用图数据库(neo4j)按照分类树架构进行分类存储。其中,在挖掘源域和目标域的相似性的步骤中,挖掘方式包括:在动态规划环境域中,当地表地形环境/空中规划环境/海上规划环境不随时间的推荐发生变化时,动态规划场景退化为静态规划场景;在动态规划环境域中,气象数据发生的变化不足以影响装备机动参数时,动态规划场景沿用静态规划场景学习的知识数据;在动态规划环境域中,当装备运输区域与发生变化的地表地形空间距离较远时,装备周围的自由空间在动态和静态场景下基本保持一致;基于DDPG的规划方法,输入是每一帧的图像,输出是方案规划结果,所以静态规划和动态规划在每一帧的处理算法上本质是相同的,动态规划场景可以理解为静态场景和动态目标的叠加。...

【技术保护点】
1.一种基于迁移学习的运输投送知识问答方法,其特征在于,包括:/n获取运输投送知识并进行分类;运输投送知识分类步骤中,将运输投送知识分为文本、图像、视频;/n基于分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性;/n基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库;/n构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率;/n将得到的实体关系进行人工核查,按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配,生成符合标准的RDF三元组;/n将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域;/n将静态规划环境域作为迁移学习模型的源域,将静态规划环境域模型计算的约束参数迁移到动态规划环境域中,作为迁移学习模型的目标域;/n挖掘源域和目标域的相似性,微调静态方案规划环境域的参数并确定发生变化的数据相应的参数,通过人在回路的方式微调动态规划环境域的网络参数;/n将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统,解析实时的问题,提取问题中的关键字并输入运输投送知识问答系统,输出的实体作为问题答案的关键字,组成系统回复。/n...

【技术特征摘要】
1.一种基于迁移学习的运输投送知识问答方法,其特征在于,包括:
获取运输投送知识并进行分类;运输投送知识分类步骤中,将运输投送知识分为文本、图像、视频;
基于分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性;
基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关系,以构建运输投送知识的语料库;
构建关系抽取网络,将通过Word2vec模型训练得到的词向量输入关系抽取网络,输出运输投送知识中实体间的实体关系匹配概率;
将得到的实体关系进行人工核查,按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配,生成符合标准的RDF三元组;
将RDF三元组中的实体进行对齐或消歧,实现运输投送知识融合,构建运输投送分类树,采用图数据库按分类树架构进行分类存储,构建静态规划环境域;
将静态规划环境域作为迁移学习模型的源域,将静态规划环境域模型计算的约束参数迁移到动态规划环境域中,作为迁移学习模型的目标域;
挖掘源域和目标域的相似性,微调静态方案规划环境域的参数并确定发生变化的数据相应的参数,通过人在回路的方式微调动态规划环境域的网络参数;
将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统,解析实时的问题,提取问题中的关键字并输入运输投送知识问答系统,输出的实体作为问题答案的关键字,组成系统回复。


2.根据权利要求1所述的基于迁移学习的运输投送知识问答方法,其特征在于,在获取运输投送知识的步骤中,运输投送知识包括立体投送知识和装卸载、换装换乘知识;
其中,立体投送知识是立体投送路径规划,分为陆地路径规划、空中航迹规划和海上航线规划。


3.根据权利要求1所述的基于迁移学习的运输投送知识问答方法,其特征在于,在对分类后的运输投送知识,进行知识空间构建、分词及实体识别,标注出运输投送知识中的实体及实体属性的步骤中,
文本知识空间构建:将获取的文本,按结构化数据、半结构化数据和非结构化数据的类型分类;其中,简短的指令通过文档标题直接归类,文书通过标题或将长篇文书分段归类;将文本知识输入jieba分词器,进行细粒度运输投送词汇的切分,利用人工标注实体及实体属性;
图像知识空间构建:将获取的图像知识进行目标识别,将识别的目标进行图像配准,将分析计算后的目标属性转为格式化数据;将图像转化的格式化数据利用人工标注实体及实体属性;
视频知识空间构建:将获取的视频知识进行帧处理,提取集中出现某实体的数帧图像,进行目标识别与图像配准,将分析计算后的目标属性转为格式化数据;将视频转化的格式化数据,利用人工标注实体及实体属性。


4.根据权利要求3所述的基于迁移学习的运输投送知识问答方法,其特征在于,在基于Word2vec模型训练,得到运输投送知识所有实体的词向量,同时标注各实体之间的关...

【专利技术属性】
技术研发人员:孙玉洁张昊齐和平
申请(专利权)人:北方自动控制技术研究所
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1