一种基于迁移学习的运输投送知识问答方法技术

技术编号：28837810 阅读：28 留言：0更新日期：2021-06-11 23:35

本发明专利技术涉及一种基于迁移学习的运输投送知识问答方法，获取运输投送相关知识。将运输投送过程中接收到的结构化数据、半结构化数据、非结构化数据、图像、话音、视频等分类处理为实体、属性、关系；构建关系抽取网络，抽取实体间的关系，生成RDF三元组，针对自动生成的三元组进行人工处理，实体对齐、消歧后分类存储；使用迁移学习框架对无标注的运输投送数据进行学习，支撑运输投送系统的知识问答。本发明专利技术构建基于问答模式的运输投送系统知识图谱，通过迁移学习在仅有小样本标注数据的情况下，自学习不同承运、不同投送方式的问答序列，从而对相关用户提问快速提供运输投送方案，在运输投送领域具备普适性和泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于迁移学习的运输投送知识问答方法
本专利技术涉及机器学习
，更具体地说，涉及一种基于迁移学习的运输投送知识问答方法。
技术介绍
运输投送系统逐渐成为物流配送、跨国投送，甚至军用机动控制的核心系统，该系统不仅包含常规的立体投送规划功能，还包含装卸载方案规划、换乘换装方案规划功能，随着大数据、机器学习、知识图谱各类相关技术的兴起，运输投送系统不断转型升级，运输投送系统的智能知识问答功能应运而生。本专利提出一种基于迁移学习的运输投送知识问答方法，该方法针对不同规模、不同规格的被承运物(人)如何智能计算装卸载方案、换乘换装方案，以及在不同投送方式、不同规划目标下如何智能规划混合投送路径的问题，构建基于问答模式的运输投送系统知识图谱，通过迁移学习在仅有小样本标注数据的情况下，自学习不同承运、不同投送方式的问答序列，从而对相关用户提问快速提供运输投送方案。知识问答的核心在于信息检索，然而，以关键字为基础的索引、匹配算法尽管简单易行，但毕竟停留在语言的表层，没有触及语义，因此效果很难进一步提高。随着5G网络及智能话音设备的飞速发展，运输投送系统需要高效、准确、垂直领域的交互问答服务，传统基于结构化数据的问答、基于自由文本的问答、基于问题答案对的问答，需要依赖源数据结构化表示、大规模人工标注、对轮模式等基于规则的大量样本数据，现有的知识问答系统在运输投送领域不具备普适性和泛化能力，而针对运输投送这一垂直领域，属于专业性较强的垂直领域，无法使用CuratedKBs知识库、ExtractedKBs知识库等常用知识库。

【技术保护点】
1.一种基于迁移学习的运输投送知识问答方法，其特征在于，包括：/n获取运输投送知识并进行分类；运输投送知识分类步骤中，将运输投送知识分为文本、图像、视频；/n基于分类后的运输投送知识，进行知识空间构建、分词及实体识别，标注出运输投送知识中的实体及实体属性；/n基于Word2vec模型训练，得到运输投送知识所有实体的词向量，同时标注各实体之间的关系，以构建运输投送知识的语料库；/n构建关系抽取网络，将通过Word2vec模型训练得到的词向量输入关系抽取网络，输出运输投送知识中实体间的实体关系匹配概率；/n将得到的实体关系进行人工核查，按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配，生成符合标准的RDF三元组；/n将RDF三元组中的实体进行对齐或消歧，实现运输投送知识融合，构建运输投送分类树，采用图数据库按分类树架构进行分类存储，构建静态规划环境域；/n将静态规划环境域作为迁移学习模型的源域，将静态规划环境域模型计算的约束参数迁移到动态规划环境域中，作为迁移学习模型的目标域；/n挖掘源域和目标域的相似性，微调静态方案规划环境域的参数并确定发生变化的数据相应的参数，通过人在回路的...

【技术特征摘要】
1.一种基于迁移学习的运输投送知识问答方法，其特征在于，包括：
获取运输投送知识并进行分类；运输投送知识分类步骤中，将运输投送知识分为文本、图像、视频；
基于分类后的运输投送知识，进行知识空间构建、分词及实体识别，标注出运输投送知识中的实体及实体属性；
基于Word2vec模型训练，得到运输投送知识所有实体的词向量，同时标注各实体之间的关系，以构建运输投送知识的语料库；
构建关系抽取网络，将通过Word2vec模型训练得到的词向量输入关系抽取网络，输出运输投送知识中实体间的实体关系匹配概率；
将得到的实体关系进行人工核查，按照运输投送经验及知识进行正确的实体、关系、实体三元组匹配，生成符合标准的RDF三元组；
将RDF三元组中的实体进行对齐或消歧，实现运输投送知识融合，构建运输投送分类树，采用图数据库按分类树架构进行分类存储，构建静态规划环境域；
将静态规划环境域作为迁移学习模型的源域，将静态规划环境域模型计算的约束参数迁移到动态规划环境域中，作为迁移学习模型的目标域；
挖掘源域和目标域的相似性，微调静态方案规划环境域的参数并确定发生变化的数据相应的参数，通过人在回路的方式微调动态规划环境域的网络参数；
将调整完成的迁移学习模型的源域和目标域作为运输投送知识问答系统，解析实时的问题，提取问题中的关键字并输入运输投送知识问答系统，输出的实体作为问题答案的关键字，组成系统回复。

2.根据权利要求1所述的基于迁移学习的运输投送知识问答方法，其特征在于，在获取运输投送知识的步骤中，运输投送知识包括立体投送知识和装卸载、换装换乘知识；
其中，立体投送知识是立体投送路径规划，分为陆地路径规划、空中航迹规划和海上航线规划。

3.根据权利要求1所述的基于迁移学习的运输投送知识问答方法，其特征在于，在对分类后的运输投送知识，进行知识空间构建、分词及实体识别，标注出运输投送知识中的实体及实体属性的步骤中，
文本知识空间构建：将获取的文本，按结构化数据、半结构化数据和非结构化数据的类型分类；其中，简短的指令通过文档标题直接归类，文书通过标题或将长篇文书分段归类；将文本知识输入jieba分词器，进行细粒度运输投送词汇的切分，利用人工标注实体及实体属性；
图像知识空间构建：将获取的图像知识进行目标识别，将识别的目标进行图像配准，将分析计算后的目标属性转为格式化数据；将图像转化的格式化数据利用人工标注实体及实体属性；
视频知识空间构建：将获取的视频知识进行帧处理，提取集中出现某实体的数帧图像，进行目标识别与图像配准，将分析计算后的目标属性转为格式化数据；将视频转化的格式化数据，利用人工标注实体及实体属性。

4.根据权利要求3所述的基于迁移学习的运输投送知识问答方法，其特征在于，在基于Word2vec模型训练，得到运输投送知识所有实体的词向量，同时标注各实体之间的关...

【专利技术属性】
技术研发人员：孙玉洁，张昊，齐和平，
申请(专利权)人：北方自动控制技术研究所，
类型：发明
国别省市：山西;14

全部详细技术资料下载我是这个专利的主人