模型训练方法、系统、计算机可读介质和电子设备技术方案

技术编号：24855214 阅读：41 留言：0更新日期：2020-07-10 19:08

一种模型训练方法、系统、计算机可读介质和电子设备。该模型训练方法包括：根据输入的多媒体数据中的多帧视频图像，以及所述多媒体数据中，与所述视频图像中的图像特征对应的音频数据，构建所述图像特征的知识图谱；其中，所述音频数据用于定义所述图像特征的特征属性；根据所述知识图谱，对待训练的神经网络模型进行训练。该方法避免了使用单一的训练图像对神经网络模型进行训练，同时对图像和声音采样并提取特征，避免了转化成字符的过程，提高了神经网络模型训练的精度和质量。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、系统、计算机可读介质和电子设备
本申请实施例涉及人工智能
，尤其涉及一种模型训练方法、模型训练系统、计算机可读介质和电子设备。
技术介绍
NLP(Neuro-LinguisticProgramming，自然语言处理)是计算机科学领域与人工智能领域中的一个重要方法，是一门融语言学、计算机科学、数学于一体的科学。在通过NLP方法对图像进行识别时，通常是利用训练图像对NLP模型进行训练，利用训练完成的NLP模型对图像进行识别。比如，基于OCR(OpticalCharacterRecognition，光学字符识别)方法，基于训练完成的识别模型，通过暗、亮模式检测待识别图像，确定待识别图像中特征的形状，然后用字符识别方法将形状转译为计算机可识别的字符，达到识别图像的目的。
技术实现思路
但是，在现有技术中，利用训练图像对NLP模型进行训练，通过这种方法训练完成的NLP模型在图像的识别过程中，存在着明显的局限。有鉴于此，本申请实施例提供一种模型训练方法、系统、计算机可读介质和电子设备。本申请实施例提供了一种模型训练方法，包括：根据输入的多媒体数据中的多帧视频图像，以及所述多媒体数据中，与所述视频图像中的图像特征对应的音频数据，构建所述图像特征的知识图谱；其中，所述音频数据用于定义所述图像特征的特征属性；根据所述知识图谱，对待训练的神经网络模型进行训练。可选地，在本申请的任一实施例中，所述根据输入的多媒体数据中的多帧视频图像，以及所述多媒体数据中，与所述视频图像中的图...

【技术保护点】
1.一种模型训练方法，其特征在于，包括：/n根据输入的多媒体数据中的多帧视频图像，以及所述多媒体数据中，与所述视频图像中的图像特征对应的音频数据，构建所述图像特征的知识图谱；其中，所述音频数据用于定义所述图像特征的特征属性；/n根据所述知识图谱，对待训练的神经网络模型进行训练。/n

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：
根据输入的多媒体数据中的多帧视频图像，以及所述多媒体数据中，与所述视频图像中的图像特征对应的音频数据，构建所述图像特征的知识图谱；其中，所述音频数据用于定义所述图像特征的特征属性；
根据所述知识图谱，对待训练的神经网络模型进行训练。

2.根据权利要求1所述的方法，其特征在于，所述根据输入的多媒体数据中的多帧视频图像，以及所述多媒体数据中，与所述视频图像中的图像特征对应的音频数据，构建所述图像特征的知识图谱，包括：
选取多帧所述视频图像中包含有所述图像特征的一帧所述视频图像进行分割，生成N个视频子图像，其中，N为正整数；
根据N个所述视频子图像，以及与所述图像特征对应的所述音频数据，构建包含N+1个节点的所述知识图谱。

3.根据权利要求2所述的方法，其特征在于，所述根据N个所述视频子图像，以及与所述图像特征对应的所述音频数据，构建包含N+1个节点的所述知识图谱，包括：
基于预设的卷积神经网络模型，对N个所述视频子图像分别进行特征提取，得到每个所述视频子图像的图像特征编码；
基于所述卷积神经网络模型，对所述音频数据进行特征提取，得到所述音频数据的音频特征编码；
根据所述音频特征编码和N个所述图像特征编码，构建包含N+1个节点的所述知识图谱。

4.根据权利要求1所述的方法，其特征在于，所述根据所述知识图谱，对待训练的神经网络模型进行训练，包括：根据所述知识图谱中节点之间的属性关系，对待训练的所述神经网络模型进行训练。

5.根据权利要求1-4任一所述的方法，其特征在于，待训练的所述神经网络模型为图神经网络模型。

6.一种模型训练系统，其特征在于，包括：
图谱单元，配置为根据输入的多媒体数据中的多帧视频图像，以及所述多媒体数据中，与所述视频图像中的...

【专利技术属性】
技术研发人员：陈志熙，
申请(专利权)人：南京星火技术有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人