用于图像处理的系统和方法技术方案

技术编号：24996194 阅读：15 留言：0更新日期：2020-07-24 17:58

一种用于图像处理的系统和方法。该方法包括：提供文本向量转换器；提供推理模型，并使用已标记服装条目来预训练该推理模型；提供未标记服装条目；将每个未标记服装条目分为目标图像和目标文本；使用文本向量转换器将目标文本转换为类别向量和属性向量；使用推理模型对目标图像进行处理，以获得处理后的目标图像和目标图像标签；将类别向量与目标图像标签进行比较；当类别向量与目标图像标签匹配时，基于类别向量和属性向量来更新目标图像标签，以获得更新后的标签；以及使用处理后的目标图像和更新后的标签来重新训练推理模型。

全部详细技术资料下载

【技术实现步骤摘要】
用于图像处理的系统和方法相关申请的交叉引用在本专利技术的描述中引用和讨论了一些参考文献，其可以包括专利、专利申请和各种出版物。提供这样的参考文献的引用和/或讨论仅为了阐明本专利技术的描述，而不是承认任何这样的参考文献是本文所描述的专利技术的“现有技术”。在本说明书中引用和讨论的所有参考文献均以引用的方式整体并入本文，并且在一定程度上如同每篇参考文献通过引用被单独地并入。
本专利技术总体上涉及图像处理技术，并且更具体地涉及一种用于从服装图像中提取属性的系统和方法。
技术介绍
出于总体上呈现本专利技术的上下文的目的而在本文提供背景描述。既不明确地承认也不暗示地承认当前列名的专利技术人的在
技术介绍
部分中描述的范围内的工作、以及在提交时可能不是作为现有技术的描述的各方面为与本专利技术相对的现有技术。随着电子商务的日益普及，为消费者提供了大量产品，尤其是服装产品。显示那些产品的属性或特征对于消费者有效评估产品是至关重要的。然而，由于缺乏信息或信息的非标准化格式，准确而完整地标记产品的属性具有挑战性。因此，在本领域中存在未解决的需求，以用于解决上述缺陷和不足。
技术实现思路
在某些方面，本专利技术涉及一种用于图像处理的方法。在某些实施例中，该方法包括：提供文本向量转换器；提供推理模型，并使用第一数量的已标记服装条目来预训练所述推理模型；提供第二数量的服装条目，其中，所述服装条目未被标记；将第二数量的服装条目中的每一个分为目标图像和目标文本；>使用所述文本向量转换器将所述目标文本转换为类别向量和属性向量，其中，所述类别向量包括与服装类别相对应的多个维度，并且所述属性向量包括与服装属性相对应的多个维度；使用所述推理模型对所述目标图像进行处理，以获得处理后的目标图像和目标图像标签；将所述类别向量与所述目标图像标签进行比较；当所述类别向量与所述目标图像标签匹配时，基于所述类别向量和所述属性向量来更新所述目标图像标签，以获得更新后的标签；以及使用所述处理后的目标图像和所述更新后的标签来重新训练所述推理模型。在某些实施例中，将所述目标文本转换为所述类别向量和所述属性向量的步骤包括：提供类别名称列表和属性名称列表，其中，所述类别名称列表包括服装类别的词表，并且所述属性名称列表包括服装属性的词表；初始化所述类别向量和所述属性向量；拆分所述目标文本以获得目标词；将所述目标词中的每一个与所述类别名称列表和所述属性名称列表进行比较，以获得相似度得分；当所述相似度得分大于阈值时，更新所述类别向量或所述属性向量。在某些实施例中，初始化所述类别向量和所述属性向量的步骤是通过以下操作来执行的：将所述类别向量的多个维度定义为所述类别名称列表中的多个类别；以及将所述属性向量的多个维度定义为所述属性名称列表中的多个属性。在某些实施例中，拆分所述目标文本以获得目标词的步骤包括：将所述目标文本拆分为句子；将所述句子中的每一个拆分为拆分词；以及从所述拆分词中去除非服装词，以获得所述目标词。在某些实施例中，将所述目标词中的每一个与所述类别名称列表和所述属性名称列表进行比较以获得所述相似度得分的步骤是通过以下操作执行的：利用词向量模型将所述目标词中的每一个转换为目标向量；使用所述词向量模型将所述类别名称列表和所述属性名称列表转换为参考向量；以及在向量空间中将所述目标向量与所述参考向量进行比较，其中，利用服装相关词来预训练所述词向量模型。在某些实施例中，当所述目标向量与所述参考向量之一相同时，所述相似度得分被定义为1；当所述目标向量远离所有所述参考向量时，所述相似度得分被定义为0，并且所述阈值被设置为约0.8。在某些实施例中，所述已标记服装条目中的每一个包括标签，其中，所述标签是与图像的服装特征有关的词。在某些实施例中，该方法还包括：当所述类别向量中的每一个维度的值为0时，通过将所述目标图像标签定义为空来更新所述目标图像标签。在某些实施例中，该方法还包括：当所述类别向量与所述目标图片标签不匹配时，提供用于更新所述目标图像标签的用户界面。在某些实施例中，所述第一数量大约为或小于2000，并且所述第二数量大于100万。在某些方面，本专利技术涉及用于图像处理的系统。在某些实施例中，该系统包括：计算设备，包括处理器和存储计算机可执行代码的存储设备，其中，所述计算机可执行代码包括文本向量转换器、推理模型、第一数量的已标记服装条目和第二数量的未标记服装条目，并且所述计算机可执行代码当在所述处理器上执行时,被配置为：使用所述第一数量的已标记服装条目来预训练所述推理模型；将所述第二数量的服装条目中的每一个分为目标图像和目标文本；使用所述文本向量转换器将所述目标文本转换为类别向量和属性向量，其中，所述类别向量包括与服装类别相对应的多个维度，并且所述属性向量包括与服装属性相对应的多个维度；使用所述推理模型对所述目标图像进行处理，以获得处理后的目标图像和目标图像标签；将所述类别向量与所述目标图像标签进行比较；当所述类别向量与所述目标图像标签匹配时，基于所述类别向量和所述属性向量来更新所述目标图像标签，以获得更新后的标签；以及使用所述处理后的目标图像和所述更新后的标签来重新训练所述推理模型。在某些实施例中，该计算机可执行代码被配置为通过以下操作来将所述目标文本转换为所述类别向量和所述属性向量：提供类别名称列表和属性名称列表，其中，所述类别名称列表包括服装类别的词表，并且所述属性名称列表包括服装属性的词表；通过将所述类别向量的多个维度定义为所述类别名称列表中的多个类别，并将所述属性向量的多个维度定义为所述属性名称列表中的多个属性，来初始化所述类别向量和所述属性向量；将所述目标文本拆分为句子，将所述句子中的每一个拆分为拆分词，并且从所述拆分词中去除非服装词，以获得目标词；将所述目标词中的每一个与所述类别名称列表和所述属性名称列表进行比较，以获得相似度得分；当所述相似度得分大于阈值时，更新所述类别向量或所述属性向量。在某些实施例中，所述计算机可执行代码被配置为通过以下操作来获得所述相似度得分：利用词向量模型将所述目标词中的每一个转换为目标向量；使用所述词向量模型将所述类别名称列表和所述属性名称列表转换为参考向量；以及在向量空间中将所述目标向量与所述参考向量进行比较，其中，利用服装相关词来预训练所述词向量模型。在某些实施例中，当所述目标向量与所述参考向量之一相同时，所述相似度得分被定义为1；当所述目标向量远离所有所述参考向量时，所述相似度得分被定义为0，并且所述阈值被设置为约0.8。在某些实施例中，所述已标记服装条目中的每一个包括标签，其中，所述标签是与图像的服装特征有关的词。在某些实施例中，本文档来自技高网...

【技术保护点】
1.一种用于图像处理的方法，包括：/n提供文本向量转换器；/n提供推理模型，并使用第一数量的已标记服装条目来预训练所述推理模型；/n提供第二数量的服装条目，其中，所述服装条目未被标记；/n将所述第二数量的服装条目中的每一个分为目标图像和目标文本；/n使用所述文本向量转换器将所述目标文本转换为类别向量和属性向量，其中，所述类别向量包括与服装类别相对应的多个维度，并且所述属性向量包括与服装属性相对应的多个维度；/n使用所述推理模型对所述目标图像进行处理，以获得处理后的目标图像和目标图像标签；/n将所述类别向量与所述目标图像标签进行比较；/n当所述类别向量与所述目标图像标签匹配时，基于所述类别向量和所述属性向量来更新所述目标图像标签，以获得更新后的标签；以及/n使用所述处理后的目标图像和所述更新后的标签来重新训练所述推理模型。/n

【技术特征摘要】
20190404 US 16/375,3081.一种用于图像处理的方法，包括：
提供文本向量转换器；
提供推理模型，并使用第一数量的已标记服装条目来预训练所述推理模型；
提供第二数量的服装条目，其中，所述服装条目未被标记；
将所述第二数量的服装条目中的每一个分为目标图像和目标文本；
使用所述文本向量转换器将所述目标文本转换为类别向量和属性向量，其中，所述类别向量包括与服装类别相对应的多个维度，并且所述属性向量包括与服装属性相对应的多个维度；
使用所述推理模型对所述目标图像进行处理，以获得处理后的目标图像和目标图像标签；
将所述类别向量与所述目标图像标签进行比较；
当所述类别向量与所述目标图像标签匹配时，基于所述类别向量和所述属性向量来更新所述目标图像标签，以获得更新后的标签；以及
使用所述处理后的目标图像和所述更新后的标签来重新训练所述推理模型。

2.根据权利要求1所述的方法，其中，将所述目标文本转换为所述类别向量和所述属性向量的步骤包括：
提供类别名称列表和属性名称列表，其中，所述类别名称列表包括服装类别的词表，并且所述属性名称列表包括服装属性的词表；
初始化所述类别向量和所述属性向量；
拆分所述目标文本以获得目标词；
将所述目标词中的每一个与所述类别名称列表和所述属性名称列表进行比较，以获得相似度得分；
当所述相似度得分大于阈值时，更新所述类别向量或所述属性向量。

3.根据权利要求2所述的方法，其中，初始化所述类别向量和所述属性向量的步骤是通过以下操作来执行的：
将所述类别向量的多个维度定义为所述类别名称列表中的多个类别；以及
将所述属性向量的多个维度定义为所述属性名称列表中的多个属性。

4.根据权利要求2所述的方法，其中，拆分所述目标文本以获得目标词的步骤包括：
将所述目标文本拆分为句子；
将所述句子中的每一个拆分为拆分词；以及
从所述拆分词中去除非服装词，以获得所述目标词。

5.根据权利要求2所述的方法，其中，将所述目标词中的每一个与所述类别名称列表和所述属性名称列表进行比较以获得所述相似度得分的步骤是通过以下操作执行的：
利用词向量模型将所述目标词中的每一个转换为目标向量；
使用所述词向量模型将所述类别名称列表和所述属性名称列表转换为参考向量；以及
在向量空间中将所述目标向量与所述参考向量进行比较，
其中，利用服装相关词来预训练所述词向量模型。

6.根据权利要求5所述的方法，其中，当所述目标向量与所述参考向量之一相同时，所述相似度得分被定义为1；当所述目标向量远离所有所述参考向量时，所述相似度得分被定义为0，并且所述阈值被设置为约0.8。

7.根据权利要求1所述的方法，其中，所述已标记服装条目中的每一个包括标签，其中，所述标签是与图像的服装特征有关的词。

8.根据权利要求1所述的方法，还包括：当所述类别向量中的每一个维度的值为0时，通过将所述目标图像标签定义为空来更新所述目标图像标签。

9.根据权利要求1所述的方法，还包括：...

【专利技术属性】
技术研发人员：杨尚林，周辉，
申请(专利权)人：北京京东尚科信息技术有限公司，京东美国科技公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人