使用时间聚类中的隐式偏好照片的照片质量的自监督学习制造技术

技术编号：35244954 阅读：10 留言：0更新日期：2022-10-19 09:51

本公开涉及用于执行图像的自动化标记的系统和方法。所标记的图像可以用于训练机器学习模型以推断图像属性，诸如用于建议用户动作的质量。的质量。的质量。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用时间聚类中的隐式偏好照片的照片质量的自监督学习

[0001]本公开一般地涉及机器学习。更具体地，本公开涉及可以利用指示图像质量的隐式用户信号来自动生成用于确定照片质量的所标记的训练数据的自监督学习方法。

技术介绍

[0002]在日常设备中，相机的普遍存在的性质已经导致用于存储的照片和视频的数量不断增加。虽然用户可能最初对他们拍摄的照片具有兴趣，但是随着时间的推移，这种兴趣可能减少，并且用户可能忘记他们偏好哪些照片。组织大量照片可能是耗时的，并且可能导致可用存储与当前拍摄新照片的期望相冲突的问题。
[0003]本领域需要用于学习照片质量以改进对用户偏好存储的照片的建议或指示的方法。虽然照片质量模型可用于诸如检测眼睛是否睁开的特征，但是这些模型通常应用范围窄。另外，使用典型监督学习技术开发广义机器学习模型将会需要对训练数据的大规模获取和手动标记。对训练数据的手动标记是耗时、昂贵的，并且最终可能不能真实地反映关于相对图像质量的潜在用户判断。

技术实现思路

[0004]本公开涉及用于执行图像的自动化标记的系统和方法。所标记的图像可以用于训练机器学习模型以推断图像属性，诸如用于建议用户动作的质量。
[0005]本公开的一个示例方面涉及通过利用隐式用户偏好对照片的时间聚类进行自标记来自动收集训练数据(例如，“地面实况标签”)。
[0006]本公开的另一示例方面涉及至少部分地基于时间度量来将图像分组到一个或多个聚类中。由于摄影师通常捕获同一场景的若干图像，因此对图像进行分组可以提供照片相...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于基于指示图像质量的隐式用户信号的对图像进行自动化标记的计算机实现的方法，所述方法包括：由一个或多个计算设备获得多个图像；由所述一个或多个计算设备至少部分地基于时间度量来将所述多个图像中的每个图像分组到一个或多个聚类中；以及针对所述一个或多个聚类中的至少一个聚类：由所述一个或多个计算设备获得一个或多个用户信号，所述一个或多个用户信号描述相对于所述聚类中的所述图像中的一个或多个图像的一个或多个用户动作；由所述一个或多个计算设备至少部分地基于描述相对于所述聚类中的所述图像的所述用户动作的所述一个或多个用户信号来推断用于所述聚类中的至少一个图像的质量度量；由所述一个或多个计算设备至少部分地基于针对所述聚类中的所述图像所确定的所述质量度量来生成用于所述聚类的至少一个图像的标签；由所述一个或多个计算设备将针对所述至少一个图像生成的所述标签与所述聚类中的所述至少一个图像相关联；以及由所述一个或多个计算设备将所标记的图像和针对所标记的图像生成的相应标签存储在训练数据集中。2.根据前述权利要求中的任一项所述的计算机实现的方法，其中，描述相对于所述聚类中的所述图像的用户动作的所述一个或多个用户信号包括用户停留数据，所述用户停留数据指示用户在所述聚类中的所述图像中的一个或多个图像上的聚合停留时间。3.根据前述权利要求中的任一项所述的计算机实现的方法，其中，描述相对于所述聚类中的所述图像的用户动作的所述一个或多个用户信号包括用户查看数据，所述用户查看数据指示每个图像已经被用户查看的次数。4.根据前述权利要求中的任一项所述的计算机实现的方法，其中，描述相对于所述聚类中的所述图像的用户动作的所述一个或多个用户信号包括用户交互数据，所述用户交互数据指示用户已经经由物理用户输入控件与每个图像交互的次数。5.根据前述权利要求中的任一项所述的计算机实现的方法，其中，描述相对于所述聚类中的所述图像的用户动作的所述一个或多个用户信号包括用户分享数据，所述用户分享数据指示每个图像已经被用户分享的次数。6.根据前述权利要求中的任一项所述的计算机实现的方法，其中，描述相对于所述聚类中的所述图像的用户动作的所述一个或多个用户信号包括用户收藏数据，所述用户收藏数据指示每个图像已经被用户收藏的次数。7.根据前述权利要求中的任一项所述的计算机实现的方法，其中，由所述一个或多个计算设备至少部分地基于针对所述聚类中的所述图像所确定的所述质量度量来生成用于所述聚类的所述至少一个图像的所述标签包括：由所述一个或多个计算设备至少部分地基于所述质量度量来标识来自所述聚类的第一图像集合，所述第一图像集合具有比来自所述聚类的第二不同的图像集合优质的质量；由所述一个或多个计算设备用第一标签来标记所述第一图像集合；以及由所述一个或多个计算设备用第二不同的标签来标记所述第二图像集合。
8.根据前述权利要求中的任一项所述的计算机实现的方法，还包括：由所述一个或多个计算设备并且使用学习技术在所述训练数据集上训练机器学习模型。9.根据权利要求8所述的计算机实现的方法，其中，所述机器学习模型被训练以从输入图像序列中选择一个或多个优质的质量的图像。10.根据前述权利要求中的任一项所述的计算机实现的方法，其中，所述训练数据集不包括由人类所标记的地面实况数据。11.根据前述权利要求中的任一项所述的计算机实现的方法，其中，由所述一个或多个计算设备将所述多个图像中的每个图像分组到一个或多个聚类中包括：由所述一个或多个计算设备标识与每个图像相关联的时间戳；以及由所述一个或多个计算设备从所述多个图像中选择图像以包括在所述一个或多个聚类中的每个聚类中，使得与每个聚类内的每个图像相关联的时间戳在时间跨度内。12.根据权利要求11所述的计算机实现的方法，其中，所述多个图像基...

【专利技术属性】
技术研发人员：肖恩，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人