【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2014年12月22日提交的美国实用专利申请No.14/578,911的优先权和权益,该申请特此通过引用并入。
技术介绍
传统的系统可以基于元数据属性来计算两个媒体资产之间的相似性。例如,系统可以使用这样的模型,通过该模型,单个的媒体资产基于共享的元数据属性而被认为是相似的。尽管这些系统生成的相似性度量可以是有效的,但是这些模型没有考虑到可以改进相似性度量的其他因素。
技术实现思路
因此,描述了用于对模型进行训练来产生与媒体资产相关的资产矢量的系统和方法。如本文中所称的,术语“资产矢量”是指与媒体资产的属性相关联的值的集合,该集合可以被存储为这些值的数组,该数组中的每个值对应于该矢量的不同维度。如本文中所称的,术语“属性”包括描述媒体资产的或者与媒体资产相关联的任何内容。属性可以包括体裁、类别、内容来源、标题、系列信息或标识符、特性、演员、导演、演员阵容信息、剧组、情节、地点、描述、描述符、关键字、艺术家、基调、音调、歌词、评论、评级、长度或持续时间、传输时间、可用时间、赞助商和/或它们的任何组合。在一些实施方案中,模型采取媒体资产的语料库、每个媒体资产的元数据信息以及一个或多个用户的使用数据作为输入。元数据可以包括比如以下的信息:体裁、关键字、描述以及其他合适的信息(比如上面列出的属性中的任何一个)。在媒体资产中,通常遇到与媒体资产相关联的丰富的元数据,比如体裁、关键字、描述等。然而,每一条单独的元数据的相关性或权重(用于找到相似的电影或推荐)通常由于多个来源、算法或所涉及的人工录入而导致缺少、缺失或错误。例如,演出是喜剧,但是 ...
【技术保护点】
一种用于维护表示多个媒体资产之间的相似性的模型的方法,所述方法包括:使用控制电路接收与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量;使用所述控制电路确定用户是否已经观看了第一媒体资产和第二媒体资产二者;响应于确定用户已经观看了第一媒体资产和第二媒体资产二者:使用所述控制电路确定建模的相似性值,所述建模的相似性值表示第一媒体资产和第二媒体资产之间的建模的相似性,其中,所述建模的相似性值是基于第一值矢量和第二值矢量来确定的;使用所述控制电路检索观测的相似性值,所述观测的相似性值表示第一媒体资产和第二媒体资产之间的观测的相似性,其中,所述观测的相似性是基于针对第一媒体资产和第二媒体资产的使用数据以及元数据的;使用所述控制电路基于建模的相似性值和观测的相似性值来确定建模误差值;以及使用所述控制电路基于所述建模误差值来更新与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量。
【技术特征摘要】
【国外来华专利技术】2014.12.22 US 14/578,9111.一种用于维护表示多个媒体资产之间的相似性的模型的方法,所述方法包括:使用控制电路接收与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量;使用所述控制电路确定用户是否已经观看了第一媒体资产和第二媒体资产二者;响应于确定用户已经观看了第一媒体资产和第二媒体资产二者:使用所述控制电路确定建模的相似性值,所述建模的相似性值表示第一媒体资产和第二媒体资产之间的建模的相似性,其中,所述建模的相似性值是基于第一值矢量和第二值矢量来确定的;使用所述控制电路检索观测的相似性值,所述观测的相似性值表示第一媒体资产和第二媒体资产之间的观测的相似性,其中,所述观测的相似性是基于针对第一媒体资产和第二媒体资产的使用数据以及元数据的;使用所述控制电路基于建模的相似性值和观测的相似性值来确定建模误差值;以及使用所述控制电路基于所述建模误差值来更新与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量。2.根据权利要求1所述的方法,其中,与第一媒体资产相关联的第一值矢量包括与针对第一媒体资产的元数据相关的一个或多个基于元数据的值、以及与针对第一媒体资产的元数据无关的一个或多个自由浮动值。3.根据权利要求2所述的方法,其中,更新与第一媒体资产相关联的第一值矢量包括更新所述一个或多个基于元数据的值以及所述一个或多个自由浮动值中的至少一个。4.根据权利要求1所述的方法,其中,确定建模误差值包括基于置信度项来确定所述建模误差值,其中,较高的置信度项指示对使用数据的信任较高。5.根据权利要求1所述的方法,其中:针对第一媒体资产的元数据包括以下中的至少一个:体裁、类别、内容来源、标题、系列标识符、特性、演员、导演、演员阵容信息、剧组、情节、地点、描述、描述符、关键字、艺术家、基调、音调、歌词、评论、评级、长度或持续时间、传输时间、可用时间以及赞助商;并且针对第一媒体资产的使用数据包括以下中的至少一个:来自用户的评级、用户观看的时间量、用户观看的时间、用户观看的片段的数量、用户与相关社交媒体交互的次数、收听计数、资产的价格、显露给用户的次数、观看多个片段的速度、第一次观看的速度对第一次可用的、观看的次序、以及投射到“享受”或“喜欢”的单词矢量上的评论/博客。6.根据权利要求1所述的方法,进一步包括:使用所述控制电路检索与所述模型相关联的阈值误差值;使用所述控制电路确定所述建模误差值是否低于所述阈值误差值;响应于确定所述建模误差值不低于所述阈值误差值,使用所述控制电路基于所述建模误差值更新与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量。7.根据权利要求1所述的方法,其中,确定建模的相似性值包括:使用所述控制电路基于第一值矢量和第二值矢量之间的点积来确定第一值矢量和第二值矢量之间的距离;以及使用所述控制电路基于确定的距离来确定建模的相似性值。8.根据权利要求7所述的方法,其中,基于所述建模误差值更新第一值矢量和第二值矢量包括:使用所述控制电路调整存储在第一矢量和第二矢量中的值以使得第一矢量和第二矢量之间的距离缩小。9.根据权利要求1所述的方法,其中,使用第一媒体资产和第二媒体资产之间的皮尔逊相关系数来确定观测的相似性。10.根据权利要求1所述的方法,进一步包括:响应于确定没有用户观看过第一媒体资产和第二媒体资产二者,使用所述控制电路对所述建模误差值存储零值。11.一种用于维护表示多个媒体资产之间的相似性的模型的系统,所述系统包括:控制电路,所述控制电路被配置为:接收与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量;确定用户是否已经观看了第一媒体资产和第二媒体资产二者;响应于确定用户已经观看了第一媒体资产和第二媒体资产二者:确定建模的相似性值,所述建模的相似性值表示第一媒体资产和第二媒体资产之间的建模的相似性,其中,所述建模的相似性值是基于第一值矢量和第二值矢量来确定的;检索观测的相似性值,所述观测的相似性值表示第一媒体资产和第二媒体资产之间的观测的相似性,其中,所述观测的相似性是基于针对第一媒体资产和第二媒体资产的使用数据以及元数据的;基于建模的相似性值和观测的相似性值来确定建模误差值;以及基于所述建模误差值来更新与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量。12.根据权利要求11所述的系统,其中,与第一媒体资产相关联的第一值矢量包括与针对第一媒体资产的元数据相关的一个或多个基于元数据的值、以及与针对第一媒体资产的元数据无关的一个或多个自由浮动值。13.根据权利要求12所述的系统,其中,被配置为更新与第一媒体资产相关联的第一值矢量的控制电路包括被配置为更新所述一个或多个基于元数据的值以及所述一个或多个自由浮动值中的至少一个的控制电路。14.根据权利要求11所述的系统,其中,被配置为确定建模误差值的控制电路包括被配置为基于置信度项来确定所述建模误差值的控制电路,其中,较高的置信度项指示对使用数据的信任较高。15.根据权利要求11所述的系统,其中:针对第一媒体资产的元数据包括以下中的至少一个:体裁、类别、内容来源、标题、系列标识符、特性、演员、导演、演员阵容信息、剧组、情节、地点、描述、描述符、关键字、艺术家、基调、音调、歌词、评论、评级、长度或持续时间、传输时间、可用时间以及赞助商;并且针对第一媒体资产的使用数据包括以下中的至少一个:来自用户的评级、用户观看的时间量、用户观看的时间、用户观看的片段的数量、用户与相关社交媒体交互的次数、收听计数、资产的价格、显露给用户的次数、观看多个片段的速度、第一次观看的速度对第一次可用的、观看的次序、以及投射到“享受”或“喜欢”的单词矢量上的评论/博客。16.根据权利要求11所述的系统,进一步包括被配置为执行以下操作的控制电路:检索与所述模型相关联的阈值误差值;确定所述建模误差值是否低于所述阈值误差值;响应于确定所述建模误差值不低于所述阈值误差值,基于所述建模误差值更新与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量。17.根据权利要求11所述的系统,其中,被配置为确定建模的相似性值的控制电路包括被配置为执行以下操作的控制电路:基于第一值矢量和第二值矢量之间的点积来确定第一值矢量和第二值矢量之间的距离;以及基于确定的距离来确定建模的相似性值。18.根据权利要求17所述的系统,其中,被配置为基于所述建模误差值更新第一值矢量和第二值矢量的控制电路包括被配置为执行以下操作的控制电路:调整存储在第一矢量和第二矢量中的值以使得第一矢量和第二矢量之间的距离缩小。19.根据权利要求11所述的系统,其中,使用第一媒体资产和第二媒体资产之间的皮尔逊相关系数来确定观测的相似性。20.根据权利要求11所述的系统,进一步包括被配置为执行以下操作的控制电路:响应于确定没有用户观看过第一媒体资产和第二媒体资产二者,对所述建模误差值存储零值。21.一种用于维护表示多个媒体资产之间的相似性的模型的设备,所述设备包括:用于接收与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量的部件;用于确定用户是否已经观看了第一媒体资产和第二媒体资产二者的部件;响应于确定用户已经观看了第一媒体资产和第二媒体资产二者:用于确定建模的相似性值的部件,所述建模的相似性值表示第一媒体资产和第二媒体资产之间的建模的相似性,其中,所述建模的相似性值是基于第一值矢量和第二值矢量来确定的;用于检索观测的相似性值的部件,所述观测的相似性值表示第一媒体资产和第二媒体资产之间的观测的相似性,其中,所述观测的相似性是基于针对第一媒体资产和第二媒体资产的使用数据以及元数据的;用于基于建模的相似性值和观测的相似性值来确定建模误差值的部件;以及用于基于所述建模误差值来更新与第一媒体资产相关联的第一值矢量以及与第二媒体资产相关联的第二值矢量的部件。22.根据权利要求21所述的设备,其中,与第一媒体资产相关联的第一值矢量包括与针对第一媒体资产的元数据相关的一个或多个基于元数据的值、以及与针对第一媒体资产的元数据无关的一个或多个自由浮动值。23.根据权利要求22所述的设备,其中,用于更新与第一媒体资产相关联的第一值矢量的部件包括用于更新所述一个或多个基于元数据的值以及所述一个或多个自由浮动值中的至少一个的部件。24.根据权利要求21所述的设备,其中,用于确定建模误差值的部件包括用于基于置信度项来确定所述建模误差值的部件,其中,较高的置信度项指示对使用数据的信任较高。25.根据权利要求21所述的设备,其中:针对第一媒体资产的元数据包括以下中的至少一个:体裁、类别、内容来源、标题、系列标识符、特性、演员、导演、演员阵容信息、剧组、情节、地点、描述、描述符、关键字、艺术家、基调...
【专利技术属性】
技术研发人员:C·卡尔米彻尔,S·万卡塔拉曼,
申请(专利权)人:乐威指南公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。