【技术实现步骤摘要】
基于多模态特征的影视专题自动生成方法
本专利技术涉及影视专题领域,特别涉及基于多模态特征的影视专题自动生成方法。
技术介绍
影视专题自动生成的方法一般采用传统的机器学习算法,利用影视的文本特征如导演、演员、题材、年代、地域等,进行无监督聚类生成影视专题,这种方法生成的影视专题,专题内影视海报视觉风格不统一,专题内影视关联度不高,造成用户体验不佳,造成该问题的原因是模型无法对影视海报的图形特征进行学习,无法对用户间的行为进行分析。
技术实现思路
本专利技术所解决的技术问题:提供基于多模态特征的影视专题自动生成方法解决影视专题内影视海报视觉风格不统一和影视关联度不高的问题。本专利技术解决上述技术问题采用的技术方案:基于多模态特征的影视专题自动生成方法包括以下步骤:S01、将影视的海报图片预处理成统一尺寸,利用卷积神经网络的表征学习能力提取影视海报的图形特征向量;S02、将影视的文本信息进行分词提取构建关键词词库,并计算每个关键词的反文档频率IDF,将影视信息中的关键词进行one-hot...
【技术保护点】
1.基于多模态特征的影视专题自动生成方法,其特征在于,包括以下步骤:/nS01、将影视的海报图片预处理成统一尺寸,利用卷积神经网络的表征学习能力提取影视海报的图形特征向量;/nS02、将影视的文本信息进行分词提取构建关键词词库,并计算每个关键词的反文档频率IDF,将影视信息中的关键词进行one-hot编码生成影视的文本向量,使用tf-idf对文本向量进行加权,获取得到加权的文本特征向量;/nS03、将用户的行为整合成分段的语料集,整合所有用户的语料集生成word2vec词向量模型训练样本,建立词向量模型,利用skip-gram对词向量模型训练,生成每个影视的词特征向量;/n...
【技术特征摘要】
1.基于多模态特征的影视专题自动生成方法,其特征在于,包括以下步骤:
S01、将影视的海报图片预处理成统一尺寸,利用卷积神经网络的表征学习能力提取影视海报的图形特征向量;
S02、将影视的文本信息进行分词提取构建关键词词库,并计算每个关键词的反文档频率IDF,将影视信息中的关键词进行one-hot编码生成影视的文本向量,使用tf-idf对文本向量进行加权,获取得到加权的文本特征向量;
S03、将用户的行为整合成分段的语料集,整合所有用户的语料集生成word2vec词向量模型训练样本,建立词向量模型,利用skip-gram对词向量模型训练,生成每个影视的词特征向量;
S04、将图形特征向量、文...
【专利技术属性】
技术研发人员:吴上波,
申请(专利权)人:四川长虹电器股份有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。