【技术实现步骤摘要】
信息处理方法及装置
[0001]本申请涉及信息处理
,尤其涉及一种信息处理方法及装置。
技术介绍
[0002]目前,随着计算机的高速发展,各种多媒体数据(如图文数据和视频数据)在各个来源渠道的入库峰值日上传量已超过百万级别乃至千万级别。在对多媒体数据进行显示时,封面图像对点击转化效果和用户体验的影响非常大,目前,多媒体数据的封面图像通常由该多媒体数据的创作者或上传者进行上传。然而,专利技术人在实践中发现,创作者所上传的封面图像的内容较为单一,封面图像的内容通常与多媒体数据的内容之间关联性较弱,很难快速吸引用户兴趣。由此可见,如何丰富多媒体数据的封面图像的内容进而提高封面图像的内容与多媒体数据的内容之间的关联性是一个亟待解决的问题。
技术实现思路
[0003]本申请实施例提供了一种信息处理方法及装置,可以丰富多媒体数据的封面信息的内容,进而提升封面信息的内容与多媒体数据的内容之间的关联性。
[0004]一方面,本申请实施例提供了一种信息处理方法,该方法包括:
[0005]获取与多媒体数据相 ...
【技术保护点】
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取与多媒体数据相关联的描述文本信息,并从所述描述文本信息中提取针对所述多媒体数据的关键文本信息;获取所述多媒体数据的数据属性信息,根据所述数据属性信息从封面模板集合中选取针对所述多媒体数据的目标封面模板;获取所述多媒体数据的第一封面信息,并根据所述目标封面模板对所述关键文本信息和所述第一封面信息进行信息合成,得到所述多媒体数据的第二封面信息。2.根据权利要求1所述方法,其特征在于,所述从所述描述文本信息中提取针对所述多媒体数据的关键文本信息,包括:将所述描述文本信息输入检测模型,在所述检测模型中预测所述描述文本信息所包含的每个字分别对应的关键字概率以及所述每个字分别对应的词性信息;所述每个字对应的词性信息分别用于指示所述每个字在所属词语中的位置;将所述描述文本信息中对应的关键字概率大于概率阈值的字确定为文本关键字;根据所述每个字分别对应的词性信息获取包含所述文本关键字的所述关键文本信息。3.根据权利要求2所述方法,其特征在于,所述文本关键字的词性信息为独立词性信息或非独立词性信息;所述独立词性信息表征所述文本关键字构成独立词语;所述非独立词性信息表征所述文本关键字不构成独立词语;所述根据所述每个字分别对应的词性信息获取包含所述文本关键字的所述关键文本信息,包括:若所述文本关键字的词性信息为所述独立词性信息,则将所述文本关键词作为所述关键文本信息;若所述文本关键字的词性信息为所述非独立词性信息,则根据所述每个字分别对应的词性信息从所述描述文本信息中获取与所述文本关键字相关联的字,并将与所述文本关键字相关联的字和所述文本关键字进行组合,将组合得到的词语作为所述关键文本信息。4.根据权利要求2所述方法,其特征在于,所述方法还包括:获取样本文本信息;所述样本文本信息携带关键文本标签;所述关键文本标签用于指示所述样本文本信息中的样本关键文本信息;将所述样本文本信息输入初始检测模型,在所述初始检测模型中生成所述样本文本信息所包含的每个样本字分别对应的关键字概率以及所述每个样本字分别对应的词性信息;所述每个样本字对应的词性信息分别用于指示所述每个样本字在所属词语中的位置;将所述样本文本信息中对应的关键字概率大于所述概率阈值的样本字确定为样本文本关键字;根据所述每个样本字分别对应的词性信息获取包含所述样本文本关键字的预测关键文本信息;根据所述预测关键文本信息和所述关键文本标签所指示的样本关键文本信息修正所述初始检测模型的模型参数,并将进行模型参数修正后的所述初始检测模型确定为所述检测模型。5.根据权利要求4所述方法,其特征在于,所述获取样本文本信息,包括:获取数据检索文本;
将检索文本列表中被触发有浏览操作的检索文本确定为初始样本文本信息;所述检索文本列...
【专利技术属性】
技术研发人员:刘刚,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。