图文内容处理方法及介质技术

技术编号:26846335 阅读:12 留言:0更新日期:2020-12-25 13:09
本申请提供一种图文内容处理方法及介质,涉及人工智能技术领域。该方法包括:获取待处理图文内容;所述待处理图文内容包括目标文本信息和目标图片;根据所述目标文本信息和所述目标图片的目标形式特征,获得所述待处理图文内容在形式上的先验体验评估结果;根据所述目标文本信息,获得所述待处理图文内容在内容上的内容质量评估结果;根据所述先验体验评估结果和所述内容质量评估结果,获得所述待处理图文内容的质量评估结果,该方法通过分别确定内容和形式上的两个评估结果,并基于两个评估结果获得更为准确的图文内容的质量评估结果。

【技术实现步骤摘要】
图文内容处理方法及介质
本申请涉及计算机
,尤其涉及人工智能
,提供一种图文内容处理方法及介质。
技术介绍
为了实现知识共享,逐渐出现了内容服务平台,内容服务平台支持用户可以在内容服务平台上传或分享图文内容。为了便于各用户在内容服务平台上能够查看到更优质的图文内容,内容服务平台会预先确定图文内容的质量分数,以便于依据图文内容的质量分数为用户推荐更优质的图文内容。目前,内容服务平台是根据图文内容的特征,确定图文内容的质量分数,但图文内容涉及到的特征较多,如何基于这些特征获得更准确的质量分数是亟需解决的问题。
技术实现思路
本申请实施例提供一种图文内容处理方法及介质,用于提高图文内容的质量分数的准确性。一方面,提供了一种图文内容处理方法,包括:获取待处理图文内容;所述待处理图文内容包括目标文本信息和目标图片;根据所述目标文本信息和所述目标图片的目标形式特征,获得所述待处理图文内容在形式上的先验体验评估结果;根据所述目标文本信息,获得所述待处理图文内容在内容上的内容质量评估结果;根据所述先验体验评估结果和所述内容质量评估结果,获得所述待处理图文内容的质量评估结果。又一方面,提供一种图文内容处理方法,包括:获得各图文内容的质量评价结果;其中,所述各图文内容的质量评价结果是通过一方面中任一项所述的方法获得的;根据所述各图文内容的质量评价结果,从所述各图文内容中确定出目标图文内容,并推荐所述目标图文内容。本申请实施例提供一种图文内容处理装置,包括:获取模块,用于获取待处理图文内容;所述待处理图文内容包括目标文本信息和目标图片;第一获得模块,用于根据所述目标文本信息和所述目标图片的目标形式特征,获得所述待处理图文内容在形式上的先验体验评估结果;第二获得模块,用于根据所述目标文本信息,获得所述待处理图文内容在内容上的内容质量评估结果;第三获得模块,用于根据所述先验体验评估结果和所述内容质量评估结果,获得所述待处理图文内容的质量评估结果。在一种可能的实施例中,所述第一获得模块还用于:获得所述图文内容的排版特征;获得所述目标文本信息和所述目标图片之间的匹配程度;所述排版特征和所述匹配程度属于目标形式特征。在一种可能的实施例中,所述目标形式特征还包括如下的一种或多种:所述目标图片的图片质量特征;或,所述目标文本信息的词句特征;或,发布所述待处理图文内容的账号等级;或,所述待处理图文内容的标题特征。在一种可能的实施例中,所述第一获得模块具体用于:将所述目标形式特征输入梯度提升决策树模型;其中,所述梯度提升决策树模型包括按照层级关系构建的多个学习器,每个学习器为一个节点;通过所述梯度提升决策树模型的根节点,对所述目标形式特征进行第一次学习,得到第一学习结果;将所述第一学习结果输入到所述根节点的下一级叶子节点;以所述下一级叶子节点作为新的根节点继续进行学习,直到所述下一级叶子节点为最小叶子节点,获得所述最小叶子节点的学习结果;根据所述最小叶子节点的学习结果,获得先验体验评估结果。在一种可能的实施例中,所述梯度提升决策树模型是通过如下方式训练得到的:获得第一样本数据;其中,所述第一样本数据包括多个样本图文内容中每个样本图文内容的样本形式特征,以及每个样本图文内容对应的先验体验评估结果标签;根据多个样本形式特征,进行多轮迭代训练,并在每轮迭代训练中创建一学习器,并利用损失函数拟合上一轮迭代训练结果的残差,通过最小化损失函数拟合本轮创建的学习器;其中,每一轮迭代训练结果的残差是迭代训练输出结果与对应的先验体验评估结果标签确定的;根据多轮迭代训练中获得的多个学习器,建立各个学习器的层级关系,获得梯度提升决策树模型。在一种可能的实施例中,所述第二获得模块具体用于:通过内容质量模型中编码器的各个编码单元,按照目标文本序列的输入顺序,并应用注意力机制,生成每个输入位置对应的编码表示,获得编码表示序列;其中,所述目标文本序列是所述目标文本信息的序列表示结果;通过所述内容质量模型的全连接层,对所述编码表示序列进行映射,获得内容质量评估结果。在一种可能的实施例中,所述内容质量模型是通过如下方式训练得到的:获得第二样本数据;其中,所述第二样本数据包括样本图文内容对应的样本文本序列,以及样本文本序列对应的内容质量评估结果标签;通过所述各个编码单元,按照所述样本文本序列的输入顺序,并应用注意力机制,生成每个输入位置对应的样本编码表示,获得样本编码表示序列;通过所述全连接层,对所述样本编码表示序列进行映射,获得预测内容质量评估结果;基于所述内容质量评估结果标签和所述预测内容质量评估结果,调整所述内容质量模型的模型参数,直到内容质量模型收敛,获得已训练的内容质量模型。在一种可能的实施例中,第三获得模块具体用于:根据所述先验体验评估结果和所述内容质量评估结果,通过投票机制,对所述待处理图文内容进行投票处理,获得所述待处理图文内容的质量评估结果。本申请实施例提供一种图文内容处理装置,包括:获得模块,用于获得所述各图文内容的质量评价结果;其中,各图文内容的质量评价结果是通过一方面中任一项所述的方法获得的;确定模块,用于根据所述各图文内容的质量评价结果,从所述各图文内容中确定出目标图文内容,并推荐所述目标图文内容。本申请实施例提供一种计算机设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如一方面或又一方面中任一项所述的方法。本申请实施例提供一种存储介质,所述存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如一方面或又一方面中任一项所述的方法。由于本申请实施例采用上述技术方案,至少具有如下技术效果:一、本申请实施例分别基于文本信息,确定图文内容在内容上的内容质量评估结果,基于文本信息和图片,确定图文内容在形式上的先验体验评估结果,也就是说,本申请实施例是基于图文内容在不同角度的特征,分别确定图文内容在不同角度对应的评估结果,由于是根据对应角度的特征去获得对应角度上的评估结果,因此能够基于该角度对应的特征对图文内容进行更有针对性的评估,提高各个角度的评估结果的准确性,进而提高确定出的图文内容的质量评估结果的准确性。且,该方法结合图文内容各角度的特征进行评估,获得质量评估结果,使得获得的质量评估结果能更全面地反映了图文内容的各角度的情况,提升最终的质量评估结果的可参考性。二、相较于有监督的图文优质识别技术,从文本角度进行内容质量判定的方法,本申请实施例中的方案考虑了文本和图片两方面的信息,且考虑了内容和质量两个维度的特征,确定图文内容质本文档来自技高网...

【技术保护点】
1.一种图文内容处理方法,其特征在于,包括:/n获取待处理图文内容;所述待处理图文内容包括目标文本信息和目标图片;/n根据所述目标文本信息和所述目标图片的目标形式特征,获得所述待处理图文内容在形式上的先验体验评估结果;/n根据所述目标文本信息,获得所述待处理图文内容在内容上的内容质量评估结果;/n根据所述先验体验评估结果和所述内容质量评估结果,获得所述待处理图文内容的质量评估结果。/n

【技术特征摘要】
1.一种图文内容处理方法,其特征在于,包括:
获取待处理图文内容;所述待处理图文内容包括目标文本信息和目标图片;
根据所述目标文本信息和所述目标图片的目标形式特征,获得所述待处理图文内容在形式上的先验体验评估结果;
根据所述目标文本信息,获得所述待处理图文内容在内容上的内容质量评估结果;
根据所述先验体验评估结果和所述内容质量评估结果,获得所述待处理图文内容的质量评估结果。


2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获得所述待处理图文内容的排版特征;
获得所述目标文本信息和所述目标图片之间的匹配程度;所述排版特征和所述匹配程度属于目标形式特征。


3.如权利要求2所述的方法,其特征在于,所述目标形式特征还包括如下的一种或多种:
所述目标图片的图片质量特征;或,
所述目标文本信息的词句特征;或,
发布所述待处理图文内容的账号等级;或,
所述待处理图文内容的标题特征。


4.如权利要求1~3任一所述的方法,其特征在于,所述根据所述目标文本信息和所述目标图片的目标形式特征,获得所述待处理图文内容在形式上的先验体验评估结果,具体包括:
将所述目标形式特征输入梯度提升决策树模型;其中,所述梯度提升决策树模型包括按照层级关系构建的多个学习器,每个学习器为一个节点;
通过所述梯度提升决策树模型的根节点,对所述目标形式特征进行第一次学习,得到第一学习结果;
将所述第一学习结果输入到所述根节点的下一级叶子节点;
以所述下一级叶子节点作为新的根节点继续进行学习,直到所述下一级叶子节点为最小叶子节点,获得所述最小叶子节点的学习结果;
根据所述最小叶子节点的学习结果,获得先验体验评估结果。


5.如权利要求4所述的方法,其特征在于,所述梯度提升决策树模型是通过如下方式训练得到的:
获得第一样本数据;其中,所述第一样本数据包括多个样本图文内容中每个样本图文内容的样本形式特征,以及每个样本图文内容对应的先验体验评估结果标签;
根据多个样本形式特征,进行多轮迭代训练,并在每轮迭代训练中创建一学习器,并利用损失函数拟合上一轮迭代训练结果的残差,通过最小化损失函数拟合本轮创建的学习器;其中,每一轮...

【专利技术属性】
技术研发人员:朱灵子衡阵马连洋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1