一种标题图文生成方法及计算设备技术

技术编号:25690841 阅读:14 留言:0更新日期:2020-09-18 21:02
本发明专利技术公开了一种标题图文生成方法,在计算设备中执行,计算设备与数据存储装置连接,数据存储装置中存储有多个标题模板、多个图像及其类别以及用户标签与插槽和图像类别的对应关系,每个标题模板包括至少一个待填充内容的插槽,该方法包括:获取文章内容及其目标用户群的标签;从文章内容中提取出关键词,每个关键词对应于至少一种插槽;从已存储的多个标题模板中筛选出候选模板,候选模板中包括分别与每一个用户标签对应的插槽;从候选模板中选择一个作为目标模板,将相应的关键词填充至目标模板的插槽中,以生成标题文本;从已存储的多个图像中筛选出候选图像,候选图像的类别对应于至少一个用户标签;从候选图像中选择一个作为标题图像。

【技术实现步骤摘要】
一种标题图文生成方法及计算设备
本专利技术涉及内容推荐
,尤其涉及一种标题图文生成方法及计算设备。
技术介绍
在传统的内容推荐方式中,网站或应用(App)通常在特定区域,例如横幅(banner)区域向用户展示广告、热门文章等内容。用户可以通过点击横幅区域来浏览内容详情,产生转化行为。随着大数据和机器学习技术的发展,上述传统的内容推荐方式逐渐被信息流的内容推荐方式所取代。在信息流方式中,推荐内容不是在固定区域显示,而是采用与普通内容相似的样式,与普通内容进行排列(例如上下排列)展示。推荐内容从视觉上看来就像普通内容一样。信息流的内容推荐方式中,最初呈现给用户的推荐内容通常包括标题文本和标题图像两部分,用户点击该推荐内容,可以进入详情页面来查看推荐内容的正文详情。目前,在信息流式的推荐内容中,标题文本、标题图像由工作人员编辑提供,内容固定且数量有限,无法实现定制化的、千人千面的内容推荐。
技术实现思路
为此,本专利技术提供一种标题图文生成方法及计算设备,以力图解决或至少缓解上面存在的问题。根据本专利技术的第一个方面,提供一种标题图文生成方法,在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个标题模板、多个图像及其所属的类别、以及用户标签与插槽类型和图像类别的对应关系,其中,每个所述标题模板包括至少一个待填充内容的插槽,所述方法包括:获取文章内容及其目标用户群的标签;从所述文章内容中提取出关键词,每个所述关键词对应于至少一种插槽;从已存储的多个标题模板中筛选出至少一个候选模板,所述候选模板中包括分别与每一个所述标签对应的插槽;从所述至少一个候选模板中选择一个作为目标模板,将相应的关键词填充至所述目标模板的插槽中,以生成标题文本;以及从已存储的多个图像中筛选出至少一个候选图像,所述候选图像的类别对应于至少一个所述标签;从所述至少一个候选图像中选择一个作为标题图像。可选地,在根据本专利技术的标题图文生成方法中,数据存储装置中存储的多个标题模板按照以下步骤生成:将点击率大于预设阈值或点击率最大的多个标题作为高点击标题;基于预设的插槽类型对高点击标题进行命名实体识别,确定其中插槽的位置和类型从而生成标题模板。可选地,在根据本专利技术的标题图文生成方法中,从所述文章内容中提取出关键词的步骤包括:基于预设的插槽类型对所述文章内容进行命名实体识别,以识别出对应于不同插槽类型的文本内容,并将所述文本内容作为关键词。可选地,在根据本专利技术的标题图文生成方法中,从所述至少一个候选模板中选择一个作为目标模板的步骤包括:从所述至少一个候选模板中随机选择一个作为目标模板。可选地,在根据本专利技术的标题图文生成方法中,图像的类别按照以下步骤确定:将已标注类别的图像作为训练样本,训练分类模型;采用训练好的分类模型来确定待分类的图像的类别。可选地,在根据本专利技术的标题图文生成方法中,数据存储装置中还存储有每个图像的质量得分,所述从所述至少一个候选图像中选择一个作为标题图像的步骤包括:从质量得分最高的多个候选图像中随机选择一个作为标题图像。可选地,在根据本专利技术的标题图文生成方法中,图像的质量得分按照以下步骤确定:分别确定图像的色彩丰富度和美感度;将色彩丰富度与美感度的加权求和结果作为图像的质量得分。可选地,在根据本专利技术的标题图文生成方法中,图像的色彩丰富度C按照以下公式计算:C=δrgyb+0.3*μrgyb其中,rg=R-GR、G、B分别为图像的R、G、B颜色通道图,rg、yb分别为第一特征图、第二特征图,δrg、μrg分别为第一特征图中各像素值的标准差和均值,δyb、μyb分别为第二特征图中各像素值的标准差和均值。可选地,在根据本专利技术的标题图文生成方法中,图像的美感度按照以下步骤确定:将图像输入预设的美感度评估模型,以便所述美感度评估模型输出所述图像的美感度。可选地,在根据本专利技术的标题图文生成方法中,还包括步骤:将所述标题图像裁剪至预设尺寸。可选地,在根据本专利技术的标题图文生成方法中,还包括步骤:将所述标题文本和所述标题图像发送至目标用户的用户终端,以将所述标题文本和所述标题图像呈现给目标用户。根据本专利技术的第二个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,当所述程序指令被所述处理器读取并执行时,使得所述计算设备执行如上所述的标题图文生成方法。根据本专利技术的第三个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如上所述的标题图文生成方法。根据本专利技术的技术方案,预先生成标题模板库和图像库,每个标题模板包括至少一个待填充内容的插槽,每个图像具有类别属性,并定义用户标签与插槽类型和图像类别的对应关系。针对某一文章内容和目标用户群,从文章内容中提取出关键词,每个关键词对应于至少一种插槽。根据目标用户群的标签,从标题模板库中筛选出多个标题模板作为候选模板;从图像库中筛选出多个图像作为候选图像。然后,从候选模板中选择一个作为目标模板,将从文章内容提取出的关键词填充至目标模板的插槽中,生成标题文本;并且,从候选图像中选择一个作为标题图像。在本专利技术中,标题文本、标题图像是根据文章内容和目标用户群自动生成的。并且,标题文本从候选模板中选择生成,标题图像从候选图像中选择生成,每次选择的结果可能不同,从而针对目标用户群中的不同用户,可以对应生成多种标题图文,呈现出千人千面的动态推荐效果,提高标题图文对目标用户的吸引度。根据一种实施例,图像库中的图像还具有质量得分属性,质量得分越高,图像的视觉效果越好。在从候选图像选择标题图像时,可以将候选图像按照质量得分由高到低进行排序,然后从质量得分较高的多个候选图像中随机选择一个作为标题图像,从而保证标题图像能够向用户呈现良好的视觉效果,提高标题图像对用户的吸引度。根据一种实施例,在确定标题图像后,对标题图像进行裁剪,使其符合预设尺寸。这样可以使标题图像的尺寸与信息流内容的展示尺寸相匹配,适配不同客户端(例如PC网页端、移动网页端、移动App端等)以及不同应用场景。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。图1示出了根据本专利技术一个实施例的内容推荐系统100的示意图;图2示出了根据本专利技术一个实施例的信息流式的标题图文的示意图;图3示出了根据本文档来自技高网...

【技术保护点】
1.一种标题图文生成方法,在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个标题模板、多个图像及其所属的类别、以及用户标签与插槽类型和图像类别的对应关系,其中,每个所述标题模板包括至少一个待填充内容的插槽,所述方法包括:/n获取文章内容及其目标用户群的标签;/n从所述文章内容中提取出关键词,每个所述关键词对应于至少一种插槽;/n从已存储的多个标题模板中筛选出至少一个候选模板,所述候选模板中包括分别与每一个所述标签对应的插槽;/n从所述至少一个候选模板中选择一个作为目标模板,将相应的关键词填充至所述目标模板的插槽中,以生成标题文本;以及/n从已存储的多个图像中筛选出至少一个候选图像,所述候选图像的类别对应于至少一个所述标签;/n从所述至少一个候选图像中选择一个作为标题图像。/n

【技术特征摘要】
1.一种标题图文生成方法,在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个标题模板、多个图像及其所属的类别、以及用户标签与插槽类型和图像类别的对应关系,其中,每个所述标题模板包括至少一个待填充内容的插槽,所述方法包括:
获取文章内容及其目标用户群的标签;
从所述文章内容中提取出关键词,每个所述关键词对应于至少一种插槽;
从已存储的多个标题模板中筛选出至少一个候选模板,所述候选模板中包括分别与每一个所述标签对应的插槽;
从所述至少一个候选模板中选择一个作为目标模板,将相应的关键词填充至所述目标模板的插槽中,以生成标题文本;以及
从已存储的多个图像中筛选出至少一个候选图像,所述候选图像的类别对应于至少一个所述标签;
从所述至少一个候选图像中选择一个作为标题图像。


2.如权利要求1所述的方法,其中,数据存储装置中存储的多个标题模板按照以下步骤生成:
将点击率大于预设阈值或点击率最大的多个标题作为高点击标题;
基于预设的插槽类型对高点击标题进行命名实体识别,确定其中插槽的位置和类型从而生成标题模板。


3.如权利要求1或2所述的方法,其中,所述从所述文章内容中提取出关键词的步骤包括:
基于预设的插槽类型对所述文章内容进行命名实体识别,以识别出对应于不同插槽类型的文本内容,并将所述文本内容作为关键词。


4.如权利要求1-3中任一项所述的方法,其中,所述从所述至少一个候选模板中选择一个作为目标模板的步骤包括:
从所述至少一个候选模板中随机选择一个作为目标模板。

【专利技术属性】
技术研发人员:廖卫平胡阿沛杨卉陈泽龙
申请(专利权)人:车智互联北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1