【技术实现步骤摘要】
推送项目的配图方法、装置、存储介质和终端设备
本专利技术涉及计算机
,尤其涉及一种推送项目的配图方法、装置、存储介质和终端设备。
技术介绍
随着AI(ArtificialIntelligence,人工智能)技术的日益成熟,信息技术平台越来越多地开始主动地为用户提供用户需要的信息。例如,亚马逊通过商品推荐系统主动为用户推荐商品、百度的通用推荐引擎为各种站点实现站内内容推荐等。另一方面,伴随着移动互联网的兴起,也出现了类似今日头条、百度等主流平台通过信息流形式向移动终端主动推送信息的产品。这些系统推荐通常使用固定的模板展现推荐/推送的内容,为了提高内容的点击率,一般至少会展现一张配图。然而,并非所有的内容项目都是自带图片的。例如,一些传统媒体的高质量文章会出现无配图的情况,此时若向用户推送,往往因为缺少配图无法吸引用户。因此,推荐和推送系统需要有一种方法能够为这些项目自动匹配图片。目前,普遍采用如下方案来解决:首先,根据预设算法为待展示的新闻设置对应的主题,然后在判定待展示的新闻为无图新闻时,从图库中选取与 ...
【技术保护点】
1.一种推送项目的配图方法,其特征在于,包括:/n根据推送项目的文本信息,构建所述推送项目的特征词序列;其中,所述特征词序列包括特征词和每个特征词的权重值;/n根据所述推送项目的特征词序列进行检索,获得包含图片的候选资料;/n计算各候选资料与所述推送项目的相似度;/n根据计算结果,从所述各候选资料中选择至少一个配图资料;以及/n根据所选配图资料的图片,为所述推送项目配图。/n
【技术特征摘要】
1.一种推送项目的配图方法,其特征在于,包括:
根据推送项目的文本信息,构建所述推送项目的特征词序列;其中,所述特征词序列包括特征词和每个特征词的权重值;
根据所述推送项目的特征词序列进行检索,获得包含图片的候选资料;
计算各候选资料与所述推送项目的相似度;
根据计算结果,从所述各候选资料中选择至少一个配图资料;以及
根据所选配图资料的图片,为所述推送项目配图。
2.如权利要求1所述的推送项目的配图方法,其特征在于,所述根据推送项目的文本信息,构建所述推送项目的特征词序列,包括:
从所述推送项目的文本信息中,提取特征词;
通过自然语言处理技术,过滤所述特征词中的噪音词;
根据所述特征词与所述文本信息的关联程度,确定每个特征词的权重值;以及
根据每个特征词和每个特征词的权重值,构建所述推送项目的特征词序列。
3.如权利要求1所述的推送项目的配图方法,其特征在于,所述根据所述推送项目的特征词序列进行检索,获得包含图片的候选资料,包括:
根据每个特征词的权重值,从所述特征词序列中选择特征词,以组成检索式;其中,所述检索式包括至少一个特征词;以及
根据所述检索式在搜索引擎中检索,并从检索结果中选取满足选取规则且包含图片的资料,作为候选资料。
4.如权利要求3所述的推送项目的配图方法,其特征在于,所述选择规则至少包括以下的一者:
排序在所述检索结果的预设项数之前;其中,所述检索结果按搜索相关程序排列;
资料的发布时间满足时效要求;
资料的发布方的置信度满足置信度阈值。
5.如权利要求1所述的推送项目的配图方法,其特征在于,所述方法还包括:
判断所述候选资料中的资料数量;
当所述资料数量达到资料数量阈值时,停止所述检索。
6.如权利要求1所述的推送项目的配图方法,其特征在于,所述计算各候选资料与所述推送项目的相似度,包括:
从所述各候选资料中,提取各候选资料的文本信息;
根据各候选资料的文本信息,构建各候选资料的特征词序列;
根据所述候选资料的特征词序列和所述推送项目的特征词序列,计算所述候选资料与所述推送项目的相似度。
7.如权利要求6所述的推送项目的配图方法,其特征在于,所述根据各候选资料的文本信息,构建各候选资料的特征词序列,包括:
对于每一个候选资料,从所述候选资料的文本信息中,提取特征词;
通过自然语言处理技术,过滤提取的特征词中的噪音词;
根据所述特征与所述候选资料的文本信息的关联程度,确定所述...
【专利技术属性】
技术研发人员:余韬,陈炜于,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。