页面内容的处理方法、处理装置、计算设备及存储介质制造方法及图纸

技术编号:21914121 阅读:21 留言:0更新日期:2019-08-21 12:28
本申请公开了页面内容的处理方法、处理装置、计算设备及存储介质。其中,页面内容的处理方法,包括:当接收到关于页面的附加内容呈现请求时,获取与附加内容呈现请求相匹配的特征数据,其中,附加内容呈现请求包括页面的页面标识和用户标识,特征数据包括第一特征信息和第二特征信息,第一特征信息用于描述页面标识所对应页面中主内容的特征,第二特征信息用于描述用户标识所对应的用户特征;确定与页面有关的备选内容集合;获取该备选内容集合中每个备选附加内容所对应的语义特征信息;以及根据每个备选附加内容的语义特征信息、第一特征信息和第二特征信息,从备选内容集合中选定待呈现到页面的附加内容。

Processing Method, Processing Device, Computing Equipment and Storage Medium of Page Content

【技术实现步骤摘要】
页面内容的处理方法、处理装置、计算设备及存储介质
本申请涉及信息投放领域,尤其涉及页面内容的处理方法、处理装置、计算设备及存储介质。
技术介绍
随着互联网技术的发展,用户可以在各种智能终端中浏览各种信息。例如。智能终端中应用可以从页面服务器获取页面数据并显示。另外,应用所显示的页面中还可以显示附加内容(不属于页面的主内容,例如为新闻或者广告内容等)。
技术实现思路
根据本申请一个方面,提出了一种页面内容的处理方法,包括:当接收到关于页面的附加内容呈现请求时,获取与附加内容呈现请求相匹配的特征数据,其中,附加内容呈现请求包括页面的页面标识和用户标识,特征数据包括第一特征信息和第二特征信息,第一特征信息用于描述页面标识所对应页面中主内容的特征,第二特征信息用于描述用户标识所对应的用户特征;确定与页面有关的备选内容集合;获取该备选内容集合中每个备选附加内容所对应的语义特征信息;以及根据每个备选附加内容的语义特征信息、第一特征信息和第二特征信息,从备选内容集合中选定待呈现到页面的附加内容。根据本申请一个方面,提出了一种页面内容的处理装置,包括:获取单元、选择单元和排序单元。当接收到关于页面的附加内容呈现请求时,获取单元获取与附加内容呈现请求相匹配的特征数据。其中,附加内容呈现请求包括所述页面的页面标识和用户标识。特征数据包括第一特征信息和第二特征信息。第一特征信息用于描述页面标识所对应页面中主内容的特征。第二特征信息用于描述用户标识所对应的用户特征。选择单元适于确定与页面有关的备选内容集合。其中,获取单元还适于获取该备选内容集合中每个备选附加内容所对应的语义特征信息。排序单元适于根据每个备选附加内容的语义特征信息、第一特征信息和第二特征信息,从备选内容集合中选定待呈现到页面的附加内容。在一些实例中,所述选择单元适于根据下述方式确定与所述页面有关的备选内容集合:根据要呈现所述页面的应用的类型,选定与该应用的类型对应的备选附加内容,并将其作为所述备选内容集合。在一些实例中,所述排序单元适于根据下述方式以根据每个备选附加内容的语义特征信息、所述第一特征信息和所述第二特征信息,从所述备选附加内容集合中选定待呈现到所述页面的附加内容:根据每个备选附加内容的语义特征信息的部分特征,计算第一相似度和第二相似度,其中,所述第一相似度用于描述所述语义特征信息的部分特征与所述第一特征信息中相应特征之间的相关性,所述第二相似度用于描述所述语义特征信息的部分特征与所述第二特征信息中相应特征之间的相关性;根据每个备选附加内容对应的第一相似度和第二相似度,对所述备选内容集合进行排序,并从所述备选内容集合中提取一个备选内容子集;对于所述备选内容子集中每个备选附加内容,计算与其对应的第三相似度和第四相似度,其中,所述第三相似度用于描述所述备选附加内容的语义特征信息与所述第一特征信息之间的相关性,所述第四相似度用于描述所述备选附加内容的语义特征信息与所述第二特征信息之间的相关性;根据所述备选内容子集中每个备选附加内容对应的第三相似度和第四相似度,对该备选内容子集进行排序,并确定待呈现到所述页面的附加内容。根据本申请又一个方面,提供一种计算设备,包括:一个或多个处理器、存储器以及一个或多个程序。程序存储在该存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行本申请的页面内容的处理方法的指令。根据本申请又一个方面,提供一种存储介质,存储有一个或多个程序。所述一个或多个程序包括指令。所述指令当由计算设备执行时,使得所述计算设备执行本申请的页面内容的处理方法。综上,根据本申请的页面内容的处理方案,可以在获取对一个页面的附加内容呈现请求时,获取三种特征信息(即页面的特征信息(第一特征信息)、用户特征(第二特征信息)和备选附加内容的语义特征信息)。在此基础上,根据本申请的处理方案可以基于三种特征信息对备选内容集合进行排序,从而确定待呈现到页面的附加内容(例如为新闻或广告内容等)。特别是,本申请在筛选附加内容(即对备选附加内容进行排序)时,充分考虑页面特征(即页面主内容的特征)、用户特征与附加内容的关联性,从而提高用户在浏览页面时对附加内容的感兴趣程度(感兴趣程度例如可以体现为点击率或转化率等指标)。另外,在对备选附加内容排序时,本申请可以通过初步排序和二次排序,提高对附加内容的筛选效率(即提高选定附加内容的实时性)。附图说明为了更清楚地说明本申请实例中的技术方案,下面将对实例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1A示出了根据本申请一些实施例的应用场景100的示意图;图1B示出了根据本申请一个实施例的页面示意图;图2示出了根据本申请一些实施例的页面内容的处理方法200的流程图;图3示出了根据本申请一些实施例的生成特征信息的方法300的流程图;图4示出了图3中步骤S301的实施方法400的流程图;图5示出了图3中步骤S302的实施方法500的流程图;图6示出了根据本申请一些实施例的页面内容的处理装置600的示意图;图7示出了根据本申请一些实施例的页面内容的处理装置700的示意图;及图8示出了一个计算设备的组成结构图。具体实施方式下面将结合本申请实例中的附图,对本申请实例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅是本申请一部分实例,而不是全部的实例。基于本申请中的实例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实例,都属于本申请保护的范围。图1A示出了根据本申请一些实施例的应用场景的示意图。如图1A所示,应用场景100包括终端设备110、页面服务器120和附加内容服务器130。终端设备110例如可以是台式电脑、笔记本电脑、平板电脑、移动电话或掌上游戏机等各种计算设备。页面服务器120和附加内容服务器均可以被实现为硬件独立的设备、虚拟服务器或者分布式集群等,本申请对此不作限制。终端设备110可以驻留各种应用,例如应用111。应用111可以被实现为从页面服务器120获取并显示页面内容。应用111例如可以是浏览器、即时通讯应用(微信或QQ等)、新闻客户端或者视频客户端等,但不限于此。应用111所显示的页面例如可以是为超文本标记语言(HTML)等格式。在应用111所显示的页面中,来自页面服务器120的内容可以被称为主内容。另外,应用111还可以从附加内容服务器120获取适于在页面中显示的附加内容。这里,页面中显示的附加内容例如为新闻资讯、广告等多媒体内容,但不限于此。图1B示出了根据本申请一个实施例的页面示意图。在图1B所示页面中,区域a用于显示页面的主内容,区域b用于显示附加内容。区域a例如可以显示一篇体育新闻或者新闻报道等等,区域b例如可以显示多个广告链接或者新闻简讯等等。典型地,终端设备110在向页面服务器120发送页面请求时,还可以向附加内容服务器130发送附加内容呈现请求。这样,附加内容服务器130可以确定并向终端设备110返回附加内容,以便应用111将其呈现在页面中。下面结合图2对确定附加内容的过程进行详细说明。图2示出了根据本申请一些实施例的页面内本文档来自技高网...

【技术保护点】
1.一种页面内容的处理方法,其特征在于,包括:当接收到关于页面的附加内容呈现请求时,获取与所述附加内容呈现请求相匹配的特征数据,其中,所述附加内容呈现请求包括所述页面的页面标识和用户标识,所述特征数据包括第一特征信息和第二特征信息,所述第一特征信息用于描述所述页面标识所对应页面中主内容的特征,所述第二特征信息用于描述所述用户标识所对应的用户特征;确定与所述页面有关的备选内容集合;获取该备选内容集合中每个备选附加内容所对应的语义特征信息;以及根据每个备选附加内容的语义特征信息、所述第一特征信息和所述第二特征信息,从所述备选内容集合中选定待呈现到所述页面的附加内容。

【技术特征摘要】
1.一种页面内容的处理方法,其特征在于,包括:当接收到关于页面的附加内容呈现请求时,获取与所述附加内容呈现请求相匹配的特征数据,其中,所述附加内容呈现请求包括所述页面的页面标识和用户标识,所述特征数据包括第一特征信息和第二特征信息,所述第一特征信息用于描述所述页面标识所对应页面中主内容的特征,所述第二特征信息用于描述所述用户标识所对应的用户特征;确定与所述页面有关的备选内容集合;获取该备选内容集合中每个备选附加内容所对应的语义特征信息;以及根据每个备选附加内容的语义特征信息、所述第一特征信息和所述第二特征信息,从所述备选内容集合中选定待呈现到所述页面的附加内容。2.如权利要求1所述的方法,其中,所述确定与所述页面有关的备选内容集合的步骤包括:根据要呈现所述页面的应用的类型,选定与该应用的类型对应的备选附加内容,并将其作为所述备选内容集合。3.如权利要求1所述的方法,其中,在执行所述获取所述备选内容集合中每个备选附加内容所对应的语义特征信息的步骤之前,该方法还包括:获取所述页面的页面数据,并对所述页面数据进行特征提取操作,以确定所述第一特征信息;获取所述用户标识对应的用户行为数据,并对该用户行为数据进行特征提取操作,以确定所述第二特征信息,其中,所述用户行为数据包括相应用户的页面浏览记录的集合和搜索记录的集合中至少一个集合;以及对所述备选内容集合中每个备选附加内容,进行特征提取操作,以确定该备选附加内容所对应的语义特征信息。4.如权利要求3所述的方法,其中,所述确定所述第一特征信息的步骤包括:基于预定分词方式,对所述页面数据进行分词操作,以获取相应的关键词集合,所述关键词集合中每个关键词的属性包括该关键词在所述页面中权重值基于预定的主题挖掘方式确定所述关键词集合对应的主题集合,该主题集合中每个主题的属性包括该主题在所述页面中权重值;基于预定的分类方式对所述主题集合中每个主题进行分类,以获取相应的类别,从而获取所述主题集合对应的类别集合,该类别集合中每个类别包括一个或多个主题,每个类别的属性包括该类别在所述页面中权重值;其中,所述第一特征信息包括:所述关键词集合、所述主题集合和所述类别集合。5.如权利要求4所述的方法,其中,所述获取所述用户标识对应的用户行为数据,并对该用户行为数据进行特征提取操作,以确定所述第二特征信息的步骤包括:获取所述用户标识所对应的页面浏览记录;对所述页面浏览记录所对应的每个页面,进行特征提取操作,以确定该页面对应的关键词集合、主题集合和类别集合,其中,所述关键词集合中每个关键词的属性包括该关键词在该页面中权重值,该页面对应的主题集合中每个主题的属性包括该主题在该页面中权重值,该页面对应的类别集合中每个类别包括一个或多个主题,每个类别的属性包括该类别在所述页面中权重值;其中,所述第二特征信息包括所述每个页面所对应的关键词集合、主题集合和类别集合。6.如权利要求3所述的方法,其中,所述对所述备选内容集合中每个备选附加内容,进行特征提取操作,以确定该备选附加内容所对应的语义特征信息的步骤包括:基于预定分词方式,对所述每个备选附加内容进行分词操作,以确定相应的关键词集合,该关键词集合中每个关键词的属性包括其在所述备选附加内容中权重值;基于预定的主题挖掘方式,确定所述关键词集合对应的主题集合,该主题集合中每个主题的属性包括该主题在相应的备选附加内容中权重值;基于预定的分类方式对所述主题集合中每个主题进行分类,以获取相应的类别,从而获取所述主题集合对应的类别集合,该类别集合中每个类别包括一个或多个主题,每个类别的属性包括该类别在所述备选附加内容中权重值;其中,所述备选附加内容的语义特征信息包括:该备选附加内容对应的关键词集合、主题集合和类别集合。7.如权利要求1所述的方法,其中,所述根据每个备选附加内容的语义特征信息、所述第一特征信息和所述第二特征信息,从所述备选内容集合中选定待呈现到所述页面的附加内容的步骤包括:根据每个备选附加内容的语义特征信息的部分特征,计算第一相似度和第二相似度,其中,所述第一相似度用于描述所述语义特征信息的部分特征与所述第一特征信息中相应特征之间的相关性,所述第二相似度用于描述所述语义特征信息的部分特征与所述第二特征信息中相应特征之间的相关性;根据每个备选附加内容对应的第一相似度和第二相似度,对所述备选内容集合中的各备选附加内容进行排序,并根据排序结果从所述备选内容集合中提取一个备选内容子集;对于所述备选内容子集中每个备选附加内容,计算与其对应的第三相似度和第四相似度,其中,所述第三相似度用于描述该备选附加内容的语义特征信息与所述第一特征信息之间的相关性,所述第四相似度用于描述该备选附加内容的语义特征信息与所述第二特征信息之间的相关性;根据所述备选内容子集中每个备选附加内容对应的第三相似度和第四相似度,对该备选内容子集中的各备选附加内容进行排序,并根据排序结果确定待呈现到所述页面的附加内容。8.如权利要求7所述的方法,其中,所述第一特征信息包括所述页面对应的关键词集合、主题集合和类别集合;所述第二特征信息包括所述用户标识所对应每个浏览页面所对应的关键词集合、主题集合和类别集合;所述备选内容子集中每个备选附加内容的语义特征信息包括:该备选附加内容对应的关键词集合、主题集合和类别集合;所述根据每个备选附加内容的语义特征信息的部分特征,计算第一相似度和...

【专利技术属性】
技术研发人员:赵汗青王小可李学凯刘肖琛石鑫冯喆
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1