【技术实现步骤摘要】
页面内容的处理方法、处理装置、计算设备及存储介质
本申请涉及信息投放领域,尤其涉及页面内容的处理方法、处理装置、计算设备及存储介质。
技术介绍
随着互联网技术的发展,用户可以在各种智能终端中浏览各种信息。例如。智能终端中应用可以从页面服务器获取页面数据并显示。另外,应用所显示的页面中还可以显示附加内容(不属于页面的主内容,例如为新闻或者广告内容等)。
技术实现思路
根据本申请一个方面,提出了一种页面内容的处理方法,包括:当接收到关于页面的附加内容呈现请求时,获取与附加内容呈现请求相匹配的特征数据,其中,附加内容呈现请求包括页面的页面标识和用户标识,特征数据包括第一特征信息和第二特征信息,第一特征信息用于描述页面标识所对应页面中主内容的特征,第二特征信息用于描述用户标识所对应的用户特征;确定与页面有关的备选内容集合;获取该备选内容集合中每个备选附加内容所对应的语义特征信息;以及根据每个备选附加内容的语义特征信息、第一特征信息和第二特征信息,从备选内容集合中选定待呈现到页面的附加内容。根据本申请一个方面,提出了一种页面内容的处理装置,包括:获取单元、选择单元和排序单元。当接收到关于页面的附加内容呈现请求时,获取单元获取与附加内容呈现请求相匹配的特征数据。其中,附加内容呈现请求包括所述页面的页面标识和用户标识。特征数据包括第一特征信息和第二特征信息。第一特征信息用于描述页面标识所对应页面中主内容的特征。第二特征信息用于描述用户标识所对应的用户特征。选择单元适于确定与页面有关的备选内容集合。其中,获取单元还适于获取该备选内容集合中每个备选附加内容所对应的语义特征信息。 ...
【技术保护点】
1.一种页面内容的处理方法,其特征在于,包括:当接收到关于页面的附加内容呈现请求时,获取与所述附加内容呈现请求相匹配的特征数据,其中,所述附加内容呈现请求包括所述页面的页面标识和用户标识,所述特征数据包括第一特征信息和第二特征信息,所述第一特征信息用于描述所述页面标识所对应页面中主内容的特征,所述第二特征信息用于描述所述用户标识所对应的用户特征;确定与所述页面有关的备选内容集合;获取该备选内容集合中每个备选附加内容所对应的语义特征信息;以及根据每个备选附加内容的语义特征信息、所述第一特征信息和所述第二特征信息,从所述备选内容集合中选定待呈现到所述页面的附加内容。
【技术特征摘要】
1.一种页面内容的处理方法,其特征在于,包括:当接收到关于页面的附加内容呈现请求时,获取与所述附加内容呈现请求相匹配的特征数据,其中,所述附加内容呈现请求包括所述页面的页面标识和用户标识,所述特征数据包括第一特征信息和第二特征信息,所述第一特征信息用于描述所述页面标识所对应页面中主内容的特征,所述第二特征信息用于描述所述用户标识所对应的用户特征;确定与所述页面有关的备选内容集合;获取该备选内容集合中每个备选附加内容所对应的语义特征信息;以及根据每个备选附加内容的语义特征信息、所述第一特征信息和所述第二特征信息,从所述备选内容集合中选定待呈现到所述页面的附加内容。2.如权利要求1所述的方法,其中,所述确定与所述页面有关的备选内容集合的步骤包括:根据要呈现所述页面的应用的类型,选定与该应用的类型对应的备选附加内容,并将其作为所述备选内容集合。3.如权利要求1所述的方法,其中,在执行所述获取所述备选内容集合中每个备选附加内容所对应的语义特征信息的步骤之前,该方法还包括:获取所述页面的页面数据,并对所述页面数据进行特征提取操作,以确定所述第一特征信息;获取所述用户标识对应的用户行为数据,并对该用户行为数据进行特征提取操作,以确定所述第二特征信息,其中,所述用户行为数据包括相应用户的页面浏览记录的集合和搜索记录的集合中至少一个集合;以及对所述备选内容集合中每个备选附加内容,进行特征提取操作,以确定该备选附加内容所对应的语义特征信息。4.如权利要求3所述的方法,其中,所述确定所述第一特征信息的步骤包括:基于预定分词方式,对所述页面数据进行分词操作,以获取相应的关键词集合,所述关键词集合中每个关键词的属性包括该关键词在所述页面中权重值基于预定的主题挖掘方式确定所述关键词集合对应的主题集合,该主题集合中每个主题的属性包括该主题在所述页面中权重值;基于预定的分类方式对所述主题集合中每个主题进行分类,以获取相应的类别,从而获取所述主题集合对应的类别集合,该类别集合中每个类别包括一个或多个主题,每个类别的属性包括该类别在所述页面中权重值;其中,所述第一特征信息包括:所述关键词集合、所述主题集合和所述类别集合。5.如权利要求4所述的方法,其中,所述获取所述用户标识对应的用户行为数据,并对该用户行为数据进行特征提取操作,以确定所述第二特征信息的步骤包括:获取所述用户标识所对应的页面浏览记录;对所述页面浏览记录所对应的每个页面,进行特征提取操作,以确定该页面对应的关键词集合、主题集合和类别集合,其中,所述关键词集合中每个关键词的属性包括该关键词在该页面中权重值,该页面对应的主题集合中每个主题的属性包括该主题在该页面中权重值,该页面对应的类别集合中每个类别包括一个或多个主题,每个类别的属性包括该类别在所述页面中权重值;其中,所述第二特征信息包括所述每个页面所对应的关键词集合、主题集合和类别集合。6.如权利要求3所述的方法,其中,所述对所述备选内容集合中每个备选附加内容,进行特征提取操作,以确定该备选附加内容所对应的语义特征信息的步骤包括:基于预定分词方式,对所述每个备选附加内容进行分词操作,以确定相应的关键词集合,该关键词集合中每个关键词的属性包括其在所述备选附加内容中权重值;基于预定的主题挖掘方式,确定所述关键词集合对应的主题集合,该主题集合中每个主题的属性包括该主题在相应的备选附加内容中权重值;基于预定的分类方式对所述主题集合中每个主题进行分类,以获取相应的类别,从而获取所述主题集合对应的类别集合,该类别集合中每个类别包括一个或多个主题,每个类别的属性包括该类别在所述备选附加内容中权重值;其中,所述备选附加内容的语义特征信息包括:该备选附加内容对应的关键词集合、主题集合和类别集合。7.如权利要求1所述的方法,其中,所述根据每个备选附加内容的语义特征信息、所述第一特征信息和所述第二特征信息,从所述备选内容集合中选定待呈现到所述页面的附加内容的步骤包括:根据每个备选附加内容的语义特征信息的部分特征,计算第一相似度和第二相似度,其中,所述第一相似度用于描述所述语义特征信息的部分特征与所述第一特征信息中相应特征之间的相关性,所述第二相似度用于描述所述语义特征信息的部分特征与所述第二特征信息中相应特征之间的相关性;根据每个备选附加内容对应的第一相似度和第二相似度,对所述备选内容集合中的各备选附加内容进行排序,并根据排序结果从所述备选内容集合中提取一个备选内容子集;对于所述备选内容子集中每个备选附加内容,计算与其对应的第三相似度和第四相似度,其中,所述第三相似度用于描述该备选附加内容的语义特征信息与所述第一特征信息之间的相关性,所述第四相似度用于描述该备选附加内容的语义特征信息与所述第二特征信息之间的相关性;根据所述备选内容子集中每个备选附加内容对应的第三相似度和第四相似度,对该备选内容子集中的各备选附加内容进行排序,并根据排序结果确定待呈现到所述页面的附加内容。8.如权利要求7所述的方法,其中,所述第一特征信息包括所述页面对应的关键词集合、主题集合和类别集合;所述第二特征信息包括所述用户标识所对应每个浏览页面所对应的关键词集合、主题集合和类别集合;所述备选内容子集中每个备选附加内容的语义特征信息包括:该备选附加内容对应的关键词集合、主题集合和类别集合;所述根据每个备选附加内容的语义特征信息的部分特征,计算第一相似度和...
【专利技术属性】
技术研发人员:赵汗青,王小可,李学凯,刘肖琛,石鑫,冯喆,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。