小程序分发物料的生成方法、装置、设备及介质制造方法及图纸

技术编号:28418867 阅读:33 留言:0更新日期:2021-05-11 18:25
本申请实施例公开了一种小程序分发物料的生成方法、装置、设备及介质,涉及信息处理技术领域。具体实现方案为:获取小程序的sitemap列表,并根据sitemap列表抓取与小程序对应的多个小程序落地页;根据各小程序落地页,确定与每个小程序落地页分别对应的多个候选描述集合;根据多个候选描述集合确定与每个小程序落地页分别对应的物料信息;将物料信息填充于与分发场景匹配的数据模板中,得到用于进行线上分发的分发物料。实现了快速地生成小程序的分发物料,解决了现有技术中需要人工实现小程序物料生成和分发的问题,减少了人力资源的消耗。

【技术实现步骤摘要】
小程序分发物料的生成方法、装置、设备及介质
本申请实施例涉及计算机
,尤其涉及信息处理
,具体涉及一种小程序分发物料的生成方法、装置、设备及介质。
技术介绍
随着计算机技术的不断发展,不需要下载安装即可使用的应用“小程序”得到了广泛地应用。小程序的业务场景复杂、分发渠道多且机制不唯一,物料作为小程序引流和分发的重要手段,是小程序分发展现时所需要的内容。现有技术中,主要通过开发者对物料进行提取并提交至小程序开发平台,并通过人工审核开发者提交至小程序平台的物料是否可以分发,审核通过后,才可以对物料进行分发。现有技术中,通过开发者对物料进行提取并提交至小程序开发平台,并通过人工审核是否可以对物料进行分发,不但耗费了大量的人力资源,并且从物料提交到分发耗时较长,影响小程序物料分发的时效和效果。
技术实现思路
本申请实施例提供一种小程序分发物料的生成方法、装置、设备及介质,实现了自动化地快速生成小程序的分发物料,减少了人力资源的消耗。第一方面,本申请实施例提供了一种小程序分发物料的生成方法,该方法包括:获取小程序的sitemap列表,并根据所述sitemap列表抓取与所述小程序对应的多个小程序落地页;根据各所述小程序落地页,确定与每个所述小程序落地页分别对应的多个候选描述集合;根据所述多个候选描述集合确定与每个所述小程序落地页分别对应的物料信息;将所述物料信息填充于与分发场景匹配的数据模板中,得到用于进行线上分发的分发物料。可选的,根据各所述小程序落地页,确定与每个所述小程序落地页分别对应的多个候选描述集合,包括:对各所述小程序落地页进行页面解析,并根据页面解析结果,得到与每个所述小程序落地页分别对应的多个备选物料元素;根据多个所述备选物料元素,获取与每个所述小程序落地页分别对应的多个候选描述集合。这样设置的好处在于:通过获取与每个小程序落地页分别对应的多个候选描述集合,可以搜集到每个小程序落地页的所有描述信息,从所有描述信息中获取到小程序落地页的最优物料信息,保证了获取信息的全局性与准确性。可选的,根据所述备选物料元素,获取与每个所述小程序落地页分别对应的多个候选描述集合,包括:将与每个所述小程序落地页对应的多个备选物料元素分别输入至候选描述集合确定模型中,得到与每个所述小程序落地页分别对应的多个候选描述集合。这样设置的好处在于:通过将与每个小程序落地页对应的多个备选物料元素输入至候选描述集合确定模型中,可以快速的得到与每个小程序落地页分别对应的多个候选描述集合,加快了处理速度。可选的,根据所述多个候选描述集合确定与每个所述小程序落地页分别对应的物料信息,包括:获取与当前处理的小程序落地页对应的多个当前处理候选描述集合;根据至少一个打分权重对所述多个当前处理候选描述集合进行打分,所述打分权重动态更新;获取打分值最高的一个当前处理候选描述集合,作为与所述当前处理的小程序落地页对应的物料信息。可选的,在根据所述sitemap列表,抓取与所述小程序对应的多个小程序落地页之前,还包括:对所述sitemap列表中的各统一资源定位系统(UniformResourceLocator,URL)进行归一化处理。可选的,对所述sitemap列表中的各URL进行归一化处理,包括:判断所述sitemap列表中,是否存在第一类URL集合,所述第一类URL集合中包括多个完全相同的URL;若是,则在所述第一类URL集合中仅保留一个URL,并将其余URL进行滤除;判断所述sitemap列表中,是否存在第二类URL集合,所述第二类URL集合中包括多个URL参数相同,URL参数位置排列方式不同的URL;若是,则在所述第二类URL集合中仅保留一个URL,并将其余URL进行滤除。这样设置的好处在于:通过将完全相同的URL或者参数相同仅参数位置不同的URL仅保留一个,可以大大的减少计算量,避免了重复解析多个相同的小程序落地页情况的发生。可选的,将所述物料信息填充于与分发场景匹配的数据模板中,得到用于进行线上分发的分发物料之后,还包括:在检测到满足物料分发条件时,在所述分发场景下对所述分发物料进行分发;获取所述物料信息的展现效果信息,并根据所述展现效果信息更新所述打分权重中包括的展现效果权重。这样设置的好处在于:通过获取物料信息的展现效果信息,并根据展现效果信息更新打分权重中包括的展现效果权重,可以进一步地优化打分权重,从而获取到最优的物料信息。可选的,在将所述物料信息填充于与分发场景匹配的数据模板中,得到用于进行线上分发的分发物料之后,还包括:响应于物料下线请求,将当前处于待分发状态,或者已分发状态的所述分发物料进行下线处理。这样设置的好处在于:将当前处于待分发状态,或者已分发状态的分发物料进行下线处理可以提供灵活的下线处理机制,及时、有效的将需要停止显示的分发物料进行下线处理。可选的,本申请实施例中涉及到的多个备选物料元素包括:标题、正文、关键词、摘要以及标签。可选的,在将多个所述备选物料元素分别输入至候选描述集合确定模型中之前,还包括:对多个所述备选物料元素进行清洗处理、加工处理以及格式化处理。这样设置的好处在于:对于各备选物料元素进行一系列的处理后再输入至候选描述集合确定模型,可以候选描述集合确定模型更容易识别出多个备选物料元素,加快了处理速度。第二方面,本申请实施例还提供了一种小程序分发物料的生成装置,该装置包括:sitemap列表获取模块,用于获取小程序的sitemap列表,并根据所述sitemap列表抓取与所述小程序对应的多个小程序落地页;多个候选描述集合确定模块,用于根据各所述小程序落地页,确定与每个所述小程序落地页分别对应的多个候选描述集合;物料信息确定模块,用于根据所述多个候选描述集合确定与每个所述小程序落地页分别对应的物料信息;分发物料生成模块,用于将所述物料信息填充于与分发场景匹配的数据模板中,得到用于进行线上分发的分发物料。第三方面,本申请实施例还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请中任一实施例所述的方法。第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请中任一实施例所述的方法。上述申请中的一个实施例具有如下优点或有益效果:通过获取小程序的sitemap列表,并根据sitemap列表抓取与所述小程序对应的多个小程序落地页;根据各小程序落地页,确定与每个小程序落地页分别对应的多个候选描述集合;根据多个候选描述集合确定与每个小程序落地页分本文档来自技高网...

【技术保护点】
1.一种小程序分发物料的生成方法,其特征在于,包括:/n获取小程序的站点地图sitemap列表,并根据所述sitemap列表抓取与所述小程序对应的多个小程序落地页;/n根据各所述小程序落地页,确定与每个所述小程序落地页分别对应的多个候选描述集合;/n根据所述多个候选描述集合确定与每个所述小程序落地页分别对应的物料信息;/n将所述物料信息填充于与分发场景匹配的数据模板中,得到用于进行线上分发的分发物料。/n

【技术特征摘要】
1.一种小程序分发物料的生成方法,其特征在于,包括:
获取小程序的站点地图sitemap列表,并根据所述sitemap列表抓取与所述小程序对应的多个小程序落地页;
根据各所述小程序落地页,确定与每个所述小程序落地页分别对应的多个候选描述集合;
根据所述多个候选描述集合确定与每个所述小程序落地页分别对应的物料信息;
将所述物料信息填充于与分发场景匹配的数据模板中,得到用于进行线上分发的分发物料。


2.根据权利要求1所述的方法,其特征在于,根据各所述小程序落地页,确定与每个所述小程序落地页分别对应的多个候选描述集合,包括:
对各所述小程序落地页进行页面解析,并根据页面解析结果,得到与每个所述小程序落地页分别对应的多个备选物料元素;
根据多个所述备选物料元素,获取与每个所述小程序落地页分别对应的多个候选描述集合。


3.根据权利要求2所述的方法,其特征在于,根据多个所述备选物料元素,获取与每个所述小程序落地页分别对应的多个候选描述集合,包括:
将与每个小程序落地页对应的多个备选物料元素分别输入至候选描述集合确定模型中,得到与每个所述小程序落地页分别对应的多个候选描述集合。


4.根据权利要求1所述的方法,其特征在于,根据所述多个候选描述集合确定与每个所述小程序落地页分别对应的物料信息,包括:
获取与当前处理的小程序落地页对应的多个当前处理候选描述集合;
根据至少一个打分权重对所述多个当前处理候选描述集合进行打分,所述打分权重动态更新;
获取打分值最高的一个当前处理候选描述集合,作为与所述当前处理的小程序落地页对应的物料信息。


5.根据权利要求1所述的方法,其特征在于,在根据所述sitemap列表,抓取与所述小程序对应的多个小程序落地页之前,还包括:
对所述sitemap列表中的各统一资源定位符URL进行归一化处理。


6.根据权利要求5所述的方法,其特征在于,对所述sitemap列表中的各URL进行归一化处理,包括:
判断所述sitemap列表中,是否存在第一类URL集合,所述第一类URL集合中包括多个完全相同的URL;
若是,则在所述第一类URL集合中仅保留一个URL,并将其余URL进行滤除;
判断所述sitemap列表中,是否存在第二类URL集合,所述...

【专利技术属性】
技术研发人员:史南胜曹姣
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1