一种基于小程序的自适应内容识别及发布系统技术方案

技术编号:30640199 阅读:9 留言:0更新日期:2021-11-04 00:34
本发明专利技术针对现有技术中存在的技术问题,提供一种基于小程序的自适应内容识别及发布系统,其包括数据抓取模块、数据编译模块、内容校验模块、内容发布模块;所述数据抓取模块对接各大新闻网站,用于抓取各大新闻网站推送的新闻信息,所述数据编译模块与数据抓取模块连接,用于对数据抓取模块所抓取的新闻信息进行编译,输出固定格式的新闻内容,所述内容校验模块与所述数据编译模块连接,用于对编译好的新闻内容进行校验,所述内容发布模块与内容校验模块连接,用于对校验好的新闻内容进行定时发布。通过与各大新闻网站对接,完成对新闻内容的自动识别抓取,以及通过小程序进行编译校验,可设定内容模板,自动生成新闻推送信息,具备推广前景。备推广前景。备推广前景。

【技术实现步骤摘要】
一种基于小程序的自适应内容识别及发布系统


[0001]本专利技术涉及小程序应用
,具体涉及一种基于小程序的自适应内容识别及发布系统。

技术介绍

[0002]小程序的开发应用已经趋于成熟,应用于小程序上的功能也越来越多,小程序的推广应用避免了移动设备上需要安装APP才能使用的麻烦,且其使用方便,易于开发;现有针对小程序或公众号的功能应用中,对于新闻内容的推送或发布需要管理员在后台进行编辑操作,无法进行自动抓取、筛选、发布。

技术实现思路

[0003]本专利技术针对现有技术中存在的技术问题,提供一种基于小程序的自适应内容识别及发布系统,通过与各大新闻网站对接,完成对新闻内容的自动识别抓取,以及通过小程序进行编译校验,可设定内容模板,自动生成新闻推送信息,具备推广前景。
[0004]本专利技术解决上述技术问题的技术方案如下:一种基于小程序的自适应内容识别及发布系统,其包括数据抓取模块、数据编译模块、内容校验模块、内容发布模块;所述数据抓取模块对接各大新闻网站,用于抓取各大新闻网站推送的新闻信息,所述数据编译模块与数据抓取模块连接,用于对数据抓取模块所抓取的新闻信息进行编译,输出固定格式的新闻内容,所述内容校验模块与所述数据编译模块连接,用于对编译好的新闻内容进行校验,所述内容发布模块与内容校验模块连接,用于对校验好的新闻内容进行定时发布。
[0005]作为优选的,所述数据抓取模块配置有数据筛选单元,所述数据筛选单元用于通过关键词对数据进行筛选,以供数据抓取模块进行精准数据抓取。
>[0006]作为优选的,所述数据编译模块包括内容模板和内容嵌入单元,以内容模板为基础,将抓取的新闻内容通过内容嵌入单元嵌入到内容模板中对应的位置形成新的新闻内容。
[0007]作为优选的,所述数据抓取模块在抓取新闻内容时,通过数据筛选单元识别各大新闻网站中阅读量或转发量或点赞量相关数据信息,并对其进行排序,抓取其中阅读量或转发量或点赞量较高的新闻内容。
[0008]作为优选的,所述内容校验模块在校验新闻内容时,根据关键词筛选其中涉及敏感信息的内容并返回到数据筛选模块进行重新筛选,该敏感信息包括词汇、图片、视频、链接。
[0009]作为优选的,所述内容发布模块连接有小程序终端或移动设备终端或APP终端,用于将该编译好的新闻内容发布到对应的小程序终端、移动设备终端或APP终端。
[0010]作为优选的,所述内容发布模块连接有商城,所述内容发布模块对每次发布的内容进行统计并积分,用户通过积分在商城进行货币或货物兑换。
[0011]本专利技术的有益效果是:本专利技术提供一种基于小程序的自适应内容识别及发布系
统,通过与各大新闻网站对接,完成对新闻内容的自动识别抓取,以及通过小程序进行编译校验,可设定内容模板,自动生成新闻推送信息,具备推广前景。
附图说明
[0012]图1为本专利技术的原理框图。
[0013]图2为本专利技术的运行流程示意图。
具体实施方式
[0014]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。
[0015]在本专利技术的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
[0016]如图1和图2所示,本实施例公开了一种基于小程序的自适应内容识别及发布系统,其包括数据抓取模块、数据编译模块、内容校验模块、内容发布模块;所述数据抓取模块对接各大新闻网站,用于抓取各大新闻网站推送的新闻信息,所述数据编译模块与数据抓取模块连接,用于对数据抓取模块所抓取的新闻信息进行编译,输出固定格式的新闻内容,所述内容校验模块与所述数据编译模块连接,用于对编译好的新闻内容进行校验,所述内容发布模块与内容校验模块连接,用于对校验好的新闻内容进行定时发布。
[0017]在本实施例中,数据抓取模块可以完成定向数据抓取,也可完成数据上传识别,其中定向数据抓取需要对接抓取对象接口,即各大新闻网站的数据接口,需要对新闻网站或APP中的新闻数据相关信息进行读取,包括了其中的新闻内容,图片信息、视频信息、作者信息、链接信息、点赞信息、评论信息、转发信息和阅读量等相关信息。数据上传识别则通过编辑好的格式,将人工筛选出来的新闻内容直接上传到数据抓取模块进行识别读取;数据编译模块则通过抓取出来的新闻信息编译成特定格式;包括格式调整,排版调整等等;将数据抓取模块抓取的新闻内容中的不同信息进行分类标记,例如,图像、文字、视频等等分别通过特定字符标记,在套入内容模板的时候则将该特定字符标记的信息嵌入到特定位置,完成内容的制作。然后,通过内容校验模块对格式、内容等信息进行校验核对,该核对过程也可设置关键词排查;然后再通过内容发布模块进行内容的定时发布,即可以设定其发布触发的周期,或者抓取数据的周期,或者一次性抓取多条信息,而根据发布周期定时将抓取的多条信息依次发布出去。
[0018]作为优选的,所述数据抓取模块配置有数据筛选单元,所述数据筛选单元用于通过关键词对数据进行筛选,以供数据抓取模块进行精准数据抓取。
[0019]数据筛选单元对数据信息进行精准筛选后抓取,有利于抓取效率的提升,保证抓取到实时热点,或关注度高的内容。因而,该关键词可以包含上述段落中提到的图片信息、视频信息、作者信息、链接信息、点赞信息、评论信息、转发信息和阅读量等相关信息。
[0020]作为优选的,所述数据编译模块包括内容模板和内容嵌入单元,以内容模板为基
础,将抓取的新闻内容通过内容嵌入单元嵌入到内容模板中对应的位置形成新的新闻内容。
[0021]在本实施例中,该内容模板可以进行替换,或者可以设置多个,根据周期进行自动匹配适应,通过将抓取出来的信息与内容模板的格式进行匹配,保证发布的内容信息与使用者自身需求吻合。
[0022]除此之外,该内容模板可以系统分配,也可以用户自定义设计。
[0023]作为优选的,所述数据抓取模块在抓取新闻内容时,通过数据筛选单元识别各大新闻网站中阅读量或转发量或点赞量相关数据信息,并对其进行排序,抓取其中阅读量或转发量或点赞量较高的新闻内容。
[0024]作为优选的,所述内容校验模块在校验新闻内容时,根据关键词筛选其中涉及敏感信息的内容并返回到数据筛选模块进行重新筛选,该敏感信息包括词汇、图片、视频、链接。
[0025]或者说,在实施例中,可以设定一些关键信息比较项,用于对新 闻内容中包含这些关键信息或敏感信息的内容与比较项进行比较,比 较其是否与比较项一致。
[0026]作为优选的,所述内容发布模块连接有小程序终端或移动设备终端或APP本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于小程序的自适应内容识别及发布系统,其特征在于,其包括数据抓取模块、数据编译模块、内容校验模块、内容发布模块;所述数据抓取模块对接各大新闻网站,用于抓取各大新闻网站推送的新闻信息,所述数据编译模块与数据抓取模块连接,用于对数据抓取模块所抓取的新闻信息进行编译,输出固定格式的新闻内容,所述内容校验模块与所述数据编译模块连接,用于对编译好的新闻内容进行校验,所述内容发布模块与内容校验模块连接,用于对校验好的新闻内容进行定时发布。2.根据权利要求1所述的一种基于小程序的自适应内容识别及发布系统,其特征在于,所述数据抓取模块配置有数据筛选单元,所述数据筛选单元用于通过关键词对数据进行筛选,以供数据抓取模块进行精准数据抓取。3.根据权利要求2所述的一种基于小程序的自适应内容识别及发布系统,其特征在于,所述数据编译模块包括内容模板和内容嵌入单元,以内容模板为基础,将抓取的新闻内容通过内容嵌入单元嵌入到内容模板中对应的位置形成新的新闻内容。4.根据权利要求2...

【专利技术属性】
技术研发人员:孙晓龙
申请(专利权)人:小铁世纪成都科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1