文章迁移方法、装置、计算机可读存储介质及终端设备制造方法及图纸

技术编号:23558337 阅读:32 留言:0更新日期:2020-03-25 03:55
本发明专利技术属于计算机技术领域,尤其涉及一种文章迁移方法、装置、计算机可读存储介质及终端设备。所述方法包括:接收文章迁移指令,并从所述文章迁移指令中提取源网站的统一资源定位符和登录信息以及目标网站的统一资源定位符和登录信息;根据所述源网站的统一资源定位符和登录信息登录至所述源网站中的文章列表页面;分别确定所述文章列表页中各篇文章的编辑页面地址,并将各篇文章的编辑页面地址构造为编辑页面地址队列;根据所述编辑页面地址队列分别下载各篇文章的内容;根据所述目标网站的统一资源定位符和登录信息登录至所述目标网站中的文章列表页面;将获取到的各篇文章的内容依次上传至所述目标网站中的文章列表页面中。

Article migration method, device, computer readable storage medium and terminal equipment

【技术实现步骤摘要】
文章迁移方法、装置、计算机可读存储介质及终端设备
本专利技术属于计算机
,尤其涉及一种文章迁移方法、装置、计算机可读存储介质及终端设备。
技术介绍
很多喜欢在网络上发布文章的用户经常都会碰到需要进行文章迁移的情况,例如,用户开始的时候都是在一个论坛上发布文章,但是可能由于某些原因,想把自己在该论坛上的文章迁移到其他的网站上,如果在先前论坛上发布的文章数量很多,一篇篇复制粘贴下来理论上是可行的,但操作起来太过于繁琐,工作量十分庞大,而且极易出现遗漏和错误。
技术实现思路
有鉴于此,本专利技术实施例提供了一种文章迁移方法、装置、计算机可读存储介质及终端设备,以解决现有的文章迁移方法工作量十分庞大,而且极易出现遗漏和错误的问题。本专利技术实施例的第一方面提供了一种文章迁移方法,可以包括:接收文章迁移指令,并从所述文章迁移指令中提取源网站的统一资源定位符和登录信息以及目标网站的统一资源定位符和登录信息;根据所述源网站的统一资源定位符和登录信息登录至所述源网站中的文章列表页面;分别确定所述文章列表本文档来自技高网...

【技术保护点】
1.一种文章迁移方法,其特征在于,包括:/n接收文章迁移指令,并从所述文章迁移指令中提取源网站的统一资源定位符和登录信息以及目标网站的统一资源定位符和登录信息;/n根据所述源网站的统一资源定位符和登录信息登录至所述源网站中的文章列表页面;/n分别确定所述文章列表页中各篇文章的编辑页面地址,并将各篇文章的编辑页面地址构造为编辑页面地址队列;/n根据所述编辑页面地址队列分别下载各篇文章的内容;/n根据所述目标网站的统一资源定位符和登录信息登录至所述目标网站中的文章列表页面;/n将获取到的各篇文章的内容依次上传至所述目标网站中的文章列表页面中。/n

【技术特征摘要】
1.一种文章迁移方法,其特征在于,包括:
接收文章迁移指令,并从所述文章迁移指令中提取源网站的统一资源定位符和登录信息以及目标网站的统一资源定位符和登录信息;
根据所述源网站的统一资源定位符和登录信息登录至所述源网站中的文章列表页面;
分别确定所述文章列表页中各篇文章的编辑页面地址,并将各篇文章的编辑页面地址构造为编辑页面地址队列;
根据所述编辑页面地址队列分别下载各篇文章的内容;
根据所述目标网站的统一资源定位符和登录信息登录至所述目标网站中的文章列表页面;
将获取到的各篇文章的内容依次上传至所述目标网站中的文章列表页面中。


2.根据权利要求1所述的文章迁移方法,其特征在于,所述根据所述编辑页面地址队列分别下载各篇文章的内容包括:
创建与所述编辑页面地址队列对应的文章下载任务队列,所述文章下载任务队列中包括PN个文章下载任务,每个文章下载任务用于下载一个编辑页面地址所对应的一篇文章,PN为所述编辑页面地址队列中的编辑页面地址的总数;
调用处理线程组分别执行所述文章下载任务队列中的各个文章下载任务,得到各篇文章的内容,所述处理线程组中包括两个以上的处理线程。


3.根据权利要求2所述的文章迁移方法,其特征在于,在根据所述编辑页面地址队列分别下载各篇文章的内容之前,还包括:
分别计算各篇文章的哈希值,并根据各篇文章在所述文章列表页中的顺序,将各篇文章的哈希值存储在预设的哈希表中;
在根据所述编辑页面地址队列分别下载各篇文章的内容之后,还包括:
将已完成的文章下载任务从所述文章下载任务队列中转移至预设的完成队列中,并按照所述哈希表中的顺序,排列已完成的文章下载任务在所述完成队列中的顺序,得到排序后的各篇文章的内容。


4.根据权利要求2所述的文章迁移方法,其特征在于,所述调用处理线程组分别执行所述文章下载任务队列中的各个文章下载任务,得到各篇文章的内容包括:
根据与第p个文章下载任务对应的编辑页面地址打开第p篇文章的编辑页面,1≤p≤PN;
分别获取第p篇文章的编辑页面中的各个文本内容和各个图片内容,并将各个文本内容和各个图片内容之间的顺序记录在与第p篇文章对应的顺序记录表中;
将各个文本内容依次存储入与第p篇文章对应的文本序列中;
将各个图片内容依次存储入与第p篇文章对应的图片序列中;
将所述文本序列和所述图片序列的集合作为第p篇文章的内容。


5.根据权利要求4所述的文章迁移方法,其特征在于,所述分别获取第p篇文章的编辑页面中的各个文本内容和各个图片内容包括:
获取第n个图片内容的统一资源定位符,1≤n≤N,N为第p篇文章的编辑页面中的图片内容的数目;
使用预设的正则表达式判...

【专利技术属性】
技术研发人员:成卓鸿
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1