一种报纸数字化版面信息的裁剪与拼装的方法及系统技术方案

技术编号:4333458 阅读:275 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种报纸数字化版面信息的裁剪与拼装的方法及系统,属于数字图书馆与数字报刊领域。现有的方法和系统只能够支持数字报刊的整版浏览和存储,并不能提供以新闻报道为单位的裁剪技术来提供原文的佐证,更没有面向用户的个性化的剪报、收藏等功能。本发明专利技术所述的系统由三个核心模块组成:图片定位裁剪模块,多图片拼接模块,打印成簿模块。采用本发明专利技术所述的方法和系统,可以实现数字报刊在线裁剪、自由拼接、按类存储、打印成簿等功能,为用户提供个性化的数字报刊剪报服务。

【技术实现步骤摘要】

本专利技术属于数字图书馆与数字报刊应用领域,具体涉及一种报纸数字化版面信息的裁剪与拼装的方法及系统
技术介绍
目前,随着计算机网络技术的发展,数字报刊以它信息量大、时效性高、便于检索、收藏、管理的优势获得了人们的青睐。同时,随着web2.0时代的到来,数字媒体的用户个性化数据再加工技术_数字报剪报技术也越来越受到人们的关注和期待。 传统纸质剪报技术缺点明显,面对数字报刊更是束手无策。传统剪报是用一把剪刀,从一张完好的报纸或者一本崭新的刊物里直接将所需文章剪裁下来,然后用浆糊把它们拼凑在一起。这种做法破坏了报纸和刊物的完整性,降低了其保存利用的价值。同时,剪报制作者不能对剪裁下来的文章进行再加工,并且传递方式单一。数字报刊剪报技术的出现正好能够解决上述存在的问题。 报纸信息作为平面媒体资讯的重要来源显得格外重要,但是目前的数字报只提供原文和原版面图信息是不够的,当报纸资讯文章独立被检索和使用时,它的出处佐证图片显得格外重要,通过使用本方法也可以解决上述问题。目前数字报刊剪报技术的实现,主要采用如下方案 将图片形式的报纸版面反解为电子文本,并根据一定的人工标注住息将待剪的报道以文本方式抽取出来,提供给读者的是报道文本。由于并未将待剪报道保持原来的形状以版面图片子图的形式裁剪出来,无法将各裁剪出的报道进行拼接,所以并未实现真正意义上的剪报。 以上剪报方案,未达到模拟读者纸质剪报习惯,保持原报纸报道排版样式,按读者兴趣分类管理剪报、排版打印的效果和初衷。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的是提供一种报纸数字化版面信息的裁剪与拼装的方法及系统,该方法及系统能够模拟纸质剪报,根据用户点击裁剪报纸数字化版面上的文章报道,从而实现面向读者提供个性化数字剪报功能的目的。 为达到以上目的,本专利技术采用的技术方案是 —种报纸数字化版面信息的裁剪与拼装的方法,包括以下步骤 步骤一,图片定位裁剪模块将图片形式的报纸数字化版面中读者需要裁剪的目标文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此目标文章区域的新图片; 步骤二,多图片拼接模块将用户裁剪下来的多个图片进行拼接; 步骤三,打印成簿模块对拼接后的图片进行输出或打印。 进一步,步骤一中,对目标文章区域进行裁剪的方法包括以下步骤4 (1)用户选定需要裁剪的目标文章,系统获得目标文章区域的外接矩形; (2)按外接矩形边界进行裁剪,将目标文章外接矩形位置信息同本版面所有其它文章外接矩形位置进行比较计算,判断是否有交集,如果是,则得到交集区域,否则转入步骤(5); (3)将交集区域位置信息与目标文章的热点信息进行比较计算,从而判断交集区域是否属于目标文章,如果是,转入步骤(5),否则转入步骤(4); (4)计算获得交集区域,并将不属于目标文章的交集区域设置底色为白色,生成一幅新的图片作为裁剪后的文章图片; (5)保存裁剪后文章图片并记录裁剪边界位置信息。更进一步,步骤(1)中,系统获得目标文章区域的外接矩形的方法如下系统首先获得该目标文章的ID,然后从数据库中读取该目标文章的热点信息,在热点信息中找出横、纵坐标的最小值与最大值,最后组合成为能够覆盖此目标文章全部区域的最小矩形的四个顶点的坐标,该最小矩形为目标文章区域的外接矩形。 进一步,步骤二中,用户将裁剪好的文章的图片分类保存,当用户希望对多张图片进行拼接排版时,选择某一分类,系统将分类中所有用户保存的图片读至浏览器页面一侧候选区。 更进一步,步骤二中,拼接的画布默认大小为A4,并且能够自定义设置。拼接时采用Flash技术,将候选区的剪切图片拖至画布区,自由摆放,如有重叠则由用户设置层次。在画布上拼接的剪切图片的图片信息放在缓冲区,用户关闭浏览器时排版信息清除。 进一步,步骤三中,对拼接后的图片进行输出或打印的方法包括以下步骤 首先将用户排版的画布上的每个剪切图片按ID从数据库中读出相应标题和文章正文建立关联,将各文章标题按照位置自上至下自左至右顺序,依次排列形成目录; 然后按照目录顺序将文章正文按文章分页排列成文档,将排列的页数加至目录项中; 最后将画布上排版好的拼接图片信息、目录、文章正文输出保存或传给打印机,由打印机打印输出。 —种报纸数字化版面信息的裁剪与拼装的系统,包括以下模块 图片定位裁剪模块,用于将图片形式的报纸版面中读者需要裁剪的文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此文章区域的新图片; 用于将用户裁剪下来的多个图片进行拼接的多图片拼接模块; 用于对拼接后的图片进行输出或打印的打印成簿模块。 本专利技术的效果在于采用本专利技术所述的方法和系统,可以有效地根据用户点击裁剪报纸数字化版面上的文章报道,分类保存、在线排版、打印,达到了模拟纸质剪报,面向读者提供个性化剪报功能的初衷。附图说明 图1是本专利技术所述系统的结构图; 图2是本专利技术所述方法中图片定位裁剪方法的流程图。具体实施例方式下面结合附图和具体实施方式对本专利技术作进一步地描述。如图1所示,一种报纸数字化版面信息的裁剪与拼装的系统,包括以下模块 图片定位裁剪模块ll,多图片拼接模块12,打印成簿模块模块13。 所述的图片定位裁剪模块11用于将图片形式的报纸版面中读者需要裁剪的文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此文章区域的新图片。 所述的多图片拼接模块12用于将用户裁剪下来的多个图片进行拼接。 所述的打印成簿模块13对拼接后的图片进行输出或打印。 如图2所示,一种报纸数字化版面信息的裁剪与拼装的方法,包括以下步骤 步骤一,图片定位裁剪模块将图片形式的报纸版面中读者需要裁剪的目标文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此目标文章区域的新图片。 本实施例中,由于报纸中每篇文章的显示形状大部分呈矩形,但也有许多呈不规则形状或分离的几个子图,所以使用最大拼接算法来确定需要裁剪的目标文章的正确区域。 数据库中存有每份报纸各个版面中每个文字块及图片的位置信息。要求每个文字块及图片的形状都为矩形,如呈不规则形状,将被拆分成多个不相交的矩形。为每个矩形单元保存四个顶点的位置坐标。在数字报出版前,排版人员将手工设置各矩形单元的关联-即每篇文章由哪些矩形组成。因此将在数据库中保存每份报纸各个版面上每篇文章的ID,以及组成这篇文章区域的所有矩形单元的顶点坐标值,将这些坐标值的集合称作该文章的热点信息。 本实施例中,使用最大拼接算法来确定需要裁剪的目标文章的正确区域的方法包括以下步骤 (1)当用户选定需要裁剪的目标文章后,系统获得该目标文章的ID,从数据库中读取该目标文章的热点信息S21,在热点信息中找出横、纵坐标的最小值与最大值,组合成为能够覆盖此目标文章全部区域的最小矩形的四个顶点的坐标,称此矩形为目标文章区域的外接矩形; (2)按外接矩形边界进行裁剪S22,将目标文章外接矩形位置信息同本版面所有其它文章外接矩形位置进行比较计算,判断是否有交集S23,如果是,则得到交集区域,否则转入步骤(5); (3)将交集区域位置信息与目标文章的热点信息进行比较计算S24,从而判断交集区域是否属于目标文章,如果是,转入步骤(5),否则转入步骤(4本文档来自技高网...

【技术保护点】
一种报纸数字化版面信息的裁剪与拼装的方法,包括以下步骤:步骤一,图片定位裁剪模块将图片形式的报纸数字化版面中读者需要裁剪的目标文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此目标文章区域的新图片;步骤二,多图片拼接模块将用户裁剪下来的多个图片进行拼接;步骤三,打印成簿模块对拼接后的图片进行输出或打印。

【技术特征摘要】
一种报纸数字化版面信息的裁剪与拼装的方法,包括以下步骤步骤一,图片定位裁剪模块将图片形式的报纸数字化版面中读者需要裁剪的目标文章包括其涉及的图片按其在报纸中所呈现的形状完整的裁剪下来,形成只包含此目标文章区域的新图片;步骤二,多图片拼接模块将用户裁剪下来的多个图片进行拼接;步骤三,打印成簿模块对拼接后的图片进行输出或打印。2. 如权利要求1所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于, 步骤一中,对目标文章区域进行裁剪的方法包括以下步骤(1) 用户选定需要裁剪的目标文章,系统获得目标文章区域的外接矩形;(2) 按外接矩形边界进行裁剪,将目标文章外接矩形位置信息同本版面所有其它文 章外接矩形位置进行比较计算,判断是否有交集,如果是,则得到交集区域,否则转入步骤 (5);(3) 将交集区域位置信息与目标文章的热点信息进行比较计算,从而判断交集区域是 否属于目标文章,如果是,转入步骤(5),否则转入步骤(4);(4) 计算获得交集区域,并将不属于目标文章的交集区域设置底色为白色,生成一幅新 的图片作为裁剪后的文章图片;(5) 保存裁剪后文章图片并记录裁剪边界位置信息。3. 如权利要求2所述的一种报纸数字化版面信息的裁剪与拼装的方法,其特征在于, 步骤(1)中,系统获得目标文章区域的外接矩形的方法如下系统首先获得该目标文章的 ID,然后从数据库中读取该目标文章的热点信息,在热点信息中找出横、纵坐标的最小值与 最大值,最后组合成为能够覆盖此目标文章全部区域的最小矩形的四个顶点的坐标,该最 小矩形为目标文章区域的外接矩形。4. 如权利要求1至3之一所述的一种报纸数字化版面信息的裁...

【专利技术属性】
技术研发人员:耿晓笛赵东岩吴艳伟孙赓刘艳珠
申请(专利权)人:北大方正集团有限公司北京方正阿帕比技术有限公司北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1