一种整理信息碎片的方法及系统技术方案

技术编号:9955380 阅读:92 留言:0更新日期:2014-04-23 11:42
本发明专利技术公开了一种整理信息碎片的方法及系统,包括:识别用户选取的多个信息碎片的文本内容,将得到的所有信息碎片的文本内容进行归集存储;以用户选定的文档格式将所述信息碎片的文本内容进行显示。本发明专利技术通过识别信息碎片的同时,自动将识别出的信息碎片的文本内容储存,使复杂繁琐的操作大大简化,并且通过为信息碎片建立索引目录,方便用户进一步在已获取的信息碎片中找到其目前所需的信息碎片,提高了信息碎片的处理效率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种整理信息碎片的方法及系统,包括:识别用户选取的多个信息碎片的文本内容,将得到的所有信息碎片的文本内容进行归集存储;以用户选定的文档格式将所述信息碎片的文本内容进行显示。本专利技术通过识别信息碎片的同时,自动将识别出的信息碎片的文本内容储存,使复杂繁琐的操作大大简化,并且通过为信息碎片建立索引目录,方便用户进一步在已获取的信息碎片中找到其目前所需的信息碎片,提高了信息碎片的处理效率。【专利说明】一种整理信息碎片的方法及系统
本专利技术涉及一种计算机领域,具体而言,涉及整理信息碎片的方法及系统。
技术介绍
当前,随着互联网时代的到来,当需要完成一个报告或者撰写一篇文档的时候,往往要对信息进行收集许多信息大多都以碎片的方式分散在不同的地方,找到后需要对整篇文稿进行复制、粘贴等操作收集文本内容,在收集到了信息碎片后,还得对信息碎片分类整理,对信息碎片的分类不当,还需要再次寻找信息碎片,操作十分繁琐。
技术实现思路
本专利技术旨在提供一种整理信息碎片的方法及系统,以解决上述现有技术中选取的信息碎片不易整理的问题。本专利技术公开了一种整理信息碎片的方法,包括:识别用户选取的多个信息碎片的文本内容,将得到的所有信息碎片的文本内容进行归集存储;为所述归集存储的所有信息碎片建立索引目录;等待用户在所述索引目录中选择其所需的信息碎片后,以用户选定的文档格式将选择的信息碎片的文本内容进行显示。优选地,还包括:在识别用户选取的多个信息碎片的文本内容后,确定每个信息碎片的文本内容中的关键字,将得到的所述关键字作为该信息碎片在所述索引目录中的摘要显不O优选地,还包括:在用户选取信息碎片后,识别每个信息碎片的信息来源;每个信息碎片的文本内容和信息来源具有映射关系;在显示信息碎片的文本内容的同时,显示该信息碎片的信息来源。优选地,还包括:将所述信息碎片的文本内容和信息来源放入数据库中实现所述归集存储;等待用户根据所述文本内容或信息来源在所述数据库在进行检索,将检索到的信息碎片的文本内容和信息来源以用户选定的文档格式显示。优选地,所述信息碎片包括:文本格式和图片格式。优选地,还包括:通过用户触发的多个中的一个全局热键,调用出相应的选取功能,选取文本格式或图片格式的所述信息碎片。优选地,还包括:在识别用户选取的多个信息碎片的文本内容后,将每个所述信息碎片的文本内容进行对比,在检测出文本内容重复的情况下,提示用户是否将文本内容重复部分继续进行归集处理;并根据用户的选择,继续进行所述归集处理或保留一份所述文本内容重复部分进行归集处理。本专利技术公开了一种整理信息碎片的系统,包括:信息识别模块,用于识别用户选取的信息碎片的文本内容和信息来源,并将识别后的文本内容和信息来源放入相应的数据库中进行归集存储;所述数据库包括:用于存储信息碎片的文本内容的第一数据库和用于存储信息碎片的信息来源的第二数据库;同一个信息碎片的文本内容和信息来源在两个数据库中具有映射关系;文档输出模块,用于将所述信息碎片的文本内容和信息来源,以用户选定的文档格式显示。优选地,还包括:解析模块,用于识别用户触发的全局热键,将识别出的全局热键映射的控制指令发送给相应的选取模块,提供用户相应的选取功能;目录索引模块,用于为所述数据库中的所有信息碎片建立索引目录,供用户选择;信息查重模块,用于将通过所述信息识别模块识别出的文本内容之间进行比对,在检测出文本内容重复的情况下,提示用户是否将文本内容重复部分继续进行归集处理;并根据用户的选择,继续进行所述归集处理或保留一份所述文本内容重复部分进行归集处理。本专利技术中的整理信息碎片的方法及系统,具有以下优点:1、对选取的信息碎片在数据库中自动进行存储,用户直接查看其所需要的信息碎片的文本内容;2、可连续收集碎片,提高了效率;3、建立索引目录,用户可以进一步的初选的信息碎片中筛选其所需要的信息碎片。【专利附图】【附图说明】此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1示出了实施例的第一流程图;图2示出了实施例的第二流程图;图3示出了实施例的结构示意图。【具体实施方式】下面将参考附图并结合实施例,来详细说明本专利技术。如图3所示,本专利技术公开了一种整理信息碎片的系统,包括:解析模块1、文本选取模块2、图片选取模块3、信息识别模块4、目录索引模块5、文档输出模块6和信息查重模块7 ;解析模块,用于识别用户触发的全局热键,并将识别出的全局热键映射的控制指令发送给相应的选取模块,提供用户相应的选取功能;全局热键可以是一个单独的按键,也可以是由多个单独的按键的组合。其中,用户在对所需要的信息碎片进行选取时,信息碎片不仅仅是可以进行选择的文字,还包括不可选择文字和包含有碎片信息的图片;解析模块识别出用户触发的第一全局热键后,解析模块将第一全局热键映射的控制指令发送给文本选取模块;文本选取模块接收到解析模块发送的第一全局热键映射的控制指令后,提供用户直接选取文本格式的信息碎片的功能; 解析模块识别出用户触发的第二全局热键后,解析模块将第二全局热键映射的控制指令发送给图片选取模块;图片选取模块接收到解析模块发送的第二全局热键映射的控制指令后,提供用户截图选取图片格式的信息碎片的功能。在用户对信息碎片选取后,将选取的信息碎片发送给信息识别模块;信息识别模块,用于接收用户选取的信息碎片,识别出该信息碎片的文本内容和信息来源;对于本地的资源,信息来源为信息碎片的存储地址,例c:\l\2\3\信息碎片所在文档;其中,信息碎片所在文档可以为各种文档格式,例:各种office文档,文本、编译文档等;对于网络的资源,信息来源为信息碎片的网络地址,例如:http://wenku.baidu.com/1ink?url=yKLV9ZlUyA3SCZqcZkDM0miW15LWLgEJv0h_cY-1PQR10P23sffg2sNgP_2-1s2h_32e2Cr_u3HjVmraorpLEpt8v9J5VGTKEC9dVPi8-Fle ;通过信息碎片的信息来源,可以快速的找到该信息碎片所在的文档,方便用户查看、调用和选取更多的关于该信息碎片在其所在文档中其他部分。其中,对于识别出信息碎片的文本内容来说:针对于文本格式的信息碎片,该信息碎片的本身作为其文本内容;对于图片格式的信息碎片,通过如下步骤,获取其中的文本内容:步骤1、扫描选取的图片并分析图片版面;步骤2、将图片进行行切分和字切分;步骤3、在渐暗和渐亮两种模式下检测该图片中的字、字母和符号的形状,将形状保持不变的字、字母和符号,标记为已确定文字在文本库中匹配,输出匹配后的文本;否则,将形状变化的标记为待定文字;步骤4、根据待定文字的形状及其前后一定范围的已确定文字的语义关系,确定待定文字,在文本库中匹配,输出匹配后的文本。步骤5、结合,输出完整的文本内容。其中,也可以采用ORC识别技术,识别图片中的文本信息。信息识别模块,将识别出该信息碎片的文本内容和信息来源进行分离处理,分别存入相应的数据库中进行归集存储;其中,数据库包括:第一数据库和第二数据库;第一数据库中用于存储信息碎片的文本内容;第二数据本文档来自技高网...

【技术保护点】
一种整理信息碎片的方法,其特征在于,包括:识别用户选取的多个信息碎片的文本内容,将得到的所有信息碎片的文本内容进行归集存储;为所述归集存储的所有信息碎片建立索引目录;等待用户在所述索引目录中选择其所需的信息碎片后,以用户选定的文档格式将选择的信息碎片的文本内容进行显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:江潮
申请(专利权)人:武汉传神信息技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1