一种基于用户计算机终端的桌面信息采集系统及采集方法技术方案

技术编号:7718685 阅读:243 留言:0更新日期:2012-08-30 02:49
本发明专利技术公开了一种基于用户计算机终端的桌面信息采集系统及采集方法,由鼠标右键内容摘抄功能菜单、内容摘抄模块、内容存储模块、以及保存在本地目录中的XML文件构成,鼠标右键内容摘抄功能菜单提供用户执行内容摘抄功能的菜单项;内容摘抄模块负责对选取内容及其来源信息进行读取;内容存储模块将内容摘抄模块所读取到的内容和来源信息存储到本地XML文件中;方便用户检索、查看和更好地利用自己的摘抄信息。本发明专利技术能够很好地实现用户在浏览网页或文档过程中方便快捷地对自己所感兴趣的信息进行采集,并对采集内容提供统一存储格式和文件。本发明专利技术对用户进行个人知识收藏、管理和利用提供很好地帮助。

【技术实现步骤摘要】

本专利技术涉及。
技术介绍
随着信息化应用的不断扩展和互联网服务的不断普及,用户通过个人计算机终端所能接触和处理的信息内容也越来越丰富。从本地文档到互联网网页,从文字到图片乃至多媒体资源,海量而又庞杂的信息内容给用户对自己所感兴趣内容进行收集、保存、展现和再利用带来了很多困难。当前,用户通过个人计算机终端对自己感兴趣的信息内容进行收集的方式主要包括I、直接保存整个网页页面;2、直接拷贝整个文档文件;3、复制文档、网页或其它数字内容载体中的内容(包括文字片段、图、表、超链接等)并保存到某个电子文档或电子文件中;4、通过屏幕截图工具对信息内容进行截取并保存为图片。上述这些常用的用户个人计算机终端桌面信息采集方式都存在着一些问题。对于第I种和第2种采集方式,用户需要保存整个内容的全文信息,而用户感兴趣的往往只是其中的某一部分内容甚至只是某些文字片段。这样保存下来的全文信息会带来过多的信息干扰,无法体现直接有效地信息内容;对于第3种方式,虽然用户可以选择自己感兴趣的内容进行保存,但无法直接保存内容来源信息,用户无法通过已保存内容去追溯原文从而获得更多信息,而如果要对内容来源信息进行保存,则在操作会比较复杂耗时;对于第4种方式,将内容截取为图片进行保存,则在后续的内容利用(如文字拷贝、检索等)等方面带来很多不便,同时也存在着第3种方式的不足。
技术实现思路
本专利技术需要解决的技术问题就在于克服现有技术的缺陷,提供,它能够很好地实现用户在浏览网页或文档过程中方便快捷地对自己所感兴趣的信息进行采集,并对采集内容提供统一存储格式和文件。本专利技术对用户进行个人知识收藏、管理和利用提供很好地帮助。为解决上述问题,本专利技术采用如下技术方案本专利技术提供了一种基于用户计算机终端的桌面信息采集系统,所述桌面信息采集系统由鼠标右键内各摘抄功能采单、内各摘抄ネ旲块、内各存储ネ旲块、以及保存在本地目录中的XML文件四部分构成,其中鼠标右键内容摘抄功能菜单提供用户执行内容摘抄功能的菜单项; 内容摘抄模块负责对选取内容及其来源信息进行读取;内容存储模块将内容摘抄模块所读取到的内容和来源信息存储到本地XML文件中;最終得到一个记录了该用户全部摘抄信息的XML文件,方便用户检索、查看和更好地利用自己的摘抄信息。鼠标右键内容摘抄功能菜单为用户提供了执行内容摘抄功能的菜单项,当用户在网页或文档中用鼠标选中的内容,包括文字片段、图片、表格、超链接,点击鼠标右键,在弹出的右键菜单中找到“内容摘抄”菜单项,通过点击该菜单项,就可以执行内容摘抄方法。鼠标右键内容摘抄功能菜单针对网页内容和Microsoft Office文档内容采用不同的实现方式(I)对于网页内容摘抄,右键功能项是通过设置Windows注册表,为IE浏览器右键菜单添加ー个跟内容摘抄相关的菜单项,使用户可以对选中内容执行摘抄动作,该菜单项是通过访问Windows注册 表进行添加;(2)对于Microsoft Off ice文档内容摘抄,右键功能项是通过vba脚本语言,在 Microsoft Office文档中增加右键菜单项,该菜单项与(I)中所述的右键菜单项实现相同效果。针对不同的内容载体类型,内容摘抄模块分为网页内容摘抄子模块、MicrosoftOffice文档内容摘抄子模块ニ个部分,针对不同的内容载体类型,提供了相应的内容摘抄功能。网页内容摘抄子模块,具体实现方式包括(i)设置ー个用户本地的HTML文件,此文件定义了从网页上接收摘抄请求的javascript方法,该javascript方法能够读取到正在浏览网页中的相关内容,包括用户在页面中用鼠标选中的内容,包括文字片段、图片、表格、超链接、该网页标题以及该网页URL地址,同时通过该javascript方法还可以取得当前系统时间信息;(ii)用户通过鼠标右键内容摘抄功能菜单,可以执行⑴中所述的javascript方法,将需要的内容进行读取,然后通过该方法将这些内容提交给内容存储模块;对Microsoft Office文档内容摘抄子模块,具体实现方式包括(i)定义vba脚本语言方法,该vba脚本语言方法能够取得Microsoft Office文档中用鼠标选中的内容,包括文字片段、图片、表格、超链接,同时读取该内容所在文档的标题和文件路径,并将取得的内容发送到下述(ii)中定义的HTML文件;(ii)设置ー个用户本地的HTML文件,此文件定义了接收(i)中vba脚本所发送内容的javascript方法,同时通过该javascript方法还可以取得当前系统时间信息;(iii)用户通过I中所描述的鼠标右键内容摘抄功能菜单,可以执行⑴中所述的vba脚本语言方法,将需要的内容进行读取,读取完毕后,将触发(ii)中所述的javascript方法,接收vba脚本所发送内容,并读取当前系统时间信息,最后通过该javascript方法将这些内容提交给内容存储模块。内容存储模块接收内容摘抄模块发送过来的全部内容信息,并将这些信息根据固定的格式写入ー个XML文件中,写入完毕后,对该文件进行保存,该XML文件用于保存该用户所有的摘抄信息;内容存储模块包括两个子模块XML文件创建子模块和XML文件写入子模块;(I)XML文件创建子模块用户在第一次使用内容摘抄功能时,本子模块为会用户创建ー个新的XML文件,该XML文件的文件名和存储路径由系统进行预定义; (2) XML文件写入子模块XML文件创建完成后或该XML已经存在的情况下,XML文件写入子模块将接收到的全部内容信息以固定格式写入该XML文件中,写入完毕后,保存该XML文件;本方法使如下格式写入XML文件本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于用户计算机终端的桌面信息采集系统,其特征在于,所述桌面信息采集系统由鼠标右键内容摘抄功能菜单、内容摘抄模块、内容存储模块、以及保存在本地目录中的XML文件四部分构成,其中 鼠标右键内容摘抄功能菜单提供用户执行内容摘抄功能的菜单项; 内容摘抄模块负责对选取内容及其来源信息进行读取; 内容存储模块将内容摘抄模块所读取到的内容和来源信息存储到本地XML文件中; 最终得到一个记录了该用户全部摘抄信息的XML文件,方便用户检索、查看和更好地利用自己的摘抄信息。2.如权利要求I所述的基于用户计算机终端的桌面信息采集系统,其特征在于,鼠标右键内容摘抄功能菜单为用户提供了执行内容摘抄功能的菜单项,当用户在网页或文档中用鼠标选中的内容,包括文字片段、图片、表格、超链接,点击鼠标右键,在弹出的右键菜单中找到“内容摘抄”菜单项,通过点击该菜单项,就可以执行内容摘抄方法。3.如权利要求2所述的基于用户计算机终端的桌面信息采集系统,其特征在于,鼠标右键内容摘抄功能菜单针对网页内容和Microsoft Office文档内容采用不同的实现方式 (1)对于网页内容摘抄,右键功能项是通过设置Windows注册表,为IE浏览器右键菜单添加一个跟内容摘抄相关的菜单项,使用户可以对选中内容执行摘抄动作,该菜单项是通过访问Windows注册表进行添加; (2)对于MicrosoftOff ice文档内容摘抄,右键功能项是通过vba脚本语言,在Microsoft Office文档中增加右键菜单项,该菜单项与(I)中所述的右键菜单项实现相同效果。4.如权利要求3所述的基于用户计算机终端的桌面信息采集系统,其特征在于 针对不同的内容载体类型,内容摘抄模块分为网页内容摘抄子模块、Mi crosof tOffice文档内容摘抄子模块二个部分,针对不同的内容载体类型,提供了相应的内容摘抄功能。5.如权利要求4所述的基于用户计算机终端的桌面信息采集系统,其特征在于 网页内容摘抄子模块,具体实现方式包括 (i)设置一个用户本地的HTML文件,此文件定义了从网页上接收摘抄请求的javascript方法,该javascript方法能够读取到正在浏览网页中的相关内容,包括用户在页面中用鼠标选中的内容,包括文字片段、图片、表格、超链接、该网页标题以及该网页URL地址,同时通过该javascript方法还可以取得当前系统时间信息; (ii)用户通过鼠标右键内容摘抄功能菜单,可以执行Q)中所述的javascript方法,将需要的内容进行读取,然后通过该方法将这些内容提交给内容存储模块。6.如权利要求4所述的基于用户计算机终端的桌面信息采集系统,其特征在于 对Microsoft Office文档内容摘抄子模块,具体实现方式包括 (i)定义vba脚本语言方法,该vba脚本语言方法能够取得MicrosoftOffice文档中用鼠标选中的内容,包括文字片段、图片、表格、超链接,同时读取该内容所在文档的标题和文件路径,并将取得的内容发送到下述(ii)中定义的HTML文件; (ii)设置一个用户本地的HTML文件,此文件定义了接收(i)中vba脚本所发送内容的javascript方法,同时通过该javascript方法还可以取得当前系统时间信息; (iii)用户通过I中所描述的鼠标右键内容摘抄功能菜单,可以执行⑴中所述的vba脚本语言方法,将需要的内容进行读取,读取完毕后,将触发(ii)中所述的javascript方法,接收vba脚本所发送内容,并读取当前系统时间信息,最后通过该javascript方法将这些内容提交给内容存储模块。7.如权利要求1-6之任一所述的基于用户计算机终端的桌面信息采集系统,其特征在于 内容存储模块接收内容摘抄模块发送过来的全部内容信息,并将这些信息根据固定的 格式...

【专利技术属性】
技术研发人员:尹科
申请(专利权)人:北京英富森信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1