一种基于时序关联的个人电脑文件查询方法技术

技术编号:8907183 阅读:243 留言:0更新日期:2013-07-11 04:51
一种基于时序关联的个人电脑文件查询方法。该方法通过自动监控个人电脑的文件操作,自动得到用户对于个人电脑中文件的访问时序,根据访问时序建立个人文件之间的时序关联图。然后基于输入的关键词,利用字符串匹配方法,获取文件名称能够匹配用户输入关键字的文件集合作为初始查询结果集合,基于该集合并利用时序关联图,进一步计算出更为全面的查询结果。本发明专利技术将个人桌面文件查询和用户访问文件的时序关系结合起来,针对用户希望通过文件访问时序关系进行查询的问题,提出以上解决方案,该方法具有简洁实用、容易实现的特性,同时还可以大大减少用户的文件搜索时间,便于用户查询个人桌面文件,能够满足用户特定情景下的查询需求。

【技术实现步骤摘要】

本专利技术涉及个人信息管理领域,尤其是涉及。
技术介绍
数字化技术和web的发展使人们每天处理的信息量剧增,而人的注意力和能够用在数据管理上的时间却是基本不变的。随着个人计算机中的文件数量急剧增加,如果用户不能准确地记住想要查找的文件的确切位置和相关属性信息,查找个人电脑中的某个文件就会变成一件困难的事情。目前常用的个人桌面查询方法主要有操作系统提供的资源管理器和计算机桌面搜索(Desktop Search)工具。基于文件系统的资源浏览器是目前人们管理及查询个人桌面文件最常使用的方式。这种方法有以下局限性:对于一些很长时间没有使用的文件,用户往往不能回忆起文件存放的准确位置,可能需要进行多次尝试才能找到所需要的文件,从而浪费时间。有时甚至无法找到所需要的文件。桌面搜索是目前人们经常使用的一种查找个人电脑中文件的方法。例如微软、谷歌、雅虎等都有自己的桌面搜索工具。目前的桌面搜索工具主要是通过对个人电脑中的文件建立全文索引,从而支持用户通过关键字搜索需要的文件。这种方法有以下局限性:一是对于一些很长时间没有使用的文件,用户往往不能准确回忆起文件名中包含的关键字;二是对大量文件的全文索引往往导致比较低的查询效率。因此目前的搜索工具在特定情况下不能很好地满足用户查询个人文件的需要。例如用户希望查询几年前参加某个学术会议的一张照片,其文件名可能是类似于“DC001.jpg”之类的没有确切含义的字符串,这样如果用户不能够记住文件名或存放路径,就无法用现有的桌面搜索工具或资源管理器进行查找,因此需要针对这种情况研究专利技术新的个人电脑文件查询方法。基于用户访问时序关系检索个人电脑上的文件彳目息可以提闻特定情景下的查询效率,本专利技术就是针对这一问题。
技术实现思路
本专利技术的目的是克服现有技术存在的上述问题,提出。本专利技术是基于用户对个人电脑中文件的访问规律的分析提出的。该方法通过自动监控个人电脑的文件操作,自动得到用户对于个人电脑中文件的访问时序,根据访问时序建立个人文件之间的时序关联信息表。然后基于输入的关键词,利用字符串匹配方法,获取文件名称能够匹配用户输入关键字的文件集合作为初始查询结果集合,基于该集合并利用时序关联信息表,进一步计算出更为准确的查询结果。本专利技术提供的基于访问时序的个人电脑文件查询方法具体步骤包括:第1、利用关系数据表存储个人电脑中的用户文件和用户操作日志所涉及的数据表主要包括三个:用户文件表、用户日志表、文件时序关联信息表;用户文件表包括以下主要字段:文件标识符、文件名、文件存放路径、文件描述,文件描述为通过对文件名进行分词得到的关键字集合,例如,“Dasfaa会议论文初稿.doc”是一个文件,其文件描述为{Dasfaa,会议,论文,初稿};用户日志表存储用户操作日志,主要字段包括:访问时间、文件名称、文件路径,用户日志按照操作时间进行排序;文件时序关联信息表用来保存文件之间的时序关联关系,主要字段包括:文件标识符1、文件标识符2、时序关联度,每一条记录表示两个文件被用户连续访问的频繁度;第2、自动记录用户在个人电脑上的操作日志定时调用操作系统的API函数监控电脑上打开的窗口,通过打开窗口列表的变化,获取新打开窗口的标题和打开时间;从窗口标题中抽取文件名,并利用操作系统的最近访问文件夹获取所访问文件的存取路径;发现用户打开新文件就在用户日志表中增加一条操作记录,如果访问的文件在用户文件表中不存在,则将其作为新的用户文件添加到用户文件表中;第3、自动构建个人电脑上文件的时序信息关联表每次监控到用户变换文件访问窗口,对时序信息关联表进行更新;基于用户日志表能够得到最后连续访问的两个文件,假定其为(Fl,F2),查询时序关联信息表中是否存在文件标识符I为Fl且文件标识符2为F2或者文件标识符I为F2且文件标识符2为Fl的记录,如果不存在,则在时序关联信息表中增加一个新的记录,其中各字段的值如下:文件标识符I为Fl,文件标识符2为F2 且时序关联度为0.5 ;如果存在,则将这两个文件原来的时序关联度更新,计算公式为:权利要求1.,其特征在于该方法包括: 第1、利用关系数据表存储个人电脑中的用户文件和用户操作日志 所涉及的数据表主要包括三个:用户文件表、用户日志表、文件时序关联信息表;用户文件表包括以下主要字段:文件标识符、文件名、文件存放路径、文件描述,文件描述为通过对文件名进行分词得到的关键字集合;用户日志表存储用户操作日志,主要字段包括 访问时间、文件名称、文件路径,用户日志按照操作时间进行排序;文件时序关联信息表用来保存文件之间的时序关联关系,主要字段包括:文件标识符1、文件标识符2、时序关联度,每一条记录表示两个文件被用户连续访问的频繁度; 第2、自动记录用户在个人电脑上的操作日志 定时调用操作系统的API函数监控电脑上打开的窗口,通过打开窗口列表的变化,获取新打开窗口的标题和打开时间;从窗口标题中抽取文件名,并利用操作系统的最近访问文件夹获取所访问文件的存取路径;发现用户打开新文件就在用户日志表中增加一条操作记录,如果访问的文件在用户文件表中不存在,则将其作为新的用户文件添加到用户文件表中; 第3、自动构建个人电脑上文件的时序关联信息表 每次监控到用户变换文件访问窗口,对时序关联信息表进行更新;基于用户日志表能够得到最后连续访问的两个文件,假定其为(F1,F2),查询时序关联信息表中是否存在文件标识符I为Fl且文件标识符2为F2或者文件标识符I为F2且文件标识符2为Fl的记录,如果不存在,则在时序关联信息表中增加一个新的记录,其中各字段的值如下:文件标识符I为Fl,文件标识符2为F2且时序关联度为0.5 ;如果存在,则将这两个文件原来的时序关联度更新,计算公式为: U = ^^ Wm + I 其中Wtjld为原来的时序关联度,Wnew为新计算出来的时序关联度;该公式的计算满足:时序关联度的值在0到I之间;连续访问的次数越多,时序关联度的值越大; 第4、利用关键字匹配方法和时序信息关联表计算查询结果 第4.1输入要查询桌面文件的关键词K1, K2,...,K1,其中下标L为用户输入的关键字个数; 第4.2计算用户文件表中每个文件描述和输入关键字集合的相似度,得到相似度大于I的文件集合(F1F2,…,FJ,n为文件描述与用户输入的关键字相似度大于0的文件个数; 第4.3在时序关联信息表中查询出与(F1, F2,…,FJ任意一个文件具有时序关系的文件集合{D1; D2,…,DJ ; 第4.4将(F1, F2,, FJ和(D1, D2,, Dj合并进行排序,返回查询结果。全文摘要。该方法通过自动监控个人电脑的文件操作,自动得到用户对于个人电脑中文件的访问时序,根据访问时序建立个人文件之间的时序关联图。然后基于输入的关键词,利用字符串匹配方法,获取文件名称能够匹配用户输入关键字的文件集合作为初始查询结果集合,基于该集合并利用时序关联图,进一步计算出更为全面的查询结果。本专利技术将个人桌面文件查询和用户访问文件的时序关系结合起来,针对用户希望通过文件访问时序关系进行查询的问题,提出以上解决方案,该方法具有简洁实用、容易实现的特性,同时还可以大大减少用户的文件搜索时间,便于用户查本文档来自技高网
...

【技术保护点】
一种基于时序关联的个人电脑文件查询方法,其特征在于该方法包括:第1、利用关系数据表存储个人电脑中的用户文件和用户操作日志所涉及的数据表主要包括三个:用户文件表、用户日志表、文件时序关联信息表;用户文件表包括以下主要字段:文件标识符、文件名、文件存放路径、文件描述,文件描述为通过对文件名进行分词得到的关键字集合;用户日志表存储用户操作日志,主要字段包括:访问时间、文件名称、文件路径,用户日志按照操作时间进行排序;文件时序关联信息表用来保存文件之间的时序关联关系,主要字段包括:文件标识符1、文件标识符2、时序关联度,每一条记录表示两个文件被用户连续访问的频繁度;第2、自动记录用户在个人电脑上的操作日志定时调用操作系统的API函数监控电脑上打开的窗口,通过打开窗口列表的变化,获取新打开窗口的标题和打开时间;从窗口标题中抽取文件名,并利用操作系统的最近访问文件夹获取所访问文件的存取路径;发现用户打开新文件就在用户日志表中增加一条操作记录,如果访问的文件在用户文件表中不存在,则将其作为新的用户文件添加到用户文件表中;第3、自动构建个人电脑上文件的时序关联信息表每次监控到用户变换文件访问窗口,对时序关联信息表进行更新;基于用户日志表能够得到最后连续访问的两个文件,假定其为(F1,F2),查询时序关联信息表中是否存在文件标识符1为F1且文件标识符2为F2或者文件标识符1为F2且文件标识符2为F1的记录,如果不存在,则在时序关联信息表中增加一个新的记录,其中各字段的值如下:文件标识符1为F1,文件标识符2为F2且时序关联度为0.5;如果存在,则将这两个文件原来的时序关联度更新,计算公式为:Wnew=1Wold+1其中Wold为原来的时序关联度,Wnew为新计算出来的时序关联度;该公式的计算满足:时序关联度的值在0到1之间;连续访问的次数越多,时序关联度的值越大;第4、利用关键字匹配方法和时序信息关联表计算查询结果第4.1输入要查询桌面文件的关键词K1,K2,...,Kl,其中下标L为用户输入的关键字个数;第4.2计算用户文件表中每个文件描述和输入关键字集合的相似度,得到相似度大于1的文件集合{F1F2,…,Fn},n为文件描述与用户输入的关键字相似度大于0的文件个数;第4.3在时序关联信息表中查询出与{F1,F2,…,Fn}任意一个文件具有时序关系的文件集合{D1,D2,…,Dm};第4.4将{F1,F2,...,Fn}和{D1,D2,...,Dm}合并进行排序,返回查询结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李玉坤冯美玲
申请(专利权)人:天津理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1