当前位置: 首页 > 专利查询>北京大学专利>正文

一种文件标签的智能提示方法技术

技术编号:2823910 阅读:345 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种文件标签的智能提示方法,属于计算机网络领域。本发明专利技术的方法通过利用文件内容的上下文和用户交互的历史数据,对用户进行标签添加时提供智能的提示。与现有技术相比,本发明专利技术能够为用户提供更加准确而丰富的标签提示。

【技术实现步骤摘要】

本专利技术涉及计算机桌面系统或者网站中,文件标签添加时的提示方法,特别是照片标签添加时的提示方法,属于计算机网络领域。
技术介绍
近年来,数字化进程(Cyberization)[1]突飞猛进,具体体现在处理器、存储器、音/视频编码、摄像和显示设备等方面技术的持续高速发展。这些领域的技术进步使得计算机用户可以创造、获得和管理具有越来越大数据量的信息。以数码照片为例,随着数码相机和具有拍照功能的手机的日益普及,家庭数码照片的数量增长迅速。我们注意到,为照片添加标签是多数软件工具和照片共享网站都提供的功能。现有的软件工具如ACDSee[2],Microsoft Windows Photo Gallery[3],Adobe Photoshop Album[4],Google Picasa[5],有代表性的照片共享网站Flickr.com[6]都提供为照片添加标签和根据标签检索照片的功能。与此同时,随着照片共享网站的兴起和标注标签用户界面的改进,越来越多的照片都有标签。在照片共享网站兴起之前,虽然很多软件工具也提供为照片添加标签的功能,但用户的积极性并不高[7],Ames等[8]的调查表明,与他人共享照片,成为用户愿意为照片添加标签的重要原因。标签作为Web2.0的主要特点之一,将会越来越为用户所接受。近年来,有大量的研究工作集中在为用户添加标签提供帮助。这些研究工作主要可以分为两类,分别是照片分类[9-11],以及标签的自动添加或者提示[12-14]。其中,许多照片分类的工作都试图将照片按照事件分类,这是因为“事件”被认为是用户记忆家庭照片的重要线索。为了达到这一目的,除了采用图像分析的方法提取底层特征,还考虑照片的时间[9]、地点[10]以及拍摄参数[11]等元数据。与照片分类不同,标签的自动添加或提示是在用户的添加动作发生时,给用户提供若干的标签备选项,让用户从中选择以完成添加。本专利技术中的方法也属于这一类。这方面的前人工作主要集中在提示照片的人物标签,通常要利用人脸、衣服纹理等模式识别的算法[12][13]。但是模式识别算法具有局限性,比如当人脸不是正面,或者衣服纹理不明显时,这些算法可能失效。为了克服这个不足,在[14]中,作者提出可以利用照片内容的上下文来加强标签预测的精度,并给出了完全基于该上下文的照片人物标签的提示算法。其中,照片内容的上下文包括照片的拍摄时间、地点,以及照片已有的人物标签等。-->我们注意到,除了文件内容的上下文之外,用户与系统交互历史也包含了用户对文件丰富的记忆线索[15]。Karl等人[16]通过记录用户操作文件时的上下文,构建一个基于任务(task-based)的文件分类,来帮助用户检索文件。操作文件时的上下文包括用户的操作历史、之前一段时间内打开的文件、之后一段时间内打开的文件等等。无疑,这些交互历史数据对用户添加标签也是有提示功能的,但是前人工作中很少涉及。另外,本专利技术主要讨论的是对一般文件添加标签的提示方法,其与对照片添加标签的提示方法存在以下联系和区别:一、照片是一般文件的一种具体形式,一般文件也具有与内容相关的上下文,因此利用上下文进行预测的方法,对一般文件也适用。二、对照片的图像内容进行分析的方法,对一般文件不适用。因为一般文件可能不具有图像内容。综上,前人工作的局限性主要体现在以下三个方面:一、讨论的范围仅仅局限于照片,没有提出对一般文件的标签提示算法;二、仅仅局限于对人物标签的提示,没有将该方法推广至对一般标签的提示;三、没有对用户交互的历史数据进行充分挖掘,为用户提供更丰富的添加线索。
技术实现思路
本专利技术的目的是针对上面提到的三个局限性,提出一种文件标签的智能提示方法。该方法不仅利用文件内容的上下文,而且利用用户交互的历史数据,对用户进行标签提示(不局限于人物标签)。本专利技术通过提取文件内容的上下文,分析用户和操作系统的交互历史,智能的产生一系列的标签备选项,作为对用户添加标签的提示。文件内容的上下文,主要是与文件内容相关的属性。对照片而言,主要包括照片拍摄的时间、地点等。用户交互的历史数据,主要包括当前文件的创建时间、最近修改时间等。本专利技术中方法的基本思想是:对从未添加过标签的文件:找出与其具有相同或相近内容上下文的文件,统计这些文件中标签出现的频率,频率越高的标签,在当前文件中出现的可能性也越大。找出交互历史中操作时间与当前文件相同或相近的其他文件,统计这些文件中标签出现的频率,频率越高的标签,在当前文件中出现的可能性也越大。对已经有若干标签的文件:找出与其具有相同或相近内容上下文的文件,统计这些文件中的标签与当前文件中的标签同时出现的频率,频率越高的标签,在当前文件中出现的可能性也越大。找出交互历史中操作时间与当前文件相同或相近的其他文件,统计这些文-->件中标签与当前文件中标签同时出现的频率,频率越高的标签,在当前文件中出现的可能性也越大。本专利技术的技术方案为:一种文件标签的智能提示方法,针对未添加过标签的文件,其步骤为:1)从文件上下文中提取一参考元素值;2)根据参考元素值设定一取值范围;3)提取参考元素值在该取值范围内的文件,得到文件集Pμ′及其对应的标签集Tμ′;4)统计标签集Tμ′中各元素在文件集Pμ′中出现的次数N1;5)从用户交互历史数据中提取一参考数据值;6)根据该参考数据值设定一取值范围;7)提取参考数据值在该取值范围内的文件,得到文件集Q及其对应的标签集T′;8)统计标签集T′中各元素在文件集Q中出现的次数N2;9)根据各个标签元素出现的次数N1和N2对标签进行排序,提示用户选择标签。所述参考元素包括但不仅限于下列元素的一种或几种:时间、地点。所述参考数据包括但不仅限于下列数据的一种或几种:创建时间、最近修改时间。所述对标签进行排序的方法为:1)将所述标签集Tμ′和T′合并,记为标签集Tr;2)从Tr中的任一标签元素t,其在所述文件集Pμ′中出现的次数记为n1,在所述文件集Q中出现的次数记为n2;3)根据公式p=βn1+νn2计算该标签元素在当前文件中出现的可能性值,其中β为对所述Tμ′中标签的权值,ν为对所述Q中标签的权值;4)将可能性值排名靠前的m个标签,作为结果返回给用户。所述权值β、ν和所述取值范围由系统设定或由用户设定。一种文件标签的智能提示方法,针对已添加过标签的文件,其步骤为:1)从文件上下文中提取一参考元素值;2)根据参考元素值设定一取值范围;3)提取参考元素值在该取值范围内的文件,得到文件集Pμ′及其对应的标签集Tμ′;-->4)统计Tμ′-Tknown中各元素与Tknown中各元素在文件集Pμ′的文件中同时出现的次数N1,其中Tknown为所有已添加过标签文件的标签集;5)从用户交互历史数据中提取一参考数据值;6)根据该参考数据值设定一取值范围;7)提取参考数据值在该取值范围内的文件,得到文件集Q及其对应的标签集T′;8)统计Tμ′-Tknown中各元素与Tknown中各元素在文件集Pμ′的文件中同时出现的次数N2;9)根据各个标签元素出现的次数N1和N2对标签进行排序,提示用户选择标签。所述参考元素包括但不仅限于下列元素的一种或几种:时间、地点。所述参考数据包括但不仅限于下列数据的一种或几种:创建时间本文档来自技高网
...

【技术保护点】
一种文件标签的智能提示方法,针对未添加过标签的文件,其步骤为:1)从文件上下文中提取一参考元素值;2)根据参考元素值设定一取值范围;3)提取参考元素值在该取值范围内的文件,得到文件集P↓[μ′]及其对应的标签集T↓[ μ′];4)统计标签集T↓[μ′]中各元素在文件集P↓[μ′]中出现的次数N↓[1];5)从用户交互历史数据中提取一参考数据值;6)根据该参考数据值设定一取值范围;7)提取参考数据值在该取值范围内的文件,得到 文件集Q及其对应的标签集T′;8)统计标签集T′中各元素在文件集Q中出现的次数N↓[2];9)根据各个标签元素出现的次数N↓[1]和N↓[2]对标签进行排序,提示用户选择标签。

【技术特征摘要】
1.一种文件标签的智能提示方法,针对未添加过标签的文件,其步骤为:1)从文件上下文中提取一参考元素值;2)根据参考元素值设定一取值范围;3)提取参考元素值在该取值范围内的文件,得到文件集Pμ′及其对应的标签集Tμ′;4)统计标签集Tμ′中各元素在文件集Pμ′中出现的次数N1;5)从用户交互历史数据中提取一参考数据值;6)根据该参考数据值设定一取值范围;7)提取参考数据值在该取值范围内的文件,得到文件集Q及其对应的标签集T′;8)统计标签集T′中各元素在文件集Q中出现的次数N2;9)根据各个标签元素出现的次数N1和N2对标签进行排序,提示用户选择标签。2.如权利要求1所述的方法,其特征在于所述参考元素包括但不仅限于下列元素的一种或几种:时间、地点。3.如权利要求1所述的方法,其特征在于所述参考数据包括但不仅限于下列数据的一种或几种:创建时间、最近修改时间。4.如权利要求1所述的方法,其特征在于所述对标签进行排序的方法为:1)将所述标签集Tμ′和T′合并,记为标签集Tr;2)从Tr中的任一标签元素t,其在所述文件集Pμ′中出现的次数记为n1,在所述文件集Q中出现的次数记为n2;3)根据公式p=βn1+νn2计算该标签元素在当前文件中出现的可能性值,其中β为对所述Tμ′中标签的权值,ν为对所述Q中标签的权值;4)将可能性值排名靠前的m个标签,作为结果返回给用户。5.如权利要求4所述的方法,其特征在于所述权值β、ν和所述取值范围由系统设定或由用户设定。6.一种文件标签的智能提示方法,针对已添加过标签的文件,其步骤为:1)从文件上下文中...

【专利技术属性】
技术研发人员:朱广飞王衡汪国平
申请(专利权)人:北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1