The present invention provides a file classification system and method based on vocabulary statistics. The electronic device running the method to have the operation ability, comprises the following steps: firstly, the description reads one or more file information, and one or more user operation history information; then, remove one or more lexical information from the user information extraction and operation history, calculation of lexical information in weight the value of Archival information description, and according to the weight value from lexical information choose lexical information as virtual directory lists to establish a specific link to the file label. After the aforementioned processing, it can automatically establish labels and links to each file so that users can easily manage the files.
【技术实现步骤摘要】
基于词汇统计的档案分类系统及方法
本专利技术是一种档案分类技术手段,尤指一种基于词汇统计的档案分类系统及方法。
技术介绍
为能方便的管理电子档案,用户大多会依照属性将各个档案放置在特定的文件夹,然而当各个档案具有多个属性时,前述的方案并无法让使用者便捷的存取档案。为解决前述的问题,部分的使用者会透过人工方式对各个档案设定属性卷标,而用户在点选各个标签后即可开启特定的档案,举例说明之,当使用者持有档案「花莲旅游计划书.doc」时,可对此档案设定卷标「花莲」以及卷标「旅游」,因此当使用者点选其中一个标签时,即可开启该档案。只是上述的方案需通过人工方式进行分类以及设定,因此使用者需耗费相当多的时间来执行重复性工作,而造成使用者相当大的困扰。而当档案数量日益增加时,前述的管理方案会严重的降低使用者的操作意愿。综上所述,如何提供一种可自动进行档案分类技术方案乃本领域亟需解决的技术问题。
技术实现思路
为解决前揭的问题,本专利技术的目的是提供一种基于词汇统计的档案分类系统及方法。为达上述目的,本专利技术提出一种基于词汇统计的档案分类系统。前述的系统运行于具备运算能力的电子装置,并包含读取模块以及处理模块。前述的读取模块是读取一个或多个档案的档案描述信息以及一个或多个用户历史操作信息。前述的处理模块连接读取模块,并自用户历史操作信息萃取出一个或多个词汇信息、计算词汇信息位于档案描述信息的权重值,并依权重值自词汇信息中挑选词汇信息以作为虚拟目录列表的列表卷标,其中列表卷标是用于建立特定档案的连结。为达上述目的,本专利技术提出一种基于词汇统计的档案分类方法。前述的方法运行于具备 ...
【技术保护点】
一种基于词汇统计的档案分类系统,运行于具备运算能力的电子装置,其特征在于,包含:读取模块,读取一个或多个档案的档案描述信息,以及一个或多个用户历史操作信息;以及处理模块,连接该读取模块,该处理模块更自该用户历史操作信息萃取出一个或多个词汇信息,并计算该词汇信息位于该档案描述信息的权重值,并依该权重值自该词汇信息中挑选词汇信息以作为虚拟目录列表的列表卷标,其中该列表卷标是用于建立特定该档案的连结。
【技术特征摘要】
2016.05.30 TW 1051168181.一种基于词汇统计的档案分类系统,运行于具备运算能力的电子装置,其特征在于,包含:读取模块,读取一个或多个档案的档案描述信息,以及一个或多个用户历史操作信息;以及处理模块,连接该读取模块,该处理模块更自该用户历史操作信息萃取出一个或多个词汇信息,并计算该词汇信息位于该档案描述信息的权重值,并依该权重值自该词汇信息中挑选词汇信息以作为虚拟目录列表的列表卷标,其中该列表卷标是用于建立特定该档案的连结。2.根据权利要求1所述的档案分类系统,其特征在于,该处理模块是计算该词汇信息位于该档案描述信息的词频-逆向文件频率权重值。3.根据权利要求1所述的档案分类系统,其特征在于,该处理模块是依据列表上限以挑选该词汇信息作为该列表卷标。4.根据权利要求1所述的档案分类系统,其特征在于,该处理模块依据权重值大小以挑选该词汇信息以作为该列表卷标。5...
【专利技术属性】
技术研发人员:陈嬿如,林春风,王昱钧,许庭玮,
申请(专利权)人:中华电信股份有限公司,
类型:发明
国别省市:中国台湾,71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。