文件属性信息的处理方法和装置制造方法及图纸

技术编号:14956576 阅读:44 留言:0更新日期:2017-04-02 11:24
本发明专利技术公开了一种文件属性信息的处理方法和装置。其中,该方法包括:获取待处理文件中属于第一属性的第一描述信息;获取用于对第一属性进行匹配的匹配条件,其中,匹配条件用于指示目标描述信息和目标描述信息所属的第二属性;比较第一描述信息与目标描述信息;若第一描述信息包含目标描述信息,则将目标描述信息从第一描述信息中删除;以及将目标描述信息设置为待处理文件中属于第二属性的第二描述信息。通过本发明专利技术,解决了现有技术中对音乐属性信息的人工去除不符合音乐属性的描述信息的效率低的问题,实现了自动去除第一描述信息中不符合待处理文件的第一属性的信息,信息处理效率高的效果。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,具体而言,涉及一种文件属性信息的处理方法和装置
技术介绍
现有技术中提供了越来越多的音乐平台,这些音乐平台一般拥有百万量级的乐库,在用户使用这些音乐平台时,往往通过音乐属性信息对音乐数据进行了解和选择,其中的音乐属性信息为描述音乐数据的属性信息,如音乐属性信息中可以包括音乐数据的名称,现有的音乐属性信息中往往存在着大量的噪音,如,音乐数据中的歌曲名、专辑名的属性信息中夹杂的歌手、版本等其他信息,例如,刘德华-忘情水(liveinbeijing),这个歌曲名的文件属性信息里夹杂了歌手“刘德华”、版本“liveinBeijing”的噪音。现有技术中,为了去除这些音乐属性信息中的噪音,从全量数据(即数据库中的全部数据中)中提取中可能有噪音的歌曲名,再由人工去掉噪音。上述的音乐属性信息去噪依赖人工,人工去噪操作效率低,对大量的文件属性信息无法完成去噪工作;并且依赖人工去除噪音,操作的准确率也很低,无法准确进行去噪。其中,上述的噪音为文件属性信息中存在的不符合该信息所描述属性的数据。如,文件属性信息描述的为文件的名称属性,但是该文件属性信息中存在文件大小的数据(如,12M),该数据即为本申请的文件属性信息中的噪音。上述的文件属性信息可以为音乐文件、图片文件等文件的属性信息。针对上述的对音乐属性信息的人工去除不符合音乐属性的描述信息的效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种文件属性信息的处理方法和装置,以至少解决对音乐属性信息的人工去除不符合音乐属性的描述信息的效率低的问题。根据本专利技术实施例的一个方面,提供了一种文件属性信息的处理方法,该方法包括:获取待处理文件中属于第一属性的第一描述信息;获取用于对第一属性进行匹配的匹配条件,其中,匹配条件用于指示目标描述信息和目标描述信息所属的第二属性;比较第一描述信息与目标描述信息;若第一描述信息包含目标描述信息,则将目标描述信息从第一描述信息中删除;以及将目标描述信息设置为待处理文件中属于第二属性的第二描述信息。根据本专利技术实施例的另一方面,还提供了一种文件属性信息的处理装置,该装置包括:第一获取模块,用于获取待处理文件中属于第一属性的第一描述信息;第二获取模块,用于获取用于对第一属性进行匹配的匹配条件,其中,匹配条件用于指示目标描述信息和目标描述信息所属的第二属性;比较模块,用于比较第一描述信息与目标描述信息;删除模块,用于若第一描述信息包含目标描述信息,则将目标描述信息从第一描述信息中删除;以及设置模块,用于将目标描述信息设置为待处理文件中属于第二属性的第二描述信息。在本专利技术实施例中,可以获取待处理文件的第一属性的第一描述信息和对第一属性进行匹配的匹配条件,比较第一描述信息与匹配条件中的目标描述信息,然后可以根据比较结果删除目标描述信息,并将目标描述信息设置为目标属性信息所属的第二属性的第二描述信息。通过上述实施例,无需人工去噪,在第一描述信息中包含目标描述信息时,自动地将目标描述信息从第一描述信息中删除,解决了现有技术中对音乐属性信息的人工去除不符合音乐属性的描述信息的效率低的问题,实现了自动去除第一描述信息中不符合待处理文件的第一属性的信息,信息处理效率高的效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本发明的不当限定。在附图中:图1是根据本专利技术实施例的文件属性信息的处理方法的环境示意图;图2是根据本专利技术实施例的文件属性信息的处理方法的流程图;图3是根据本专利技术实施例的文件属性信息的处理方法对的示意图;图4是根据本专利技术实施例的一种可选的文件属性信息的处理方法的流程图;图5是根据本专利技术实施例的另一种可选的文件属性信息的处理方法的流程图;图6是根据本专利技术实施例的去噪词表管理的界面图;图7是根据本专利技术实施例的去噪结果查询的界面图;图8是根据本专利技术实施例的文件属性信息的处理装置的示意图;图9是根据本专利技术实施例的一种可选的文件属性信息的处理装置的示意图;图10是根据本专利技术实施例的文件属性信息的处理装置中的删除模块和设置模块的示意图;以及图11是根据本专利技术实施例的一种终端的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种文件属性信息的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。可选地,在本实施例中,上述文件属性信息的处理方法可以应用于如图1所示的终端101和服务器102所构成的硬件环境中。如图1所示,终端101通过网络或数据线与服务器102连接,对服务器102上的待处理文件的第一描述信息进行处理;也可以直接在服务器102上对待处理器文件使用文件属性信息的处理方法。上述网络包括但不限于:广域网、城域网或局域网。在本专利技术实施例中,上述的终端可以为移动终端、个人电脑上,具体地,终端可以为智能手机、平板电脑、PDA等终端。根据本专利技术实施例,提供了一种文件属性信息的处理方法,图2是根据本专利技术实施例的文件属性信息的处理方法的流程图。如图2所示,该方...

【技术保护点】
一种文件属性信息的处理方法,其特征在于,包括:获取待处理文件中属于第一属性的第一描述信息;获取用于对所述第一属性进行匹配的匹配条件,其中,所述匹配条件用于指示目标描述信息和所述目标描述信息所属的第二属性;比较所述第一描述信息与所述目标描述信息;若所述第一描述信息包含所述目标描述信息,则将所述目标描述信息从所述第一描述信息中删除;以及将所述目标描述信息设置为所述待处理文件中属于所述第二属性的第二描述信息。

【技术特征摘要】
1.一种文件属性信息的处理方法,其特征在于,包括:
获取待处理文件中属于第一属性的第一描述信息;
获取用于对所述第一属性进行匹配的匹配条件,其中,所述匹配
条件用于指示目标描述信息和所述目标描述信息所属的第二属性;
比较所述第一描述信息与所述目标描述信息;
若所述第一描述信息包含所述目标描述信息,则将所述目标描述
信息从所述第一描述信息中删除;以及
将所述目标描述信息设置为所述待处理文件中属于所述第二属
性的第二描述信息。
2.根据权利要求1所述的处理方法,其特征在于,将所述目标描述信息
从所述第一描述信息中删除包括:
检测所述第一描述信息包含的所述目标描述信息是否具有标识
符;
若所述第一描述信息包含的所述目标描述信息具有所述标识符,
则将所述目标描述信息从所述第一描述信息中删除。
3.根据权利要求2所述的处理方法,其特征在于,检测所述第一描述信
息包含的所述目标描述信息是否具有标识符包括:
获取标识符集合,其中,所述标识符集合中保存有多个预设的所
述标识符;
检测所述第一描述信息包含的所述目标描述信息前后存在的字
符是否存在于所述标识符集合;
若所述第一描述信息包含的所述目标描述信息前后存在的字符
存在于所述标识符集合,则检测出所述第一描述信息包含的所述目标
描述信息具有所述标识符。
4.根据权利要求2所述的处理方法,其特征在于,将所述目标描述信息
从所述第一描述信息中删除包括:
将所述目标描述信息和/或所述目标描述信息的标识符从所述第
一描述信息中删除。
5.根据权利要求1所述的处理方法,其特征在于,在将所述目标描述信
息从所述第一描述信息中删除之后,所述处理方法还包括:
判断删除所述目标描述信息之后的第一描述信息是否为空字符
串;
若去除所述目标描述信息之后的第一描述信息为所述空字符串,
则回退所述将所述目标描述信息从所述第一描述信息中删除的处理。
6.根据权利要求1所述的处理方法,其特征在于,将所述目标描述信息
设置为所述待处理文件中属于所述第二属性的第二描述信息包括:
判断所述目标描述信息所属的所述第二属性是否存在原始描述
信息;
若所述目标描述信息所属的所述第二属性不存在所述原始描述
信息,则将所述目标描述信息设置为所述第二属性的所述第二描述信
息;
若所述目标描述信息对应的所述第二属性存在所述原始描述信
息,则判断所述第二属性的所述原始描述信息是否为符合豁免保护的
信息;
若所述第二属性的所述原始描述信息为所述符合豁免保护的信
息,则使用所述目标描述信息替换所述原始描述信息。
7.根据权利要求1至6中任意一项所述的处理方法,其特征在于,在获
取用于对所述第一属性进行匹配的匹配条件之前,所述处理方法还包
括:按照下述生成方法中至少之一生成多个所述匹配条件:
从预先获取的知识库中导出文件的一个或多个属性的属性描述

\t信息,按照预设格式将所述属性描述信息生成多个有限集合匹配条
件;
使用标识符分割所述知识库中的属性描述信息得到多个属性子
信息,统计各个所述属性子信息,得到各个所述属性子信息的统计频
率,将超过预设统计频率的属性子信息进行过滤得到过滤后的属性子
信息,将所述过滤后的属性子信息按照所述预设格式生成多个所述有
限集合匹配条件;
按照预设输入格式输入前后缀匹配条件,
其中,所述匹配条件包括所述有限集合匹配条件和所述前后缀匹
配条件。
8.一种文件属性信息的处理装置,其特征在于,包括:
第一获取模块,用于获取待处理...

【专利技术属性】
技术研发人员:马跃超
申请(专利权)人:深圳市腾讯计算机系统有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1