歌曲数据处理方法及装置制造方法及图纸

技术编号:14693613 阅读:52 留言:0更新日期:2017-02-23 16:33
本发明专利技术揭示了一种歌曲数据处理方法及装置,歌曲数据处理方法包括获取选定歌曲所对应的歌词数据;读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息;根据识别的所述语言信息进行所述选定歌曲的分类处理。本发明专利技术的歌曲数据处理方法及装置能够有序、准确的对歌曲进行分类。

【技术实现步骤摘要】

本专利技术涉及计算机应用
,特别涉及一种歌曲数据处理方法及装置
技术介绍
通常人们会在例如手机、电脑等电子设备上存储大量的歌曲,以随时欣赏。为了便于人们能够快速找到自己喜欢的歌曲,电子设备往往会利用音乐播放器的分类功能对歌曲进行分类。音乐播放器可以按歌手、专辑名称、出版时间、风格、文件大小、歌曲时长对歌曲进行分类,其中,音乐播放器通过直接读取歌曲文件中内置的ID3信息实现对歌曲的分类。ID3信息是指,在一个MP3(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3,简称为MP3)等格式的歌曲文件的开头或末尾的若干字节内,附加了关于该歌曲文件的歌手、专辑名称、出版时间、风格、文件大小、歌曲时长等内容的信息。如前所述,目前主要通过读取歌曲文件中的ID3信息对歌曲进行分类,尽管ID3的相关标准也定义了用于标识语言类型的语言标签帧(TLAN帧,TLANLanguage),但是目前的歌曲文件中并没有在该TLAN帧中预置歌曲的语言类型信息。因此,现有技术中主要基于文件名、歌曲名或歌手名区分语言类型,但是由于文件名、歌曲名或歌手名的语言类型跟歌曲内容的语言类型相关性不强,例如一首名称为“Amani.mp3”的歌曲往往会被识别为英文歌曲,而实际上,“Amani.mp3”是中文歌曲。又例如,一首名称为“加州旅馆.mp3”的歌曲往往会被识别为中文歌曲,而实际上,“加州旅馆.mp3”是英文歌曲。因此,基于文件名、歌曲名或歌手名识别语言类型的准确率低,进而无法按照语言类型对歌曲进行有序、准确的分类。
技术实现思路
于此,本专利技术提供了一种歌曲数据处理方法,该方法能够按照语言类型对歌曲进行有序、准确的分类。基于此,本专利技术另提供了一种歌曲数据处理装置,该装置能够按照语言类型对歌曲进行有序、准确的分类。本专利技术提供了一种歌曲数据处理方法,包括:获取选定歌曲所对应的歌词数据;读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息;根据识别的所述语言信息进行所述选定歌曲的分类处理。本专利技术另提供一种歌曲数据处理装置,包括:歌词数据获取模块,用于获取选定歌曲所对应的歌词数据;语言信息识别模块,用于读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息;分类处理模块,用于根据识别的所述语言信息进行所述选定歌曲的分类处理。本专利技术的实施例提供的技术方案可以具有以下有益效果:本专利技术的歌曲数据处理方法,通过获取歌词数据,读取歌词数据中的文字字符的统一码Unicode编码值,并根据读取的文字字符对应的统一码Unicode编码值识别歌曲的语言信息,根据歌词中的文字字符的语言信息对歌曲数据进行分类,与现有的基于歌曲名称的分类方式相比,提高了歌词数据分类的准确度。本专利技术提供的一种歌曲数据处理装置包括歌词数据获取模块、语言信息识别模块和分类处理模块,本专利技术通过歌词数据获取模块获取歌词数据,通过语言信息识别模块识别歌曲的语言信息,通过分类处理模块对歌曲按语言信息进行分类,籍此,通过本专利技术的歌曲数据处理装置根据歌词中的文字字符的语言信息对歌曲数据进行分类,与现有的基于歌曲名称的分类方式相比,提高了歌词数据分类的准确度,进而能够更有针对性的对歌曲进行分类,便于歌曲的快速查找。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并于说明书一起用于解释本专利技术的原理。图1是根据本专利技术一种实施例的歌曲数据处理方法的流程图;图2a是一个实施例中读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息的方法流程图;图2b是一个实施例中依序读取歌词数据中的文字字符的统一码Unicode编码值,根据读取到的文字字符的统一码Unicode编码值确定所读取的文字字符的语言类型,当读取的文字字符的语言类型为其它语言类型,则终止所述歌词数据库中文字字符的统一码Unicode编码值的读取的方法流程图;图3是另一个实施例中读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息的方法流程图;图4是又一个实施例中读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息的方法流程图;图5a是一个实施例中根据时间戳删除歌词数据中的标识信息的方法流程图;图5b是另一个实施例中根据时间戳删除歌词数据中的标识信息的方法流程图;图6是另一个实施例中本专利技术歌曲数据处理方法的流程图;图7是一个实施例中歌曲数据处理装置的框图;图8是一个实施例中语言信息识别模块的框图;图9是另一个实施例中语言信息识别模块的框图;图10是又一个实施例中语言信息识别模块的框图;图11是另一个实施例中歌曲数据处理装置的框图;以及图12是本专利技术实施例提供的一种装置的框图。具体实施方式这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。如前所述,目前的电子设备可以按歌手、专辑名称、出版时间、风格、文件大小、歌曲时长对歌曲进行分类,但是不能按语言类型进行分类。基于此,为了使歌曲按语言类型进行有序、准确的分类,本专利技术特提出一种歌曲数据处理方法,该歌曲数据处理方法由计算机程序实现,与之相对应的,所构建的歌曲数据处理装置运行在例如手机、电脑等电子设备中,进而实现按语言类型对歌曲进行分类。在一实施例中,如图1所示,本专利技术的歌曲数据处理方法包括:步骤110,获取选定歌曲所对应的歌词数据。选定歌曲是指通过选定方式确定的待分类歌曲。选定歌曲可以通过电子设备的计算机系统自动选定或手动选定来实现。计算机系统可以将储存在电子设备上的歌曲选定为选定歌曲,也可以将加载在网页上的歌曲选定为选定歌曲,还可以将预设时间内下载的歌曲选定为选定歌曲,例如,将刚下载至本地的歌曲选定为选定歌曲,通过自动选定可以为下载的歌曲自动进行歌曲的语言信息的识别。对于手动选定,可以通过用户触发的选定操作而实现。歌词数据是指与歌曲对应的歌词内容,其包括文字字符信息。步骤110可以通过多种途径获取歌词数据,例如,可以包括如下途径:第一种途径,从歌曲文件的ID3信息中获取歌词数据,例如,通过从ID3信息的SYLT(Synchronizedlyric/text)或USLT(Unsychronizedlyric/texttranscription)或TEXT(Lyricist/Textwriter)或TOLY(Originallyricist(s)/textwriter(s))等帧中获取歌词数据。第二种途径,从与歌曲文件对应的歌词文件(例如LRC文件)中本文档来自技高网...
歌曲数据处理方法及装置

【技术保护点】
一种歌曲数据处理方法,其特征在于,包括:获取选定歌曲所对应的歌词数据;读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息;根据识别的所述语言信息进行所述选定歌曲的分类处理。

【技术特征摘要】
1.一种歌曲数据处理方法,其特征在于,包括:获取选定歌曲所对应的歌词数据;读取所述歌词数据中的文字字符的统一码Unicode编码值,根据读取到的统一码Unicode编码值识别所述选定歌曲的语言信息;根据识别的所述语言信息进行所述选定歌曲的分类处理。2.根据权利要求1所述的方法,其特征在于,所述读取所述歌词数据中的文字字符的统一码Unicode编码值,根据所述读取到的统一码Unicode编码值识别所述选定歌曲的语言信息,包括:依序读取歌词数据中的文字字符的统一码Unicode编码值,根据读取到的文字字符的统一码Unicode编码值确定所读取的文字字符的语言类型,当所读取的文字字符的语言类型为其它语言类型,则终止所述歌词数据中的文字字符的统一码Unicode编码值的读取,所述其它语言类型是区别于英文语言、中文语言、日文语言、韩文语言的语言类型;根据确定出的文字字符的语言类型生成所述选定歌曲的语言信息。3.根据权利要求1所述的方法,其特征在于,所述读取所述歌词数据中的文字字符的统一码Unicode编码值,根据所述读取到的统一码Unicode编码值识别所述选定歌曲的语言信息,包括:依序读取歌词数据中的文字字符的统一码Unicode编码值;根据读取到的文字字符的统一码Unicode编码值确定所读取的文字字符的语言类型;当所读取的文字字符的语言类型为英文语言时,继续进行本轮顺序的读取,直至读取到的文字字符对应的语言类型为其它语言类型,或直至所述歌词数据中的所有文字字符对应的统一码Unicode编码值读取完毕,所述其它语言类型是区别于英文语言、中文语言、日文语言、韩文语言的语言类型;当歌词数据中的所有文字字符对应的统一码Unicode编码值都读取完毕,且所有文字字符的语言类型均为英文语言,则根据所有文字字符的语言类型生成所述选定歌曲的语言信息。4.根据权利要求1所述的方法,其特征在于,所述读取所述歌词数据中的文字字符的统一码Unicode编码值,根据所述读取到的统一码Unicode编码值识别所述选定歌曲的语言信息,包括:依序读取歌词数据中的文字字符的统一码Unicode编码值,当读取到的文字字符的统一编Unicode编码值是在中日韩统一表意符号的编码范围内时,则继续读取下一个文字字符的统一码Unicode编码值,直至所述歌词数据中的所有文字字符的统一码Unicode编码值读取完毕;根据中日韩统一表意符号的编码范围对应的语言类型,得到所述歌曲的语言信息为中文语言、日本语言和韩国语言三种语言中的其中一种;计算所述歌词数据中的所有文字字符中包含所述三种语言中至少一种语言的常用字符个数;根据所述至少一种语言的常用字符个数和所述歌词数据中包括的所有文字字符个数,计算出所述歌词数据中所述至少一种语言的常用字符概率;根据所述常用字符概率,识别所述歌曲的语言信息。5.根据权利要求1所述的方法,其特征在于,所述读取所述歌词数据中的文字字符的统一码Unicode编码值,根据所述读取到的统一码Unicode编码值识别所述选定歌曲的语言信息的步骤之前,所述方法还包括:根据时间戳剔除所述歌词数...

【专利技术属性】
技术研发人员:杨鹏
申请(专利权)人:青岛海信移动通信技术股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1