歌词文件生成、校对方法及装置制造方法及图纸

技术编号:8216114 阅读:199 留言:0更新日期:2013-01-17 17:36
本发明专利技术适用于终端技术领域,提供了一种歌词文件生成方法及装置,包括:在当前播放的音视频文件未关联歌词文件时,生成与当前播放的音视频文件关联的歌词空文件;记录所述音视频文件的每句歌词的开始播放时间;根据语音识别生成所述每句歌词的文本;将所述每句歌词的所述开始播放时间和所述文本关联后保存进所述歌词空文件,直至所述音视频文件播放结束,以生成所述音视频文件的歌词文件。在本发明专利技术中,当音视频文件无关联的歌词文件时,通过语音识别技术自动生成歌词文本并获取到每句歌词的开始播放时间,将每句歌词的开始播放时间和该句歌词的文本写入特定格式的歌词文件,从而实现歌词文本的自动生成,提升了用户的视听体验。

【技术实现步骤摘要】

本专利技术属于终端
,尤其涉及歌词文件生成、校对方法及装置
技术介绍
随着人们对视听体验追求的日益提高,人们要求音视频播放器能够提供显示歌词的功能。现有的播放器大多支持从一种特定的歌词文件读 取歌词并显示,这给喜爱音乐的人群带来了很大的方便。但这种歌词文件必须从网络下载,当播放器处于无有效网络的受限环境中而无法获取到歌词文件时,这项功能便会失效,使用户的听歌体验大打折扣。另夕卜,即使播放器处于有效网络环境下,下载歌词文件也会产生额外的流量、资费,加重了用户的负担,不利于播放器的用户群扩大。
技术实现思路
本专利技术实施例的目的在于提供一种歌词文件生成方法及装置,旨在解决现有技术无法自动生成歌词的问题。本专利技术实施例是这样实现的,一种歌词文件生成方法,包括在当前播放的音视频文件未关联歌词文件时,生成与当前播放的音视频文件关联的歌词空文件;记录所述音视频文件的每句歌词的开始播放时间;根据语音识别生成所述每句歌词的文本;将所述每句歌词的所述开始播放的时间和所述文本关联后保存进所述歌词空文件,直至所述音视频文件播放结束,以生成所述音视频文件的歌词文件。本专利技术实施例的另一目的在于提供一种歌词文件生成装置,包括生成单元,用于在当前播放的音视频文件未关联歌词文件时,生成与当前播放的音视频文件关联的歌词空文件;第一记录单元,用于记录所述音视频文件的每句歌词的开始播放时间;第一语音识别单元,用于根据语音识别生成所述每句歌词的文本;保存单元,用于将所述每句歌词的所述开始播放的时间和所述文本关联后保存进所述歌词空文件,直至所述音视频文件播放结束,以生成所述音视频文件的歌词文件。在本专利技术实施例中,当音视频文件无关联的歌词文件时,通过语音识别技术自动生成歌词文本并获取到每句歌词的开始播放时间,将每句歌词的开始播放时间和该句歌词的文本写入特定格式的歌词文件,从而实现歌词文本的自动生成,提升了用户的视听体验。本专利技术实施例的另一目的在于提供一种歌词文件校对方法,包括载入当前播放的音视频文件关联的歌词文件;记录所述音视频文件每句歌词的开始播放时间;根据语音识别生成所述每句歌词的文本;对于所述每句歌词,当判断出所述记录的所述开始播放时间和所述歌词文件中的开始播放时间不同,或者判断出所述记录的所述文本与所述歌词文件中的文本不同,修改所述歌词文件。本专利技术实施例的另一目的在于提供一种歌词文件校对装置,包括载入单元,用于载入当前播放的音视频文件关联的歌词文件;第二记录单元,用于记录所述音视频文件每句歌词的开始播放时间;第二语音识别单元,用于根据语音识别生成所述每句歌词的文本;修改单元,用于对于所述每句歌词,当判断出所述记录的所述开始播放时间和所述歌词文件中的开始播放时间不同,或者判断出所述记录的所述文本与所述歌词文件中的文本不同,修改所述歌词文件。 在本专利技术实施例中,当音视频文件关联的歌词文件出错时,通过语音识别技术自动生成正确的歌词文本并获取到每句歌词正确的开始播放时间,以对歌词文件进行修改,从而实现歌词文本的自动校对,提升了用户的视听体验。附图说明图I是本专利技术实施例提供的歌词生成方法的实现流程图;图2是本专利技术实施例提供的歌词生成装置的结构框图;图3是本专利技术实施例提供的歌词校正方法的实现流程图;图4是本专利技术实施例提供的歌词校正装置的结构框图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在本专利技术实施例中,当音视频文件无关联的歌词文件时,通过语音识别技术自动生成歌词文本并获取到每句歌词的开始播放时间,将每句歌词的开始播放时间和该句歌词的文本写入特定格式的歌词文件,从而实现歌词文本的自动生成,提升了用户的视听体验。图I示出了本专利技术实施例提供的歌词生成方法的实现流程,详述如下在步骤SlOl中,在当前播放的音视频文件未关联歌词文件时,生成与当前播放的音视频文件关联的歌词空文件。在本实施例中,步骤SlOl之前首先判断当前播放的音视频文件是否有关联的歌词文件,其中,关联是指播放器等进行音视频播放的应用程序可以根据音视频文件的文件信息以某种特定的规则查找或优选出唯一的歌词文件,例如,根据音视频文件的文件名,查找出相同文件名的.Iyc格式的歌词文件。若当前播放的音视频文件关联了歌词文件,则载入其关联的歌词文件,若没有关联歌词文件,则执行步骤S101,生成与当前播放的音视频文件关联的歌词空文件,其中,在本步骤中生成的歌词空文件为初始歌词文件,即该歌词文件中还不包括其关联的音视频文件的歌词相关信息。具体地,生成与当前音视频文件关联的歌词空文件,可以首先通过获取音视频文件的文件信息,这些信息包括但不限于音视频文件的文件名、音视频文件的存储位置、音乐家信息等,以生成与该音视频文件的文件名命名的歌词文件,从而通过相同的文件名建立起该音视频文件与其歌词文件的关联关系。进一步地,还可以在预设的存储位置或者该音视频文件的存储位置生成该歌词文件,由此,可以使播放器在下一次播放此音视频文件时能够查找到此歌词文件,从而不必再一次启动自动生成歌词的过程,节省了时间,提升了用户体验。在步骤S102中,记录当前播放的音视频文件每句歌词的开始播放时间。启动语音识别功能,监听音视频文件的声音波形。具体地,根据波形的振荡图形,可以辨识出音视频文件音频分量中每一句歌词的开始,将此时间点以预设格式记录下来,例如,其中,中mm表示此时间点的分钟数,ss表示此时间点的秒数,数值mm和ss不足10的以O填充其十位。在步骤S103中,根据语音识别生成每句歌词的文本。除了上述步骤S102中所述的辨识每句歌词的开始之外,语音识别技术还能够辨 识出每句歌词的内容,即将音视频中所蕴含的声音信息转化成语言文本。当前,语音识别技术是一门相对成熟的技术,其在便携式终端或计算机等终端设备上的应用已十分普遍,包括苹果的Siri语音助手,微软的SpeechSDK,IBM的ViaVoice等等,在此不再赘述。通过对识别算法做相应的微调,语音识别技术可以用来辨识具有不同特点的声音信息。在本实施例中,以歌曲的旋律为参数对识别算法做相应的微调,即可准确地辨识出歌词信息。优选地,在对歌词进行语音识别时,可以在数据库中存储常用的词语或者成语的声音波形,通过将音视频文件的波形与存储的小型进行匹配,能够更加准确地识别出歌词的文本。在步骤S104中,将每句歌词的开始播放时间与文本关联后保存进歌词空文件,直至音视频文件播放结束,以生成该音视频文件的歌词文件。在音视频文件播放的过程中,每捕捉到一句歌词,即获取到一句歌词的开始时间后,将S102中所记录的时间与S103中所记录的歌词文本做关联,然后向步骤SlOl中所生成的歌词文件中写入关联后时间歌词信息。持续上述操作直至音视频文件播放结束。时间信息与歌词文本的关联方式可因实施例的不同而异。在本实施例中,将时间信息与歌词文本以英文半角空格字符相连接,时间信息在前,歌词文本在后。对于写入操作,每写完一句歌词会新起一行,在新行的行首执行下一句的写入操作,直至音视频文件播放完毕。当音视频文件播放结束后,将其歌词文件整体保存。通过上述步骤,在音视频文件播放的过程本文档来自技高网...

【技术保护点】
一种歌词文件生成方法,其特征在于,包括:在当前播放的音视频文件未关联歌词文件时,生成与当前播放的音视频文件关联的歌词空文件;记录所述音视频文件的每句歌词的开始播放时间;根据语音识别生成所述每句歌词的文本;将所述每句歌词的所述开始播放时间和所述文本关联后保存进所述歌词空文件,直至所述音视频文件播放结束,以生成所述音视频文件的歌词文件。

【技术特征摘要】

【专利技术属性】
技术研发人员:曾元清李博宁
申请(专利权)人:广东欧珀移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1