音频信号字幕匹配方法及装置制造方法及图纸

技术编号:15522948 阅读:196 留言:0更新日期:2017-06-04 11:50
本发明专利技术公开一种音频信号字幕匹配方法,所述音频信号字幕匹配方法包括以下步骤:当终端接收到待播放数据,获取待播放数据中的音频信号;对获取的音频信号进行识别,以得到音频信号中的语音单元;基于预设字幕库,将各个语音单元转换为对应的默认语言字符;将所述默认语言字符排列组合为默认语言字幕,并将默认语言字幕与待播放数据同步显示。本发明专利技术的技术方案根据与语言单元对应的预设字幕库,通过识别音频信号中所携带的语音单元,将识别的语音单元实时转换为字幕。实现了音频信号直接转换成对应的默认语言字幕,使得音频信号与字幕的匹配不依赖字幕服务器,字幕的转换更智能化。本发明专利技术还公开了一种音频信号字幕匹配装置。

Method and device for matching captions of audio signals

The invention discloses a method for matching the audio signal of the audio signal subtitles, subtitle matching method comprises the following steps: when the terminal receives the broadcast data, obtain the audio signal playing data; identification of audio signal acquisition, in order to get the speech unit in the audio signal; default subtitle Library Based on the speech. The unit converted to the corresponding default language characters; the default language character combinations as the default language subtitles, and the default language subtitles synchronized with the data to be broadcast. According to the preset caption library corresponding to the language unit, the technical scheme of the invention converts the recognized speech unit into subtitles in real time by identifying the phonetic units carried in the audio signals. The audio signals are directly converted into the corresponding default language subtitles, so that the matching of the audio signals and subtitles does not depend on the subtitles server, and the conversion of subtitles is more intelligent. The invention also discloses an audio signal caption matching device.

【技术实现步骤摘要】
音频信号字幕匹配方法及装置
本专利技术主要涉及字幕匹配
,具体地说,尤其涉及一种音频信号字幕匹配方法及其装置。
技术介绍
多媒体是组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体,其中最常见的是视频、音频以及字幕三者的组合,三者同步传输实现显示播放。音频信号与字幕信号通过多路进行传输,然后再通过音字同步的方法进行显示。目前字幕的显示技术依赖字幕服务器的资源,需要在节目编辑的后期进行字幕制作,生成字幕资源后上传到对应的字幕服务器上。如果节目没有制作字幕资源,则在播放音频内容时是不能显示对应的字幕信息,这样就表现出了字幕与音频资源匹配的局限性。同时多媒体的内容也会涉及到不同语言的问题,不能满足观众的需求,字幕的显示智能化人性化的程度低。
技术实现思路
本专利技术的主要目的在于提供一种音频信号字幕匹配方法,旨在解决现有技术字幕显示依赖于字幕服务器,不能满足用户需求的问题。为实现上述目的,本专利技术提供一种音频信号字幕匹配方法,所述音频信号字幕匹配方法包括以下步骤:当终端接收到待播放数据,获取待播放数据中的音频信号;对获取的音频信号进行识别,以得到音频信号中的语音单元;基于预设字幕库,将各个语音单元转换为对应的默认语言字符;将所述默认语言字符排列组合为默认语言字幕,并将默认语言字幕与待播放数据同步显示。优选地,所述音频信号字幕匹配方法还包括:当接收到字幕设置指令时,根据字幕设置指令对字幕的显示参数进行调节,其中字幕的显示参数包括字幕显示时间和字幕显示语言。优选地,所述当接收到字幕设置指令时,根据字幕设置指令对字幕的显示参数进行调节,其中字幕的显示参数包括字幕显示时间和字幕显示语言的步骤包括:根据字幕显示时间,判断待播放数据是否播放到字幕显示时间;在待播放数据播放到字幕显示时间时,将与待播放数据对应的默认语言字幕转换为字幕显示语言对应的目标语言字幕。优选地,所述将与待播放数据对应的默认语言字幕转换为字幕显示语言对应的目标语言字幕的步骤之后还包括:判断待播放数据是否来源于终端的本地文件,若待播放数据来源于终端的本地文件,则将转换的目标语言字幕保存至与待播放数据对应的本地文件,若待播放数据不是来源于终端的本地文件,则输出将目标语言字幕下载至本地文件保存的下载提示信息。优选地,所述当终端接收到待播放数据,获取待播放数据中的音频信号的步骤之前包括:检测预设字幕库是否更新,若预设字幕库没有更新,则输出更新预设字幕库的更新提示信息。此外,为实现上述目的,本专利技术还提出一种音频信号字幕匹配装置,所述音频信号字幕匹配装置包括:获取模块,用于当终端接收到待播放数据,获取待播放数据中的音频信号;识别模块,用于对获取的音频信号进行识别,以得到音频信号中的语音单元;转换模块,用于基于预设字幕库,将各个语音单元转换为对应的默认语言字符;显示模块,将所述默认语言字符排列组合为默认语言字幕,并将默认语言字幕与待播放数据同步显示。优选地,所述音频信号字幕匹配装置还包括:调节模块,用于当接收到字幕设置指令时,根据字幕设置指令对字幕的显示参数进行调节,其中字幕的显示参数包括字幕显示时间和字幕显示语言。优选地,所述调节模块包括:第一判断单元,根据字幕显示时间,判断待播放数据是否播放到字幕显示时间;控制单元,用于在待播放数据播放到字幕显示时间时,将与待播放数据对应的默认语言字幕转换为字幕显示语言对应的目标语言字幕。优选地,所述调节模块还包括:第二判断单元,用于判断待播放数据是否来源于终端的本地文件,若待播放数据来源于终端的本地文件,则将转换的目标语言字幕保存至与待播放数据对应的本地文件,若待播放数据不是来源于终端的本地文件,则输出将目标语言字幕下载至本地文件保存的下载提示信息。优选地,所述音频信号字幕匹配装置还包括:检测模块,用于检测预设字幕库是否更新,若预设字幕库没有更新,则输出更新预设字幕库的更新提示信息。本专利技术提出的音频信号字幕匹配方法,设置有与语音单元对应的预设字幕库,通过识别待播放数据中音频信号的语音单元,将各个语言单元转换为与预设字幕库中对应的默认语言字符;并将所述默认语言字符排列组合为符合人的思维逻辑的默认语言字幕,此默认语言字幕即为与待播放数据中音频信号匹配的字幕。本专利技术的技术方案根据预设字幕库,将音频信号实时转换为默认语言字幕。实现了将音频信号直接转换成对应的默认语言字幕,使得音频信号与字幕的匹配不依赖字幕服务器,不需要通过字幕服务器传输字幕,节省了传输过程中的带宽,使音频信号与字幕的转换更智能化。附图说明图1是本专利技术的音频信号字幕匹配方法第一实施例的流程示意图;图2是本专利技术的音频信号字幕匹配方法第二实施例的流程示意图;图3是本专利技术的音频信号字幕匹配方法第三实施例的流程示意图;图4是本专利技术的音频信号字幕匹配方法第四实施例的流程示意图;图5是本专利技术的音频信号字幕匹配方法第五实施例的流程示意图;图6是本专利技术的音频信号字幕匹配装置第一实施例的功能模块示意图;图7是本专利技术的音频信号字幕匹配装置第二实施例的功能模块示意图;图8是本专利技术的音频信号字幕匹配装置第三实施例的调节模块的细化功能模块示意图;图9是本专利技术的音频信号字幕匹配装置第四实施例的调节模块的细化功能模块示意图;图10是本专利技术的音频信号字幕匹配装置第五实施例的功能模块示意图;图11是本专利技术的音频信号字幕匹配方法及装置数据传输场景示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提出一种音频信号字幕匹配方法,请参照图1,在第一实施例中,该音频信号字幕匹配方法包括以下步骤:步骤S10,当终端接收到待播放数据,获取待播放数据中的音频信号;本专利技术的实施例中,所述终端可以是电视、家庭影院等家用电器,也可以是手机、平板等移动终端。待播放数据可以是来源于诸如优酷、爱奇艺等各个网站服务器,或央视、卫视等各个电视台的服务器以及中国移动、中国联通等各个移动运营商的多媒体数据或者音频数据;也可以是下载到手机、电视、MP3等终端的多媒体数据或者音频数据;或者是用户录入的音频数据。当待播放数据是包括视频和音频的多媒体数据时,从多媒体数据中获取音频信号。当待播放数据时音频数据时,则从音频数据中获取音频信号。步骤S20,对获取的音频信号进行识别,以得到音频信号中的语音单元;进一步地,在获取音频信号后,对获取的音频信号进行识别,以得到音频信号中的语音单元。具体地,对音频信号进行分析,将音频信号划分为多个帧。若干帧语音对应一个状态,每三个状态组合成一个音素,若干个音素组成一个单词,此可组成一个单词的若干个音素即为一个语音单元。步骤S30,基于预设字幕库,将各个语音单元转换为对应的默认语言字符;本专利技术的方案中,设置有与语音单元对应的预设字幕库,预设字幕库可从远程服务器获取也可为存储在本地的编码,预设字幕库中包含大量的字符。且根据不同的地域,预设字幕库设置有默认语言,在中国内地,预设字幕库默认语言为汉语,中国香港则为粤语,具体可根据地域进行设置。基于此预设字幕库,将各个语音单元转换为与此语音单元对应的字符,其中此字符的语言为预设字幕库的默认语言。步骤S40,将所述默认语言字符排列组合为默认语言字幕本文档来自技高网...
音频信号字幕匹配方法及装置

【技术保护点】
一种音频信号字幕匹配方法,其特征在于,所述音频信号字幕匹配方法包括以下步骤:当终端接收到待播放数据,获取待播放数据中的音频信号;对获取的音频信号进行识别,以得到音频信号中的语音单元;基于预设字幕库,将各个语音单元转换为对应的默认语言字符;将所述默认语言字符排列组合为默认语言字幕,并将默认语言字幕与待播放数据同步显示。

【技术特征摘要】
1.一种音频信号字幕匹配方法,其特征在于,所述音频信号字幕匹配方法包括以下步骤:当终端接收到待播放数据,获取待播放数据中的音频信号;对获取的音频信号进行识别,以得到音频信号中的语音单元;基于预设字幕库,将各个语音单元转换为对应的默认语言字符;将所述默认语言字符排列组合为默认语言字幕,并将默认语言字幕与待播放数据同步显示。2.如权利要求1所述的音频信号字幕匹配方法,其特征在于,所述音频信号字幕匹配方法还包括:当接收到字幕设置指令时,根据字幕设置指令对字幕的显示参数进行调节,其中字幕的显示参数包括字幕显示时间和字幕显示语言。3.如权利要求2所述的音频信号字幕匹配方法,其特征在于,所述当接收到字幕设置指令时,根据字幕设置指令对字幕的显示参数进行调节,其中字幕的显示参数包括字幕显示时间和字幕显示语言的步骤包括:根据字幕显示时间,判断待播放数据是否播放到字幕显示时间;在待播放数据播放到字幕显示时间时,将与待播放数据对应的默认语言字幕转换为字幕显示语言对应的目标语言字幕。4.如权利要求3所述的音频信号字幕匹配方法,其特征在于,所述将与待播放数据对应的默认语言字幕转换为字幕显示语言对应的目标语言字幕的步骤之后还包括:判断待播放数据是否来源于终端的本地文件,若待播放数据来源于终端的本地文件,则将转换的目标语言字幕保存至与待播放数据对应的本地文件,若待播放数据不是来源于终端的本地文件,则输出将目标语言字幕下载至本地文件保存的下载提示信息。5.如权利要求1-4任一项所述的音频信号字幕匹配方法,其特征在于,所述当终端接收到待播放数据,获取待播放数据中的音频信号的步骤之前包括:检测预设字幕库是否更新,若预设字...

【专利技术属性】
技术研发人员:吕涧池
申请(专利权)人:深圳TCL数字技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1