一种音频内容查找及可视化播放方法技术

技术编号:19429831 阅读:27 留言:0更新日期:2018-11-14 11:30
本发明专利技术涉及电子设备技术领域,尤其涉及一种音频内容查找及可视化播放方法。本发明专利技术中的一种音频内容查找及可视化播放方法,包括音频解码与人声提取器、文本转换与定位器、AI内容校验、显示屏幕、音频输出设备;所述音频解码与人声提取器提取人声,所述文本转换器将提取的人声内容转换成文本内容,同时通过文本转换与定位器将文本内容与对应的音频内容时间相关联,当用户选择或输入任意的文本内容,定位器可以定位出该内容在音频中的播放时间位置。

【技术实现步骤摘要】
一种音频内容查找及可视化播放方法
本专利技术涉及电子设备
,尤其涉及一种音频内容查找及可视化播放方法。
技术介绍
现有技术中由于音频的内容不是以文本的方式展示在电脑中,用户无法知道内容位于音频中的何处,也不方便查找音频内容是否包含指定的内容。用户想单次播放(点读)或循环播放(复读)指定的内容时,用户需要仔细的倾听音频内容同时关注播放进度,才能确定所需内容在音频中的位置或区间,然后单次播放(点读)或循环播放(复读)所需的内容,非常不便利。本专利技术通过专有的解码技术结合AI(人工智能)算法,将音频内容提取出人声,并将人声转换成文本,同时建立内容和播放进度的关联,然后将文本显示在屏幕上,用户只需在触摸屏上滑动选择或通过鼠标在屏幕选择所需的文本内容,或者输入文本内容进行搜索,系统就可以找到正确的播放时刻进行点读或复读播放,极大的提高用户的操作效率和使用效果。
技术实现思路
本专利技术的目的是提供一种音频内容查找及可视化播放方法,来解决
技术介绍
中用户需要仔细的倾听音频内容同时关注播放进度,才能确定所需内容在音频中的位置或区间,然后单次播放(点读)或循环播放(复读)所需的内容,非常不便利的问题。本专利技术所采用的技术方案为:一种音频内容查找及可视化播放方法,包括音频解码与人声提取器、文本转换与定位器、AI内容校验、显示屏幕、音频输出设备;所述音频解码与人声提取器提取人声,所述文本转换器将提取的人声内容转换成文本内容,同时通过文本转换与定位器将文本内容与对应的音频内容时间相关联,当用户选择或输入任意的文本内容,定位器可以定位出该内容在音频中的播放时间位置。作为本专利技术一种实施例,所述步骤为:1)通过解码器读取音频文件,将二进制数据转换成波形数据;2)对波形数据进行频域转换,分离出人声频域数据;3)将人声频域数据转换成时域数据;4)通过语音识别技术,将人声时域数据转换成文字,转换的过程中同时记录每个字或单词的时间坐标;5)使用人工智能(AI)算法对步骤4的文字进行智能校正,确保转换的文字信息准确,通过上述步骤,将音频内容转换成为文字内容并建立了时间索引,就可以方便的进行查找和定位,音频在播放前经过本方法这样的预处理,在播放前就可以获知音频的文字内容,将内容展示在屏幕上,即可实现可视化的播放。本专利技术的有益效果:1、音频内容可视化,将音频的人声内容直观的展示在屏幕上;2、在音频中查找文本内容与位置;用户进行点读或复读时非常高效,用户只需在屏幕选择想要点读或复读的内容即可,无需用户人工确定内容在音频中的位置或区间。附图说明图1为本专利技术系统操作流程图。图2为本
技术实现思路
播放流程图。图3为本专利技术一种实施例操作图。具体实施方式以下结合附图对本专利技术作进一步说明:本专利技术中的一种音频内容查找及可视化播放方法,包括音频文件、解码与定位器、AI内容校验、屏幕显示;本专利技术中所述音频解码与人声提取器提取人声,所述文本转换器将提取的人声内容转换成文本内容,同时通过文本转换与定位器将文本内容与对应的音频内容时间相关联,当用户选择或输入任意的文本内容,定位器可以定位出该内容在音频中的播放时间位置。作为本专利技术具体实施方式:音频内容查找与可视化播放方法包含如下步骤:1)通过解码器读取音频文件,将二进制数据转换成pcm波形数据;2)对波形数据进行频域转换,分离出人声频域数据;3)将人声频域数据转换成时域数据;4)通过语音识别技术,将人声时域数据转换成文字,转换的过程中同时记录每个字或单词的时间坐标;假设音频内容为一种富强的价值观,识别的片段如下:<content><text>富</text><time>[00:01.00]</time></content><content><text>裕</text><time>[00:02.00]</time></content>5)使用人工智能(AI)算法对步骤4的文字进行智能校正,确保转换的文字信息准确,例如将原文识别出的“裕”改为“强”,得到最终结果如下:<content><text>富</text><time>[00:01.00]</time></content><content><text>强</text><time>[00:02.00]</time></content>6)通过上述步骤,将音频内容转换成为文字内容并建立了时间索引,就可以方便的进行查找和定位,音频在播放前经过本方法这样的预处理,在播放前就可以获知音频的文字内容,将内容展示在屏幕上,即可实现可视化的播放。虽然本专利技术已以较佳实施例公开如上,但其并非用以限定本专利技术,任何熟悉此技术的人,在不脱离本专利技术的精神和范围内,都可做各种的改动与修饰,因此本专利技术的保护范围应该以权利要求书所界定的为准。本文档来自技高网
...

【技术保护点】
1.一种音频内容查找及可视化播放方法,其特征在于:包括音频解码与人声提取器、文本转换与定位器、AI内容校验、显示屏幕、音频输出设备;所述音频解码与人声提取器提取人声,所述文本转换器将提取的人声内容转换成文本内容,同时通过文本转换与定位器将文本内容与对应的音频内容时间相关联,当用户选择或输入任意的文本内容,定位器可以定位出该内容在音频中的播放时间位置。

【技术特征摘要】
1.一种音频内容查找及可视化播放方法,其特征在于:包括音频解码与人声提取器、文本转换与定位器、AI内容校验、显示屏幕、音频输出设备;所述音频解码与人声提取器提取人声,所述文本转换器将提取的人声内容转换成文本内容,同时通过文本转换与定位器将文本内容与对应的音频内容时间相关联,当用户选择或输入任意的文本内容,定位器可以定位出该内容在音频中的播放时间位置。2.根据权利要求1所述的一种音频内容查找及可视化播放方法,其特征在于:所述具体步骤为:1)通过解码器读取音频文件,将二进制数据转换成波形数据;2...

【专利技术属性】
技术研发人员:陈南云
申请(专利权)人:深圳市云凌泰泽网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1