语音处理系统及语音处理方法技术方案

技术编号:8834986 阅读:143 留言:0更新日期:2013-06-22 20:56
一种语音处理方法包括:从一预存的语音文件中提取各发言者的语音特征;响应用户的操作,在该语音文件中有与该选择的声纹模型匹配的发言者语音时,获取与该声纹模型匹配的发言者语音,按照在该语音文件的时间先后顺序组成一单一音频文件,复制该获取的单一音频文件,将该复制的单一音频文件转换成对应的文本;将该文本中的词语与对应的时间相关联;响应用户操作,当该被转换的文本中存在输入的关键字时,获取该文字中的关键字所关联的时间,根据该获取的时间确定单一音频文件中该关键字对应语音的播放时间点,并控制一音频播放装置从该播放时间点开始播放该单一音频文件。本发明专利技术还提供一种语音处理系统,方便查找发言者针对某话题的发言内容。

【技术实现步骤摘要】

本专利技术涉及,特别涉及一种音视频拍摄过程中获取的语音的。
技术介绍
目前,随着多媒体技术的发展,人们可以随时进行音频、视频的拍摄以备后续作为资料库或留念。例如,在开会时,一般采用摄影机拍摄或者录音的方式记录会议的过程。但在会后,当用户查询会议中某个发言者针对某话题所说的话时,需要将所拍摄的整个会议过程从头开始播放以寻找该发言者针对该话题的发言内容,如此浪费时间。
技术实现思路
鉴于以上内容,有必要提供一种,方便查找发言者针对某话题的发言内容。一种语音处理系统,该语音处理系统包括:一特征获取模块,用于从一预存的语音文件中提取各发言者的语音特征,其中,该语音文件中包括有各发言者的发言;一语音识别模块,用于响应用户选择一预存的声纹模型的操作,判断该语音文件中是否有与该选择的声纹模型匹配的发言者语音;一语音转换模块,用于在该语音文件中有与该声纹模型匹配的发言者语音时,获取与该声纹模型匹配的发言者语音,并将该些发言者语音提取出来,按照在该语音文件的时间先后顺序组成一单一音频文件,复制该单一音频文件,并将该复制的单一音频文件转换成文本,其中,该文本包括词语;一关联模块,用于根据单一音频文件中各个本文档来自技高网...

【技术保护点】
一种语音处理系统,其特征在于,该语音处理系统包括:一特征获取模块,用于从一预存的语音文件中提取各发言者的语音特征,其中,该语音文件中包括有各发言者的发言;一语音识别模块,用于响应用户选择一预存的声纹模型的操作,判断该语音文件中是否有与该选择的声纹模型匹配的发言者语音;一语音转换模块,用于在该语音文件中有与该声纹模型匹配的发言者语音时,获取与该声纹模型匹配的发言者语音,并将该些发言者语音提取出来,按照在该语音文件的时间先后顺序组成一单一音频文件,复制该单一音频文件,并将该复制的单一音频文件转换成文本,其中,该文本包括词语;一关联模块,用于根据单一音频文件中各个词语对应的语音的播放时间点,将语音转...

【技术特征摘要】
1.一种语音处理系统,其特征在于,该语音处理系统包括: 一特征获取模块,用于从一预存的语音文件中提取各发言者的语音特征,其中,该语音文件中包括有各发言者的发言; 一语音识别模块,用于响应用户选择一预存的声纹模型的操作,判断该语音文件中是否有与该选择的声纹模型匹配的发言者语音; 一语音转换模块,用于在该语音文件中有与该声纹模型匹配的发言者语音时,获取与该声纹模型匹配的发言者语音,并将该些发言者语音提取出来,按照在该语音文件的时间先后顺序组成一单一音频文件,复制该单一音频文件,并将该复制的单一音频文件转换成文本,其中,该文本包括词语; 一关联模块,用于根据单一音频文件 中各个词语对应的语音的播放时间点,将语音转换模块转换成的文本中的词语与对应的播放时间点相关联; 一查询模块,用于响应用户输入的关键字的操作,判断该被转换的文本中是否存在该输入的关键字;及 一执行模块,用于当该被转换的文本中存在该输入的关键字时,获取该转换的文本中的关键字所关联的播放时间点,根据该获取的播放时间点确定单一音频文件中该关键字对应语音的播放时间点,并控制一音频播放装置从该播放时间点开始播放该单一音频文件。2.如权利要求1所述的语音处理系统,其特征在于:该语音处理系统还包括一备注模块,该备注模块用于响应用户在播放单一音频文件时输入文字的操作,确定此时该单一音频文件的播放时间点,将该输入的文字转换成语音,并将该转换的语音插入在该单一音频文件中与该确定的时间点对应的位置中。3.如权利要求1所述的语音处...

【专利技术属性】
技术研发人员:林希
申请(专利权)人:富泰华工业深圳有限公司鸿海精密工业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利