【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种具有说话人语音提取功能的会议记录器,包括主控模块、录音与放音模块、可移动存储模块、交互与显示模块和说话人语音处理模块,其中说话人语音处理模块包含说话人分割模块和说话人聚类模块。主控模块将会议语音流传输至说话人分割模块,说话人分割模块检测上述语音流中说话人改变点,根据这些改变点将语音流分成多个语音段;说话人聚类模块利用谱聚类算法对分割出来的语音段进行说话人聚类,把相同说话人的语音段按顺序拼接在一起,得到说话人个数以及各个说话人的语音。本专利技术的会议记录器及语音提取方法,可以从会议语音中自动提取出各个说话人的语音,功能全面且使用方便。【专利说明】
本专利技术涉及音频处理领域,特别涉及。
技术介绍
目前市场上的会议记录器只是具有简单的录音、回放、转存等功能,没有说话人语音内容分析与理解的功能。使用者在做作会议记录时,如果需要针对某一个特定的说话人讲话进行汇总与处理,必须听完整个录音,人工进行识别是否为同一说话人。为了节省时间,快进播放又会存在漏掉有用信息的风险。通过手工对语音数据进行标注和提取,对使用者来说,是极为不方便的。因此 ...
【技术保护点】
一种具有语音提取功能的会议记录器,包括主控模块、录音与放音模块、可移动存储模块、交互与显示模块,其特征在于,还包括说话人语音处理模块,说话人语音处理模块包含说话人分割模块和说话人聚类模块,其中说话人分割模块:主控模块将会议语音流传输至说话人分割模块,说话人分割模块检测上述会议语音流中说话人改变点,根据这些改变点将语音流分成多个语音段;说话人聚类模块,利用谱聚类算法对说话人分割模块分割出来的语音段进行说话人聚类,把相同说话人的语音段按顺序拼接在一起,得到说话人个数以及各个说话人的语音。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。