【技术实现步骤摘要】
【专利摘要】本专利技术公开了,包括以下步骤:S1、读入记录有会议语音的音频文件;S2、说话人分割:检测上述会议语音中的说话人改变点,将相邻两个改变点之间的语音样点作为一个语音段,从而将音频文件分成多个语音段;S3、语音段的距离比较及合并:比较上述语音段中最长语音段与第二长语音段之间的距离,根据该距离与门限的关系判断这两个语音段是不是最重要嘉宾的语音,再根据其他语音段(除了最长和第二长语音段之外的语音段)与上述两个语音段之间的距离,判断其他语音段是不是最重要嘉宾的语音,从而得到最重要嘉宾的所有语音段。本专利技术为会议语音的快速浏览、主题提取、说话人检索等奠定了基础。【专利说明】
本专利技术涉及语音信号处理和模式识别技术,尤其涉及。
技术介绍
最重要嘉宾是指在多人参与的会议中,发言权最高、在整个会议进程中处于主导地位的说话人,例如会议中的某个国家领导人、单位负责人、行业精英或权威人士。在经常召开的发布会、讨论会、演讲等会议中,一般都有一个最重要的嘉宾,他的语音是人们在浏览分析会议语音时最感兴趣的。最重要嘉宾是与会人员中的最主要发言人,他在整个会议中的说话时间一 ...
【技术保护点】
一种提取会议中最重要嘉宾语音的方法,其特征在于,包括如下步骤:S1、读入记录有会议语音的音频文件;S2、说话人分割:检测上述会议语音中的说话人改变点,将相邻两个改变点之间的语音样点作为一个语音段,将音频文件分成J个语音段,并将这J个语音段按时长从大到小的顺序编号得到排序后的语音段xj,1≤j≤J,x1和x2分别是最长和第二长的语音段,以此类推;S3、语音段的距离比较及合并:比较语音段x1与语音段x2的距离,根据该距离与门限的关系判断语音段x1与语音段x2是否都是最重要嘉宾的语音,再根据其他语音段xj与语音段x1和语音段x2的距离,判断其他语音段xj是不是最重要嘉宾的语音,从 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:李艳雄,金海,贺前华,王琴,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。