实现语音自动分类的方法及系统技术方案

技术编号:13059438 阅读:37 留言:0更新日期:2016-03-23 23:51
本发明专利技术公开了一种实现语音自动分类的方法及系统,该方法包括:接收待分类语音数据;对待分类语音数据进行语音识别,得到识别文本;对所述待分类语音数据进行声学分析,得到声学上的分类特征;对所述识别文本进行内容分析,得到内容上的分类特征;利用所述声学上的分类特征、内容上的分类特征、以及预先构建的语音分类模型对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。利用本发明专利技术,可以减少人工工作量,并提高语音数据分类的准确率。

【技术实现步骤摘要】

本专利技术涉及语音信号处理领域,具体涉及一种实现语音自动分类的方法及系统
技术介绍
随着语音技术的发展,自动语音识别技术已经被广泛地应用于生活的各个领域, 出现了各种实用的语音识别系统,如语音转写系统,然而由于应用需求的不同,用于语音识 别的语音数据的类型也是多种多样,如多人发言的会议录音、采访录音等。对于不同类型的 语音数据,识别文本的内容差异较大,识别文本的展示形式也有多种,如对话类型的语音数 据识别结果为"今天中午吃什么,牛肉面怎么样?要排很久的队吧,可以提前去排队了"。如 果以这种形式展示给用户,会对用户的理解造成很大的困扰。但是,如果预先知道待识别语 音数据的类型为对话类型,则可以将识别文本按照对话的形式展示给用户,如展示结果为: 说话人A: "今天中午吃什么,牛肉面怎么样?"说话人B"要排很久的队吧,可以提前去排除了"。 这样可以方便用户清晰地阅读识别文本,提高识别文本的可懂度。 现有的语音分类方法一般是通过人工听语音数据给出相应的语音数据类型,当语 音数据较多时,人工的工作量较大,同时给出的结果也存在主观性。因此,如何准确地得到 语音数据的类型,对于语音识别的应用具有较重意义。
技术实现思路
本专利技术提供一种实现语音自动分类的方法及系统,以减少人工工作量,并提高语 音数据分类的准确率。 为此,本专利技术提供如下技术方案: 一种实现语音自动分类的方法,包括:接收待分类语音数据;对所述待分类语音数据进行语音识别,得到识别文本; 对所述待分类语音数据进行声学分析,得到声学上的分类特征; 对所述识别文本进行内容分析,得到内容上的分类特征; 利用所述声学上的分类特征、内容上的分类特征、以及预先构建的语音分类模型 对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。 优选地,对所述待分类语音数据进行声学分析包括: 利用所述待分类语音数据本身对所述待分类语音数据进行声学分析;和/或 利用语音识别过程中得到的声学相关数据对所述待分类语音数据进行声学分析。 优选地,所述利用所述待分类语音数据本身对所述待分类语音数据进行声学分析 包括: 根据所有有效语音的长度与待分类语音数据长度的比值,得到所述待分类语音数 据的有效语音占比;和/或 对所述待分类语音数据进行说话人分离,得到所述待分类语音数据的说话人总 数。 优选地,所述利用语音识别过程中得到的声学相关数据对所述待分类语音数据进 行声学分析包括: 根据语音识别过程中解码得到的词后验概率和音素后验概率,计算得到所述待分 类语音数据的置信度。优选地,所述对所述识别文本进行内容分析,得到内容上的分类特征包括: 对所述识别文本进行预处理,所述预处理包括:文本过滤、文本顺滑、数字规整、添 加标点;计算预处理后的识别文本中各语句的置信度;提取置信度大于设定阈值的各语句的内容上的分类特征,所述内容上的分类特征 包括:情感极性以及以下任意一种或多种特征:词面特征、词性特征、标点特征、语气词总 数。优选地,所述方法还包括,按以下方式构建所述语音分类模型:收集多种类型的语音数据,并标注各语音数据的类型;提取各语音数据的分类特征及标注特征,所述分类特征包括:声学上的分类特征 和内容上的分类特征;根据提取的各语音数据的分类特征及标注特征训练语音分类模型。 优选地,所述方法还包括:按照所述待分类语音数据所属类型对所述识别文本进行展示。 一种实现语音自动分类的系统,包括:接收模块,用于接收待分类语音数据;语音识别模块,用于对待分类语音数据进行语音识别,得到识别文本;声学分析模块,用于对所述待分类语音数据进行声学分析,得到声学上的分类特 征;内容分析模块,用于对所述识别文本进行内容分析,得到内容上的分类特征;分类模块,用于利用所述声学上的分类特征、内容上的分类特征、以及预先构建的 语音分类模型对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。优选地,所述声学分析模块包括:第一声学分析模块,用于利用所述待分类语音数据本身对所述待分类语音数据进 行声学分析;和/或 第二声学分析模块,用于利用语音识别过程中得到的声学相关数据对所述待分类 语音数据进行声学分析。优选地,所述第一声学分析模块包括:有效语音占比计算单元,用于根据所有有效语音的长度与待分类语音数据长度的 比值,得到所述待分类语音数据的有效语音占比;和/或说话人分离单元,用于对所述待分类语音数据进行说话人分离,得到所述待分类 语音数据的说话人总数。优选地,所述第二声学分析模块,具体用于根据语音识别过程中解码得到的词后 验概率和音素后验概率,计算得到所述待分类语音数据的置信度。优选地,所述内容分析模块包括: 预处理单元,用于对所述识别文本进行预处理,所述预处理包括:文本过滤、文本 顺滑、数字规整、添加标点;置信度计算单元,用于计算预处理后的识别文本中各语句的置信度; 特征提取单元,用于提取置信度大于设定阈值的各语句的内容上的分类特征,所 述内容上的分类特征包括:情感极性以及以下任意一种或多种特征:词面特征、词性特征、 标点特征、语气词总数。 优选地,所述系统还包括模型训练模块,所述模型训练模块包括: 数据收集单元,用于收集多种类型的语音数据;提取单元,用于提取各语音数据的分类特征及标注特征,所述分类特征包括:声学 上的分类特征和内容上的分类特征,所述标注特征用于指示各语音数据的类型;训练单元,用于根据提取的各语音数据的分类特征及标注特征训练语音分类模 型。 优选地,所述系统还包括: 展示模块,用于按照所述待分类语音数据所属类型对所述识别文本进行展示。 本专利技术实施例提供的实现语音自动分类的方法及系统,对接收的待分类语音数据 进行语音识别,得到识别文本;然后分别从待分类语音数据的声学上及内容上提取分类特 征;最后利用提取的分类特征及预先构建的语音分类模型对待分类语音数据进行分类,得 到待分类语音数据的类别。本专利技术方案不仅实现了语音数据的自动分类,大大减少了人工 工作量;而且,由于分别从待分类语音数据的声学上及内容上描述待分类语音数据,从而可 以全面且准确地提取语音数据包含的信息,有效提高了语音数据分类的准确率。【附图说明】 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种实现语音自动分类的方法,其特征在于,包括:接收待分类语音数据;对所述待分类语音数据进行语音识别,得到识别文本;对所述待分类语音数据进行声学分析,得到声学上的分类特征;对所述识别文本进行内容分析,得到内容上的分类特征;利用所述声学上的分类特征、内容上的分类特征、以及预先构建的语音分类模型对所述待分类语音数据进行分类,得到所述待分类语音数据所属类型。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡尹潘青华高建清胡国平胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1