The invention belongs to the field of speech processing technology, and discloses a classification method and system of speech information. The method includes: establishing a semantic slot sequence library containing multiple semantic slot sequences, each of which corresponds to a group; acquiring the speech information to be classified; processing the speech information to be classified and obtaining the corresponding speech information to be classified. Class semantic slot sequence; when the semantic slot sequence library contains the semantic slot sequence matched with the semantic slot sequence to be classified, the speech information to be classified is divided into the groups of the matched semantic slot sequence. The method classifies the classified speech information by matching the sequence of semantic slots, and classifies the speech information by the sequence of semantic slots, so that the speech information with the same intention can be classified into the same category, which not only does not affect the accuracy of classification for subjective reasons, but also has higher speed than manual classification.
【技术实现步骤摘要】
一种语音信息的分类方法及系统
本专利技术属于语音处理
,特别涉及一种语音信息的分类方法及系统。
技术介绍
随着智能终端及网络技术的迅速发展,人们越来越习惯地使用智能终端完成各种需求。同时随着语音交互的互联网技术的逐渐兴起,语音交互技术已经被广泛地应用于各种智能终端产品中。在一些智能终端产品中,当接收到大量有用的语音信息后,经常需要对这些大量的语音信息进行存储,并进行分类处理,以便用户后续能快速准确地查找到所需的语音信息。目前,对语音信息的分类还是依靠人工进行,即依靠用户对每一个有用的语音信息进行分类,此种方式不仅工作效率较低,而且分类准确率不高。
技术实现思路
本专利技术的目的是提供一种语音信息的分类方法及系统,实现对语音信息进行快速准确的分类的目的。本专利技术提供的技术方案如下:一方面,提供一种语音信息的分类方法,包括:建立包含多个语义槽序列的语义槽序列库,每个所述语义槽序列分别对应一个分组;获取待分类语音信息;对所述待分类语音信息进行处理,得到所述待分类语音信息对应的待分类语义槽序列;当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时,将所述待 ...
【技术保护点】
1.一种语音信息的分类方法,其特征在于,包括:建立包含多个语义槽序列的语义槽序列库,每个所述语义槽序列分别对应一个分组;获取待分类语音信息;对所述待分类语音信息进行处理,得到所述待分类语音信息对应的待分类语义槽序列;当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时,将所述待分类语音信息划分到所述匹配的语义槽序列的分组中。
【技术特征摘要】
1.一种语音信息的分类方法,其特征在于,包括:建立包含多个语义槽序列的语义槽序列库,每个所述语义槽序列分别对应一个分组;获取待分类语音信息;对所述待分类语音信息进行处理,得到所述待分类语音信息对应的待分类语义槽序列;当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时,将所述待分类语音信息划分到所述匹配的语义槽序列的分组中。2.根据权利要求1所述的一种语音信息的分类方法,其特征在于,所述对所述待分类语音信息进行处理,得到所述待分类语音信息对应的待分类语义槽序列之后还包括:当所述语义槽序列库中不包含与所述待分类语义槽序列匹配的语义槽序列时,则将所述待分类语义槽序列存储在所述语义槽序列库中,并以所述待分类语义槽序列为标签建立所述待分类语义槽序列的分组。3.根据权利要求1或2所述的一种语音信息的分类方法,其特征在于,所述对所述待分类语音信息进行处理,得到所述待分类语音信息对应的待分类语义槽序列具体包括:建立音频库,所述音频库包括若干词语的音频及音频对应的语义;将所述待分类语音信息与所述音频库中的音频进行匹配,找出与所述待分类语音信息中的各个词语分别匹配的音频作为目标音频;根据所述目标音频的语义,生成目标音频对应的语义槽;将所述语义槽按照所述目标音频在所述待分类语音信息中的顺序生成语义槽序列。4.根据权利要求3所述的一种语音信息的分类方法,其特征在于,所述根据所述目标音频的语义,生成目标音频对应的语义槽具体包括:根据所述目标音频的语义,将语义相同或相近的目标音频合并生成一个语义槽;将其余的目标音频分别生成各自对应的语义槽。5.根据权利要求3所述的一种语音信息的分类方法,其特征在于,所述建立音频库,所述音频库包括若干词语各自对应的音频及音频对应的语义具体包括:收集大量语料信息,对所述语料信息进行分词处理,得到所述语料信息中包含的词语;获取所述词语对应的音频和对应的语义,并建立所述音频与所述语义之间的关系;根据所述词语对应的音频和音频对应的语义,建立所述音频库。6.一种语音信息的分类...
【专利技术属性】
技术研发人员:魏誉荧,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。