The invention provides a voice data sentence recognition method and device and system. The method comprises: receiving the voice data to be identified; obtaining the voice data types of sentence recognition features, the sentence recognition features include at least one of the following: acoustic sentence recognition features, semantic class feature recognition according to the sentence recognition model; pre built and the types of sentence recognition features, identifying the voice data sentence type, the sentence recognition model based on voice data acquisition of samples of sentence recognition feature was constructed. This method can solve the limitations of identifying sentences according to the rules, expand the range of application and improve the accuracy of recognition.
【技术实现步骤摘要】
语音数据句类识别方法和装置及系统
本申请涉及自然语言处理
,尤其涉及一种语音数据句类识别方法和装置及系统。
技术介绍
语音数据的句类指按照语音数据中句子的语气,将句子划分的类型,如陈述句、祈使句、感叹句、一般疑问句及特殊疑问句等,不同句类的句子往往具有不同语义,单纯从文本语义上很难区分开,如在智能问答系统中,语音数据“我开通了几个增值服务”和“我开通了哪几个增值服务”,二者仅差一个字,但语义完全不同,答案也完全不同,通过句类识别后,得到这两句语音数据分别属于不同的句类,第一句的句类为数量类疑问句,第二句的句类为实体类疑问句。为了提高反馈给用户的答案的准确度,关键点之一是识别语音数据的句类。相关技术中,语音数据句类识别方法一般通过编写每种句类的规则,将待识别语音数据对应的识别文本与规则进行匹配,识别出语音数据句类,比如依据包含的关键词识别。然而,由于自然语言的多样性,单纯通过规则从文本上匹配,局限性较大,很难准确区分出不同语音数据的句类,尤其是包含相同关键词的语音数据,更难准确区分出语音数据的句类,如语音数据“怎么用这么快我的话费”和语音数据“怎么查询话费”,包含共同的疑问词“怎么”,但是句类不同,第一句为原因类疑问句,第二句为方式类疑问句,仅仅通过规则的方式很难区分;此外,相关技术的方法一般只针对疑问句的句类识别,对陈述句、祈使句、感叹句等非疑问句识别效果较差,应用范围较小,实用性差。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种语音数据句类识别方法,该方法可以解决依据规则识别句类的局限性,扩展 ...
【技术保护点】
一种语音数据句类识别方法,其特征在于,包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。
【技术特征摘要】
1.一种语音数据句类识别方法,其特征在于,包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。2.根据权利要求1所述的方法,其特征在于,还包括:构建句类识别模型,所述构建句类识别模型包括:获取语音数据样本;确定所述语音数据样本的句类;获取所述语音数据样本的句类识别特征;根据所述语音数据样本的句类识别特征和所述语音数据样本的句类,进行模型训练,构建得到句类识别模型。3.根据权利要求1所述的方法,其特征在于,获取所述语音数据的声学句类识别特征,包括:对所述语音数据进行划分,得到所述语音数据包含的多个语音片段;计算所述语音片段的短时平均能量;根据所述短时平均能量确定所述语音数据的声学句类识别特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述短时平均能量确定声学句类识别特征,包括:将所有所述短时平均能量组成的向量,确定为所述语音数据的声学句类识别特征;或者,在所有所述短时平均能量中确定出最大短时平均能量,将所述最大短时平均能量确定为所述语音数据的声学句类识别特征;或者,将所有所述短时平均能量和最大短时平均能量组成的向量,确定为所述语音数据的声学句类识别特征。5.根据权利要求1所述的方法,其特征在于,获取所述语音数据的语义句类识别特征,包括:对所述语音数据进行划分,得到所述语音数据包含的多个语音片段,以及,从所述多个语音片段中获取短时平均能量最大的语音片段;根据所述短时平均能量最大的语音片段,获取扩展后的语音片段对应的文本数据;根据所述文本数据确定所述语音数据的语义句类识别特征。6.根据权利要求5所述的方法,其特征在于,所述语义句类识别特征包括如下项的至少一项:句互信息向量,所述句互信息向量为所述文本数据包含的词语对应的互信息向量的加权和,所述互信息向量为所述词语与每种句类之间的互信息组成的向量;句子向量,所述句子向量为所述文本数据包含的词语对应的词向量的加权和。7.根据权利要求3或5所述的方法,其特征在于,所述对所述语音数据进行划分,得到所述语音数据包含的多个语音片段,包括:对所述语音数据进行语音识别,得到对应的整句文本数据;将所述整句文本数据划分为多个文本片段,并根据所述文本片段对所述语音数据进行划分,得到多个语音片段。8.根据权利要求7所述的方法,其特征在于,所述根据所述短时平均能量最大的语音片段,获取扩展后的语音片段对应的文本数据,包括:对所述整句文本数据进行分词,得到分词结果;在所述整句文本数据中提取出所述短时平均能量最大的语音片段对应的文本数据,并确定所述提取出的文本数据包含的起始词语的位置和结束词语的位置;确定扩展窗的窗口大小;根据所述提取出的文本数据包含的起始词语的位置和结束词语的位置,以及所述窗口大小,确定扩展后语音片段对应的文本数据。9.一种语音数据句类识别装置,其特征在于,包括:接收模块,用于接收待识别的语音数据;获取模块,用于获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;识别模块,用于根据预先构建的句类识别模型和所述句类识别特征,识别所述语...
【专利技术属性】
技术研发人员:李莉,司华建,李宝善,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。