语音数据句类识别方法和装置及系统制造方法及图纸

技术编号:15439037 阅读:110 留言:0更新日期:2017-05-26 04:48
本申请提出一种语音数据句类识别方法和装置及系统,该方法包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。该方法能够解决依据规则识别句类的局限性,扩展使用范围,并且可以提高识别准确度。

Speech data sentence class identification method and device and system

The invention provides a voice data sentence recognition method and device and system. The method comprises: receiving the voice data to be identified; obtaining the voice data types of sentence recognition features, the sentence recognition features include at least one of the following: acoustic sentence recognition features, semantic class feature recognition according to the sentence recognition model; pre built and the types of sentence recognition features, identifying the voice data sentence type, the sentence recognition model based on voice data acquisition of samples of sentence recognition feature was constructed. This method can solve the limitations of identifying sentences according to the rules, expand the range of application and improve the accuracy of recognition.

【技术实现步骤摘要】
语音数据句类识别方法和装置及系统
本申请涉及自然语言处理
,尤其涉及一种语音数据句类识别方法和装置及系统。
技术介绍
语音数据的句类指按照语音数据中句子的语气,将句子划分的类型,如陈述句、祈使句、感叹句、一般疑问句及特殊疑问句等,不同句类的句子往往具有不同语义,单纯从文本语义上很难区分开,如在智能问答系统中,语音数据“我开通了几个增值服务”和“我开通了哪几个增值服务”,二者仅差一个字,但语义完全不同,答案也完全不同,通过句类识别后,得到这两句语音数据分别属于不同的句类,第一句的句类为数量类疑问句,第二句的句类为实体类疑问句。为了提高反馈给用户的答案的准确度,关键点之一是识别语音数据的句类。相关技术中,语音数据句类识别方法一般通过编写每种句类的规则,将待识别语音数据对应的识别文本与规则进行匹配,识别出语音数据句类,比如依据包含的关键词识别。然而,由于自然语言的多样性,单纯通过规则从文本上匹配,局限性较大,很难准确区分出不同语音数据的句类,尤其是包含相同关键词的语音数据,更难准确区分出语音数据的句类,如语音数据“怎么用这么快我的话费”和语音数据“怎么查询话费”,包含共同的疑问词“怎么”,但是句类不同,第一句为原因类疑问句,第二句为方式类疑问句,仅仅通过规则的方式很难区分;此外,相关技术的方法一般只针对疑问句的句类识别,对陈述句、祈使句、感叹句等非疑问句识别效果较差,应用范围较小,实用性差。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种语音数据句类识别方法,该方法可以解决依据规则识别句类的局限性,扩展使用范围,并且可以提高识别准确度。本申请的另一个目的在于提出一种语音数据句类识别装置。本申请的另一个目的在于提出一种语音数据句类识别系统。为达到上述目的,本申请第一方面实施例提出的语音数据句类识别方法,包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。本申请第一方面实施例提出的语音数据句类识别方法,通过依据句类识别模型对语音数据的句类进行识别,可以有效解决依据规则进行识别的局限性,扩展使用范围,以及依据声学上和语义上的特征进行识别,可以提高识别准确度。为达到上述目的,本申请第二方面实施例提出的语音数据句类识别装置,包括:接收模块,用于接收待识别的语音数据;获取模块,用于获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;识别模块,用于根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。本申请第二方面实施例提出的语音数据句类识别装置,通过依据句类识别模型对语音数据的句类进行识别,可以有效解决依据规则进行识别的局限性,扩展使用范围,以及依据声学上和语义上的特征进行识别,可以提高识别准确度。为达到上述目的,本申请第三方面实施例提出的语音数据句类识别系统,包括:客户端,用于采集用户发出的待识别的语音数据;服务端,用于接收所述客户端发送的所述待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;以及,根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。本申请第三方面实施例提出的语音数据句类识别系统,通过依据句类识别模型对语音数据的句类进行识别,可以有效解决依据规则进行识别的局限性,扩展使用范围,以及依据声学上和语义上的特征进行识别,可以提高识别准确度。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请一个实施例提出的语音数据句类识别方法的流程示意图;图2是本申请另一个实施例提出的语音数据句类识别方法的流程示意图;图3是本申请实施例中获取句类识别特征的方法的流程示意图;图4是本申请一个实施例提出的语音数据句类识别装置的结构示意图;图5是本申请另一个实施例提出的语音数据句类识别装置的结构示意图;图6是本申请一个实施例提出的语音数据句类识别系统的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本申请一个实施例提出的语音数据句类识别方法的流程示意图。如图1所示,本实施例的方法包括:S11:接收待识别的语音数据。待识别的语音数据例如为智能交互时用户发出的语音数据。进一步的,待识别的语音数据可以以句为单位,从而可以对应每句语音数据进行识别,得到每句语音数据的句类。S12:获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征。声学句类识别特征是指语音数据的声学上的特征,语义句类识别特征是指语音数据的语义上的特征。在后续内容中,还会涉及对获取样本的句类识别特征的步骤,因此,此处的语音数据以及后续的样本可以统称为待提取数据。具体的获取待提取数据的句类识别特征的方法可以参见后续内容。S13:根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。具体构建句类识别模型的方法可以参见后续描述。句类识别模型的输入为句类识别特征,输出为句类信息,从而在提取得到句类识别特征后,将提取得到的句类识别特征作为句类识别模型的输入,得到句类识别模型输出的句类信息,再根据句类信息确定待识别的语音数据的句类,比如,句类信息为每种预设句类的概率值,则将概率值最高的句类确定为待识别的语音数据的句类。所述语音数据的句类是指按照语音数据中句子的语气将句子划分的类型,句类包括但不限于:陈述句、祈使句、感叹句、一般疑问句及特殊疑问句,进一步的,还可以对上述的句类进行细分,如所述特殊疑问句包括实体类疑问句(what)、人物类疑问句(who)、原因类疑问句(why)、时间类疑问句(when)、地点类疑问句(where)、数量类疑问句(howmuch/many)和方式类疑问句(how)等。在具体应用时,所述语音数据句类识别方法可以由客户端和服务端执行。例如包括:客户端采集用户发出的待识别的语音数据;以及,客户端将待识别的语音数据发送给服务端;以及,服务端接收到客户端发送的待识别的语音数据后,获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;以及,服务端根据预先构建的句类识别模型本文档来自技高网...
语音数据句类识别方法和装置及系统

【技术保护点】
一种语音数据句类识别方法,其特征在于,包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。

【技术特征摘要】
1.一种语音数据句类识别方法,其特征在于,包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。2.根据权利要求1所述的方法,其特征在于,还包括:构建句类识别模型,所述构建句类识别模型包括:获取语音数据样本;确定所述语音数据样本的句类;获取所述语音数据样本的句类识别特征;根据所述语音数据样本的句类识别特征和所述语音数据样本的句类,进行模型训练,构建得到句类识别模型。3.根据权利要求1所述的方法,其特征在于,获取所述语音数据的声学句类识别特征,包括:对所述语音数据进行划分,得到所述语音数据包含的多个语音片段;计算所述语音片段的短时平均能量;根据所述短时平均能量确定所述语音数据的声学句类识别特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述短时平均能量确定声学句类识别特征,包括:将所有所述短时平均能量组成的向量,确定为所述语音数据的声学句类识别特征;或者,在所有所述短时平均能量中确定出最大短时平均能量,将所述最大短时平均能量确定为所述语音数据的声学句类识别特征;或者,将所有所述短时平均能量和最大短时平均能量组成的向量,确定为所述语音数据的声学句类识别特征。5.根据权利要求1所述的方法,其特征在于,获取所述语音数据的语义句类识别特征,包括:对所述语音数据进行划分,得到所述语音数据包含的多个语音片段,以及,从所述多个语音片段中获取短时平均能量最大的语音片段;根据所述短时平均能量最大的语音片段,获取扩展后的语音片段对应的文本数据;根据所述文本数据确定所述语音数据的语义句类识别特征。6.根据权利要求5所述的方法,其特征在于,所述语义句类识别特征包括如下项的至少一项:句互信息向量,所述句互信息向量为所述文本数据包含的词语对应的互信息向量的加权和,所述互信息向量为所述词语与每种句类之间的互信息组成的向量;句子向量,所述句子向量为所述文本数据包含的词语对应的词向量的加权和。7.根据权利要求3或5所述的方法,其特征在于,所述对所述语音数据进行划分,得到所述语音数据包含的多个语音片段,包括:对所述语音数据进行语音识别,得到对应的整句文本数据;将所述整句文本数据划分为多个文本片段,并根据所述文本片段对所述语音数据进行划分,得到多个语音片段。8.根据权利要求7所述的方法,其特征在于,所述根据所述短时平均能量最大的语音片段,获取扩展后的语音片段对应的文本数据,包括:对所述整句文本数据进行分词,得到分词结果;在所述整句文本数据中提取出所述短时平均能量最大的语音片段对应的文本数据,并确定所述提取出的文本数据包含的起始词语的位置和结束词语的位置;确定扩展窗的窗口大小;根据所述提取出的文本数据包含的起始词语的位置和结束词语的位置,以及所述窗口大小,确定扩展后语音片段对应的文本数据。9.一种语音数据句类识别装置,其特征在于,包括:接收模块,用于接收待识别的语音数据;获取模块,用于获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;识别模块,用于根据预先构建的句类识别模型和所述句类识别特征,识别所述语...

【专利技术属性】
技术研发人员:李莉司华建李宝善
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1