一种语音识别方法和装置制造方法及图纸

技术编号：15393047 阅读：158 留言：0更新日期：2017-05-19 05:37

本发明专利技术公开了一种语音识别方法和装置，其中方法包括：对语音采样获得语音采样信息；根据业务特征信息和语音采样信息获得前置特征参数集，业务特征信息包括地理位置信息、业务类型和业务场景，前置特征参数集包括位置标识、语种标识、行为标识和行业标识；根据前置特征参数集选择结构化语料库对语音采样信息进行语音识别。本发明专利技术在语音识别时，获取前置特征参数集，通过位置标识、语种标识、行为标识和行业标识检索细分化的结构化语料库，可有效提高语音识别效率与识别的准确率，尤其在进行对语音识别实时性要求较高的业务时，显著改善用户体验。

Speech recognition method and apparatus

The invention discloses a voice recognition method and device, wherein the method comprises the following steps: the voice sampling to obtain voice sampling information; according to the characteristics of the business information and voice information to obtain the characteristic parameters in pre sampling, business characteristic information including geographical location information, business type and business scene, with parameters set of features including position identification, identity, language behavior identification and identification industry; according to the selection of sampling information of speech corpus structured speech recognition front-end feature set. The present invention in speech recognition, pre acquisition parameters set of features, through structured corpus segmentation identifier, language identification, behavior identification and industry, can effectively improve the accuracy of speech recognition efficiency and recognition, especially in speech recognition requires high real-time service, improve the user experience.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法和装置
本专利技术涉及语音识别领域，尤其涉及一种语音识别方法和装置。
技术介绍
自然语言处理技术，是计算机科学领域与人工智能领域中的一个重要方向，研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法，让计算机“理解”自然语言，因此自然语言处理又叫做自然语言理解。语音识别技术，是指将人类发出的语言声音转换为计算机可以识别的文字，编码，按键操作等。声纹识别技术。是指根据人的发声特征来区别不同人的身份。经研究发现，不同语言的发声特征也有所不同。语音识别技术架构主要由以下几部分构成：1、物理接口层：声音进入系统的物理接口，输入语音信号；2、特征提取层：提取声学特征矢量，提供特征矢量序列；3、音节感知层：声韵母因素单元结构，提供音节候选序列及可信度，把声韵母或因素合并成为音节单元，推断何礼音节，提供词语候选序列及可信度；4、词语识别层，音字转换，推断词语单元，提供语句候选序列及可信度；5、语句识别层，推断语句候选单元及可信度；6、语义应用层，分析语义，映射应用，由任务语法约束。一般语音识别系统的特征提取，是对输入的语音信号本身进行声学矢量分析，同时在语音识别上也是基于大规模语料标注实现。随着移动互联网的发展，语音识别功能被广泛应用于各种业务、场景，以及各种类型的应用程序中。例如用户查询电影、天气、路线等语音识别请求时，对识别速度、识别准确度和实时互动的要求就较高。例如用户说“今天要去看电影bighero”以及“请搜索high歌”等语音信息，样本中除了包含多语种语音自身基本的物理声学声纹特征外、也包含业务场景、业务类型、行为模式等第三方信息特...
一种语音识别方法和装置

【技术保护点】
一种语音识别方法，其特征在于，包括：对语音采样获得语音采样信息；根据业务特征信息和所述语音采样信息获得前置特征参数集，所述业务特征信息包括地理位置信息、业务类型和业务场景，所述前置特征参数集包括位置标识、语种标识、行为标识和行业标识；根据所述前置特征参数集选择结构化语料库对所述语音采样信息进行语音识别。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：对语音采样获得语音采样信息；根据业务特征信息和所述语音采样信息获得前置特征参数集，所述业务特征信息包括地理位置信息、业务类型和业务场景，所述前置特征参数集包括位置标识、语种标识、行为标识和行业标识；根据所述前置特征参数集选择结构化语料库对所述语音采样信息进行语音识别。2.根据权利要求1所述的方法，其特征在于，根据业务特征信息和所述语音采样信息获得前置特征参数集的步骤包括：对所述语音采样信息进行声纹特征提取；将所述声纹特征与预置特征矩阵集进行比对，生成语音分段信息和所述语种标识，所述语种标识包括所述语音分段信息的语种信息和置信值。3.根据权利要求2所述的方法，其特征在于，对所述语音采样信息进行声纹特征提取的步骤包括：对所述语音采样信息提取短时语音频谱特征和统计特征；根据特征参数模型进行特征参数化，得到声纹特征。4.根据权利要求3所述的方法，其特征在于，所述特征参数模型包括梅尔频率倒谱系数和感知线性预测系数。5.根据权利要求1所述的方法，其特征在于，根据所述前置特征参数集和结构化语料库对所述语音采样信息进行语音识别的步骤包括：根据所述前置特征参数集中的语种标识，选择相应语种的识别引擎；根据位置标识、行为标识和行业标识检索结构化语料库，对所述语音采样信息进行语音识别。6.根据权利要求1所述的方法，其特征在于，还包括：根据所述语音识别结果调整所述前置特征参数集。7.根据权利要求1-5任一所述的方法，其特征在于，还包括：接收用户终端上报的所述业务特征信息。8.根据权利要求1-5任一所述的方法，其特征在于，还包括：根据所述语音采样信息获得所述业务特征信息。9.一种语音识别装置，其特征在于，包括：语音采样单元，用于对语音采样获得语音采样信息；前置特征提取单元，用于根据业务特征信息和所述语音采样信息获得前置特征参...

【专利技术属性】
技术研发人员：龚晟，杨震，彭晓春，俞惠华，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人