The present invention provides a method of voice interaction, including: identifying the context word error prone calibration step, based on the automatic error correction procedure, based on semantic constraints semantic feedback artificial error correction steps. The present invention through interaction with the user perception, speech recognition and semantic topic context, in a limited range, the use of named entity recognition technology, automatic error correction function to contain the specific meaning of the entity, and is supported by artificial feedback to obtain additional semantic and error correction, the input efficiency is higher than the existing voice recognition software and more convenient the error correction method.
【技术实现步骤摘要】
语音交互中的易错字校准方法
本专利技术涉及易错字校准技术,具体地,涉及语音交互中的易错字校准方法,尤其是将自然语言理解方法应用于语音交互易错字的校准与纠正中,实现了一个可用的语音交互易错字校准方案。
技术介绍
语音交互作为一种人机交互的新途径,近年来,获得了突飞猛进的广泛应用。这首先源于语音识别技术的发展,从隐马尔科夫模型(HiddenMarkovModel,HMM)、混合高斯模型(GaussianMixtureModel,GMM)到现在的深度神经网络模型(DeepNeuralNetwork,DNN),语音识别系统的错误率大幅下降;其次,智能设备用户的使用习惯尚未成型,新技术如语音交互容易被大众接受;而云计算、移动互联网的超常规发展使得大量的全新语料资源产生进而助推了语音识别技术的发展。在很多场景下,语音交互具有更加现实的实用价值,符合人类的交互习惯。然而,由于语音输入不可避免会受到环境噪声、衰落信道的影响,经常会产生很多错误结果,此外,由于汉语中存在大量的同音字、音近字现象,导致机器无法准确识别用户的语音输入,使语音识别中较易出现错字。换言之,目前的语音识别正确率尚未达到人们期望的水平,语音识别技术也必须在很多方面取得突破性进展。经对现有技术文献的检索发现,中国专利文献号CN201210584746.2,公开号CN103021412A,记载了一种“语音识别方法和系统”,该技术包括:对用户输入的语音信号进行语音识别,获得语音识别结果以及语音识别结果中各字符对应的语音片段;接收用户单独输入的纠错信息并生成纠错字符串;根据纠错字符串确定用户输入的语音信号中产生 ...
【技术保护点】
一种语音交互中的易错字校准方法,其特征在于,包括:识别语境步骤:针对不同的领域创建相应的语境知识库,构造语境知识库的步骤包括:首先根据领域的关键词,通过搜索引擎得到相关文档,作为该领域的语料库;然后根据语义知识,获取该领域的核心词,按照核心词聚类得到该领域的实例句子,从而构建了语境知识库。
【技术特征摘要】
1.一种语音交互中的易错字校准方法,其特征在于,包括:识别语境步骤:针对不同的领域创建相应的语境知识库,构造语境知识库的步骤包括:首先根据领域的关键词,通过搜索引擎得到相关文档,作为该领域的语料库;然后根据语义知识,获取该领域的核心词,按照核心词聚类得到该领域的实例句子,从而构建了语境知识库。2.根据权利要求1所述的语音交互中的易错字校准方法,其特征在于,在识别语境步骤中,依据文本句子与语境知识库中不同领域的语境相似度来判断,作为自动纠错的前提;其中,语境相似度的具体算法如下:S1:统计文本句子A中每个词语出现的次数,并表示成向量形式;S2:按照余弦相似度计算公式,计算文本句子A与语境Ci中向量形式的每一个实例句子B这两个向量之间向量夹角的余弦值,作为基于向量的词形相似度;S3:将文本句子A的所有词语转为拼音形式,统计文本句子A中每个不同拼音序列出现的次数,表示成向量形式,计算以拼音形式表示的文本句子A与语境Ci中向量形式的每一个实例句子B这两个向量之间向量夹角的余弦值,得到基于向量的拼音相似度;S4:通过对拼音相似度和词形相似度赋予不同权重,计算文本句子A与每一个实例句子B的句子相似度,并选择句子相似度最大的值,作为文本句子A与语境Ci的句子相似度;S5:计算文本句子A与语境Ci的核心词匹配率,即文本句子A中含有语境Ci中所有核心词的数量占文本句子A中所有词语数量的百分比;S6:通过对句子相似度和核心词匹配率赋予不同权重,计算文本句子A与语境Ci的语境相似度;S7:计算文本句子A与语境Ci基于前文语境的平滑语境相似度SmoothContextSim(A,Ci):SmoothContextSim(A,Ci)=λ1·ContextSim(A-2,Ci)+λ2·ContextSim(A-1,Ci)+λ3·ContextSim(A,Ci)λ1+λ2+λ3=1λ1≤λ2≤λ3其中,A,A-1,A-2分别表示当前文本句子、当前文本句子的前第一句、当前文本句子的前第两句;λ1,λ2,λ3是常数;ContextSim(X,Y)表示文本句子X与语境Y的语境相似度。3.根据权利要求1所述的语音交互中的易错字校准方法,其特征在于,还包括:基于限制语义的自动纠错步骤:获取用户语音输入的文本句子中的待纠错地名,对待纠错地名进行差错纠错。4.根据权利要...
【专利技术属性】
技术研发人员:黄亦睿,刘功申,苏波,刘春梅,李建华,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。