【技术实现步骤摘要】
本专利技术总体上涉及一种用于基于给定的一个或多个单词如移动设备电话簿中的名称来识别语言的方法和系统,以及涉及一种用于语音驱动名称拨号或命令控制应用的多语言语音识别系统。
技术介绍
移动电话中的电话簿或联系人列表可能含有以不同语言书写的联系人名称。例如,诸如“Smith”、“Poulenc”、“Szabolcs”、“Mishima”和“Maalismaa”等名称可能分别是英文名、法文名、匈牙利文名、日文名和芬兰土语名。识别电话簿中的联系人属于哪种语族或语言是很有利或必要的。目前,自动语音识别(ASR)技术已经应用于移动电话和其它手持通信设备。发言者训练的名称拨号器可能是最广泛应用的ASR应用之一。在发言者训练的名称拨号器中,用户必须训练用于识别的模型,即与发言者相关的名称拨号(SDND)。依靠更高级技术的应用无需用户训练任何识别模型。而是基于多语言单词的表音法自动生成识别模型。基于多语言单词的表音法对发音进行建模的技术应用于例如与多语言发言者无关的名称拨号(ML-SIND)系统中,如Viikki等人所公开的那样,参见“移动通信系统中与发言者和语言无关的语音识别”(″Speaker-and Language-Independent SpeechRecognition in Mobile Communication Systems″,in Proceedings ofInternational Conference on Acoustics,Speech,and Signal Processing,Salt Lake City,Utah,USA 2002)。因 ...
【技术保护点】
一种基于自动语言识别系统在多种语言中识别字母字符串的语言的方法,其中所述多种语言中的每种语言具有各自的字母字符集,所述方法的特征在于:将所述字母字符串映射到从参考字母字符集中选择的映射字母字符串;获得表示所述映射字母字符串属于所述多种语言中各种语言的概率的第一值;获得表示所述字符串中的字母字符在所述各字母字符集中的匹配情况的第二值;以及基于所述第一和第二值确定所述字符串的语言。
【技术特征摘要】
US 2002-10-22 10/279,7471.一种基于自动语言识别系统在多种语言中识别字母字符串的语言的方法,其中所述多种语言中的每种语言具有各自的字母字符集,所述方法的特征在于将所述字母字符串映射到从参考字母字符集中选择的映射字母字符串;获得表示所述映射字母字符串属于所述多种语言中各种语言的概率的第一值;获得表示所述字符串中的字母字符在所述各字母字符集中的匹配情况的第二值;以及基于所述第一和第二值确定所述字符串的语言。2.如权利要求1所示的方法,其特征在于还包括如下步骤所述参考字母字符集中的字母字符的数量少于所述所有各字母字符集的并集。3.如权利要求1所述的方法,其特征在于所述第一值是基于所述参考字母字符集获得的。4.如权利要求3所述的方法,其特征在于所述参考字母字符集包括最小的标准字母字符集,使得所述多种语言中每种语言各自的字母字符集中的每个字母字符可以唯一地映射到所述标准字母字符之一。5.如权利要求3所述的方法,其特征在于所述参考字母字符集由最小的标准字母字符集和空符号构成,使得所述多种语言中每种语言各自的字母字符集中的每个字母字符可以唯一地映射到所述标准字母字符之一。6.如权利要求5所述的方法,其特征在于所述映射字符串中的字母字符的数量等于所述字符串中的字母字符的数量。7.如权利要求4所述的方法,其特征在于所述参考字母字符集包括所述最小的标准字母字符集和与所述标准字母字符不同的至少一个符号,以便至少一个所述各字母字符集中的每个字母字符可以唯一地映射到所述标准字母字符之一和所述至少一个符号的组合。8.如权利要求4所述的方法,其特征在于所述参考字母字符集包括所述最小的标准字母字符集和与所述标准字母字符不同的多个符号,以便至少一个所述各字母字符集中的每个字母字符可以唯一地映射到所述标准字母字符和所述多个符号中所述至少一个符号的组合。9.如权利要求8所述的方法,其特征在于所述符号数量可以根据所述自动语言识别系统的期望性能来调整。10.如权利要求1所述的方法,其特征在于所述自动语言识别系统是包括多个隐藏单元的基于神经网络的系统;以及所述隐藏单元的数量可以根据所述自动语言识别系统的期望性能来调整。11.如权利要求3所述的方法,其特征在于所述自动语言识别系统是基于神经网络的系统,以及所述概率是由所述基于神经网络的系统来计算的。12.如权利要求1所述的方法,其特征在于所述第二值是从指定给所述字符串属于所述多种语言中给定的一种的概率的比例系数获得的。13.如权利要求12所述的方法,其特征在于所述语言是根据所述多种语言中所述第一值和所述第二值的乘积的最大值来确定的。14.一种基于自动语言识别系统在多种语言中识别字母字符串的语言的方法,所述多种语言分类成多种语言组;其中每个组具有各自的字母字符集;所述方法的特征在于将所述字母字符串映射到从参考字母字符集中选择的映射字母字符串,获得表示所述映射字母字符串属...
【专利技术属性】
技术研发人员:J田,J索恩陶斯塔,
申请(专利权)人:诺基亚有限公司,
类型:发明
国别省市:FI[芬兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。