用于识别语音和文本的设备和方法技术

技术编号：10923686 阅读：129 留言：0更新日期：2015-01-18 23:48

一种用于识别语音和文本的设备和方法，所述方法包括：接收包含多种语言的语音作为输入，通过使用与预设主要语言相匹配的语音识别算法，来识别语音的第一语音，识别包括在多种语言中的预设主要语言和不同于预设主要语言的非主要语言，基于上下文信息确定所述非主要语言的类型，通过将与确定的非主要语言的类型相匹配的语音识别算法应用于第二语音，来识别所述非主要语言的语音的第二语音，输出基于识别第一语音的结果和识别第二语音的结果的识别语音的结果。

全部详细技术资料下载

【技术实现步骤摘要】

本公开总体上涉及一种用于识别语音的设备和方法，更具体地，涉及一种用于识别包含多种语言的语音的设备和方法。
技术介绍
随着交通和通信的进步，存在碰到外语语音的快速增长。然而，那些不熟练外语的人可能遇到听懂外语的困难。就此而言，用于识别外语语音并将识别外语语音的结果转换为文本的方法已被开发并取得进展。在根据现有技术的用于识别语音的方法中，以音素为单位分割输入语音，随后将每个分割的音素与数据库进行比较，从而确定语音与哪个文本或单词相匹配。同时，因为特定国家的人居住在外国的情况经常发生，所以有必要对同时包含多种语言的语音进行处理。例如，可能存在特定国家的人主要使用特定国家的语言，但混合着来自于在另一国家使用的语言的单词的情况。因此，需要开发一种用于识别包含多种语言的语音的设备和方法。例如在根据现有技术的用于识别包含多种语言的语音的方法中，各种国家的语言共有的用于交流的单词或惯用的句子被定义为代码，随后各种国家的语言被分别映射为代码。就此而言，以...

【技术保护点】
一种识别语音的方法，所述方法包括：接收包含多种语言的语音作为输入(S101)；通过使用与预设主要语言相匹配的语音识别算法，来识别语音的第一语音；识别包括在多种语言中的预设主要语言和不同于预设主要语言的非主要语言(S103)；基于上下文信息确定所述非主要语言的类型(S105)；通过将与确定的非主要语言的类型相匹配的语音识别算法应用于第二语音，来识别所述非主要语言的语音的第二语音(S107)；输出基于识别第一语音的结果和识别第二语音的结果的识别语音的结果。

【技术特征摘要】
2013.07.04 KR 10-2013-00782071.一种识别语音的方法，所述方法包括：
接收包含多种语言的语音作为输入(S101)；
通过使用与预设主要语言相匹配的语音识别算法，来识别语音的第一语
音；
识别包括在多种语言中的预设主要语言和不同于预设主要语言的非主要
语言(S103)；
基于上下文信息确定所述非主要语言的类型(S105)；
通过将与确定的非主要语言的类型相匹配的语音识别算法应用于第二语
音，来识别所述非主要语言的语音的第二语音(S107)；
输出基于识别第一语音的结果和识别第二语音的结果的识别语音的结
果。
2.如权利要求1所述的方法，其中，上下文信息包括以下信息中的至少
一个：
语音中是否存在国家的名称；
关于用于识别语音的设备所在的地方的信息；
对话历史信息；
更新的非主要语言数据库。
3.如权利要求2所述的方法，其中，基于上下文信息确定非主要语言的
类型的步骤包括：
当语音中存在国家的名称时，如果与国家的名称相匹配的语言不是主要
语言，则确定与国家的名称相匹配的语言是否为非主要语言(S803)；或
基于测量的全球定位系统GPS坐标确定非主要语言是否是与用于识别语
音的设备所在的国家和地方中的至少一个的特点相匹配的语言(S805)。
4.如权利要求2所述的方法，其中，基于上下文信息确定非主要语言的
类型的步骤包括：
确定是否已经预先存储了非主要语言和国家名称共存的对话历史；
当对话历史包括非主要语言和国家的名称时，确定非主要语言是否是与
国家的名称相匹配的语言。
5.如权利要求2所述的方法，其中，基于上下文信息确定非主要语言的

\t类型的步骤包括：
确定非主要语言数据库中是否存在识别非主要语言的历史；
当非主要语言数据库中存在识别非主要语言的历史时，由用于识别语音
的设备立即基于与识别非主要语言的历史相应的识别的结果来识别非主要语
言。
6.如权利要求1所述的方法，其中，识别预设主要语言和不同于预设主
要语言的非主要语言的步骤包括：
以音素为单位分割语音；
通过将至少一个分割的音素与主要语言音素的数据库进行匹配，来确定
所述至少一个分割的音素与主要语言单词的相似度；
识别具有确定的小于预设阈值的相似度的所述至少一个分割的音素属于
非主要语言。
7.如权利要求1所述的方法，还包括：通过在上下文信息和与非主要语
言相匹配的语音识别算法中的至少一个中反映识别非主要语言的结果，来更
新上下文信息和与非主要语言相匹配的语音识别算法中的至少一个；
显示识别非主要语言的结果；
接收指示识别非主要语言的结果合适还是不合适的用户反馈作为输入；
当用户反馈指示识别非主要语言的结果合适时，通过在非主要语言数据库中
反映识别非主要语言的结果来更新非主要语言数据库；
当用户反馈指示识别非主要语言的结果不合适时，排除识别非主要语言
的结果；
重新识别非主要语言，并输出识别的非主要语言。
8.一种识别语音的设备，所述设备包括：
麦克风(362)，被配置为用于接收包含包括预设主要语言和与预设主要语
言不同的非主要语言的多种语言的语音作为输入；
存储单元(375)，被配置为用于存储与预设主要语言相匹配的语音识别算
法和与非主要语言相匹配的语音识别算法；
控制器(310)，被配置为通过使用与预设主要语言相匹配的语音识别算...

【专利技术属性】
技术研发人员：沙布霍吉特·查科拉达，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国;KR

全部详细技术资料下载我是这个专利的主人