语音识别方法及装置制造方法及图纸

技术编号：20518662 阅读：38 留言：0更新日期：2019-03-06 03:03

本文中公开了电子装置和方法。该电子装置实施该方法，包括：接收第一语音并从所接收的第一语音中提取第一文本；响应于检测到对第一文本的提取包括使得与第一语音相关的请求不能被处理的误差，存储所提取的第一文本；接收第二语音并从所接收的第二语音中提取第二文本；响应于检测到所述请求能够使用所提取的第二文本来处理，检测第一文本与第二文本之间的相似度是否大于相似度阈值，并检测第二语音是否在接收到第一语音之后的预定时长内被接收；以及当相似度大于阈值并且第一语音信号和第二语音信号在该时长内被接收时，将第一文本与第二文本进行关联存储。

Speech Recognition Method and Device

Electronic devices and methods are disclosed herein. The electronic device implements the method, including: receiving the first voice and extracting the first text from the received first voice; storing the extracted first text in response to detection of errors in extracting the first text including making requests related to the first voice unable to be processed; receiving the second voice and extracting the second text from the received second voice; and responding to detection. The request can be processed using the extracted second text to detect whether the similarity between the first text and the second text is greater than the similarity threshold, and whether the second speech is received within a predetermined time period after receiving the first speech; and when the similarity is greater than the threshold and the first speech signal and the second speech signal are received within that time period, the first text can be processed. Associated storage with the second text.

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法及装置
本公开的各种实施方式涉及基于机器学习算法的人工智能(AI)系统及其应用。
技术介绍
AI系统是旨在通过基于自学习的识别增强使机器能够模拟人类智力水平的计算机系统。AI技术可与基于针对输入数据的分类/学习性质的自学习算法的“机器学习”技术(例如，深度学习)以及用于在机器学习算法的协助下模仿人类大脑的感知和判断能力的其它组成技术一起实施。这种组成技术通常包括以下项中的至少一项：用于理解人类语言/字符的语言理解技术；用于识别人类视觉中的对象的视觉理解技术；用于通过分析信息生成逻辑推理和预测的推理/预测方法；用于表述人类的经验信息作为知识数据的知识表述技术；以及用于控制机器人动作的动作控制技术。语言理解技术是用于识别人类语言/字符并处理识别结果以用于诸如自然语言处理、机器翻译、对话系统、问答以及语音识别/合成的各种应用的技术。
技术实现思路
当电子装置借助于自动语音识别(ASR)将用户输入的语音信号转换成词语或语句时，可能发生所转换的词语或语句不适合于自然语言理解(NLU)的情况。例如，如果ASR结果在含义上不是模糊不清，则电子装置可能向用户呈现非预期的结...

【技术保护点】
1.电子装置，包括：麦克风；至少一个处理器；以及存储器，所述存储器存储编程指令，所述编程指令能够由所述至少一个处理器运行以使得所述电子装置执行以下操作：使用所述麦克风接收第一语音信号，并从所接收的第一语音信号提取第一自然语言文本；响应于检测到对所述第一自然语言文本的提取包括使得与所述第一语音信号相关的请求不能被处理的误差，存储所提取的第一自然语言文本；使用所述麦克风接收第二语音信号，并从所接收的第二语音信号提取第二自然语言文本；响应于检测到所述请求能够使用所提取的第二自然语言文本来处理，检测所述第一自然语言文本与所述第二自然语言文本之间的相似度是否大于相似度阈值，并检测所述第二语音信号是否在接...

【技术特征摘要】
2017.08.16 KR 10-2017-01035711.电子装置，包括：麦克风；至少一个处理器；以及存储器，所述存储器存储编程指令，所述编程指令能够由所述至少一个处理器运行以使得所述电子装置执行以下操作：使用所述麦克风接收第一语音信号，并从所接收的第一语音信号提取第一自然语言文本；响应于检测到对所述第一自然语言文本的提取包括使得与所述第一语音信号相关的请求不能被处理的误差，存储所提取的第一自然语言文本；使用所述麦克风接收第二语音信号，并从所接收的第二语音信号提取第二自然语言文本；响应于检测到所述请求能够使用所提取的第二自然语言文本来处理，检测所述第一自然语言文本与所述第二自然语言文本之间的相似度是否大于相似度阈值，并检测所述第二语音信号是否在接收到所述第一语音信号之后的预定时长内被接收；以及当所述相似度大于所述相似度阈值并且所述第一语音信号和所述第二语音信号在所述预定时长内被接收时，将所述第一自然语言文本与所述第二自然语言文本进行关联存储。2.根据权利要求1所述的电子装置，其中，所述指令还能够由所述至少一个处理器运行以使得所述电子装置基于所述第二自然语言文本生成答复所述第二语音信号的响应。3.根据权利要求1所述的电子装置，其中，所述第一自然语言文本和所述第二自然语言文本包括词语或语句。4.根据权利要求1所述的电子装置，其中，基于以下项中的至少一项来检测所述相似度是否大于所述相似度阈值：在所述第一自然语言文本与所述第二自然语言文本之间运行字符串比较；以及使用生成的、对所述第一自然语言文本和所述第二自然语言文本的发音的预估来运行发音比较。5.根据权利要求1所述的电子装置，其中，检测到在所述预定时长内接收到所述第一语音信号和所述第二语音信号表明所述第一语音信号和所述第二语音信号在时间上大致被连续接收。6.根据权利要求1所述的电子装置，其中，所述指令还能够由所述至少一个处理器运行以使得所述电子装置执行以下操作：在接收到所述第一语音信号和所述第二语音信号之后，通过使用所述麦克风接收重复所述第一语音信号的第三语音信号，提取与所述第三语音信号对应的第三自然语言文本，并检测所述第三自然语言文本匹配与所述第二自然语言文本关联存储的所述第一自然语言文本，以及基于所述匹配检索所述第二自然语言文本。7.根据权利要求6所述的电子装置，其中，所述指令还能够由所述至少一个处理器运行以使得所述电子装置基于所述第二自然语言文本生成对所述第三语音信号的响应。8.根据权利要求1所述的电子装置，其中，所述指令还能够由所述至少一个处理器运行以使得所述电子装置从所述存储器和外部服务器中的至少一项获取所述第一自然语言文本和所述第二自然语言文本中的至少一项。9.根据权利要求2所述的电子装置，其中，所述指令还能够由所述至少一个处理器运行以使得所述电子装置从所述存储器或从外部服务器检索所述响应。10.电子装置的方法，所述方法包括：使用麦...

【专利技术属性】
技术研发人员：金容煜，具滋旻，金康爀，李东奎，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人