用于处理声音数据的系统和控制该系统的方法技术方案

技术编号:22222284 阅读:77 留言:0更新日期:2019-09-30 03:20
提供了一种系统、用户终端以及系统的方法。该系统包括:通信接口;至少一个处理器,所述至少一个处理器可操作地耦接到所述通信接口;以及至少一个存储器,所述至少一个存储器可操作地耦接到所述至少一个处理器,其中,所述至少一个存储器被配置为存储指令,所述指令被配置为使所述至少一个处理器通过所述通信接口从第一外部装置接收声音数据,使用至少一些自动语音识别模块来从所述声音数据获得语音信号和噪声信号,将所述语音信号转换为文本数据,基于至少一些所述噪声信号来确定噪声模式,以及当所述存储器工作时使用所述文本数据和所述噪声模式来确定所述声音数据的域。

The System for Processing Sound Data and the Method for Controlling the System

【技术实现步骤摘要】
用于处理声音数据的系统和控制该系统的方法
本公开一般涉及用于处理包括用户的语音或噪声的声音数据的系统和控制该系统的方法,更具体地,涉及一种用于当执行与接收到的语音的内容相对应的功能时,使用关于接收到语音的环境的信息来向用户提供功能的系统。
技术介绍
除了使用键盘或鼠标的现有输入方法之外,近来的电子装置可以支持各种输入方法,例如语音输入。例如,诸如智能手机或平板电脑的电子装置可以在已经执行语音识别服务的状态下识别用户输入的语音,并且可以执行对应于语音输入的操作或者提供对应于语音输入的搜索结果。近来,基于处理自然语言的技术开发了语音识别服务。处理自然语言的技术是一种用于识别用户语音意图并向用户提供适合该意图的结果的技术。此外,人工智能系统被用作处理自然语言的技术之一。与现有的基于规则的智能系统不同,人工智能系统是一种机器自主进行训练、做出决定并提高智能的系统。人工智能系统可以获得更高的识别率,并且随着系统使用得更多,可以更准确地理解用户的喜好。因此,现有的基于规则的智能系统逐渐被基于深度学习的人工智能系统所取代。人工智能技术包括机器学习(例如,深度学习)和使用机器学习的元件技术。机器学习是一种自动识别/训练输入数据特性的算法技术。元件技术是利用机器学习算法(诸如,深度学习)的模拟功能(诸如,人脑的识别和确定)的技术,包括语言理解、视觉理解、推理/预测、知识表达和操作控制等
应用人工智能技术的各个领域如下。语言理解是一种用于识别、应用和处理人类语言/字母的技术,包括自然语言处理、机器翻译、对话系统、问答和语音识别/合成。视觉理解是一种识别和处理诸如人的观点之类的事物的技术,包括目标识别、目标跟踪、图像搜索、人物识别、场景理解、空间理解和图像增强。推理预测是一种用于确定、逻辑推断和预测信息的技术,包括基于知识/概率的推理、优化预测、基于偏好的计划和推荐。知识表达是将人类的经验信息作为知识数据进行自动化和处理的技术,包括知识构建(例如,数据生成/分类)和知识管理(例如,数据利用)。操作控制是用于控制车辆的自动驾驶和机器人的运动的技术,并且包括运动控制(例如,导航、碰撞和驾驶)和操纵控制(例如,行为控制)。在诸如语音识别功能的智能服务中,当接收到语音并且通过识别接收到的语音的内容来执行功能时,可以在不考虑接收到语音的情况下执行该功能。
技术实现思路
当执行与接收到的语音的内容相对应的功能时,本公开使用关于接收到语音的环境的信息向用户提供功能。根据本公开的一个方面,提供了一种系统。所述系统包括:通信接口;至少一个处理器,所述至少一个处理器可操作地耦接到所述通信接口;以及至少一个存储器,所述至少一个存储器可操作地耦接到所述至少一个处理器,其中,所述至少一个存储器被配置为存储指令,所述指令被配置为使所述至少一个处理器通过所述通信接口从第一外部装置接收声音数据,使用至少一些自动语音识别模块来从所述声音数据获得语音信号和噪声信号,将所述语音信号转换为文本数据,基于至少一些所述噪声信号来确定噪声模式,以及当所述存储器工作时使用所述文本数据和所述噪声模式来确定所述声音数据的域。根据本公开的另一方面,提供了一种用户终端。所述用户终端包括:输入模块、存储器以及处理器,其中所述存储器被配置为存储指令,所述指令被配置为使所述处理器通过将包括通过所述输入模块接收到的语音信号和环境声音信号的音频数据应用于使用人工智能算法训练过的训练模型,来生成通过估计所述音频数据的内容而获得的路径规则,其中,所述训练模型被配置为使用从所述环境声音信号获得的所述环境声音信号的模式来生成所述路径规则,并且其中,所述训练模型被配置为通过对使用所述音频数据、所述音频数据的内容、所述音频数据的特性和对应于所述音频数据的路径规则中的至少一个作为训练数据而训练的所述音频数据的内容进行估计,来生成所述路径规则。根据本公开的另一方面,提供了一种系统的方法。所述方法包括:从第一外部装置接收声音数据;从所述声音数据获得语音信号和噪声信号;将所述语音信号转换为文本数据;基于至少一些所述噪声信号来确定噪声模式;以及使用所述文本数据和所述噪声模式来确定所述声音数据的域。根据本公开的另一方面,提供了一种用户终端的方法。所述方法包括:接收包括语音和环境声音的音频数据;以及在通过将所述音频数据应用于训练模型来估计所述音频数据的内容而获得所述路径规则的情况下,使用从所述环境声音信号获得的所述环境声音信号的模式来生成路径规则,其中所述训练模型被配置为通过使用所述音频数据、所述音频数据的内容、所述音频数据的特性和对应于所述音频数据的路径规则中的至少一个作为训练数据来估计应用于所述训练模型的所述音频数据的所述内容来生成所述路径规则。根据本公开的另一方面,提供了一种计算机程序产品,其包括存储有用于在计算机中执行操作的指令的非暂时性计算机可读记录介质。所述操作包括:从第一外部装置接收声音数据;从所述声音数据获得语音信号和噪声信号;将所述语音信号转换为文本数据;基于至少一些所述噪声信号来确定噪声模式;以及使用所述文本数据和所述噪声模式来确定所述声音数据的域。附图说明从以下结合附图的描述中,本公开的某些实施例的上述和其他方面、特性和优点将变得更加明显,其中:图1是根据实施例的集成智能系统的示图;图2是根据实施例的集成智能系统的用户终端的框图;图3是根据实施例的用户终端的智能应用程序(app)的执行的示图;图4是示出根据实施例的智能服务模块的上下文模块收集当前状态的框图;图5是根据实施例的智能服务模块的建议模块的框图;图6是根据实施例的集成智能系统的智能服务器的框图;图7是根据实施例的生成路径规划器模块的路径规则的方法的示图;图8是示出根据实施例的智能服务模块的角色模块管理关于用户的信息的框图;图9是示出根据实施例的集成智能系统中使用输入到用户终端的语音和环境声音来执行功能的情况的框图;图10A是示出根据实施例的集成智能系统中使用输入到用户终端的语音和环境声音来执行功能的情况的框图;图10B是示出根据实施例的集成智能系统中使用输入到用户终端的语音和环境声音来控制装置的情况的框图;图11是根据实施例的在集成智能系统中使用输入到用户终端的语音和环境声音来生成路径规则的方法的流程图;图12是根据一个实施例的生成在智能系统中使用的训练模型的方法的流程图;图13是示出根据实施例的智能系统中执行智能服务的情况的框图;图14是示出根据实施例的智能系统中执行智能服务的情况的框图;图15是根据实施例的在集成智能系统中使用输入到用户终端的音频数据来执行智能服务的方法的流程图;以及图16是根据实施例的网络环境中的电子装置的框图。具体实施方式下面参考附图描述各种实施例。在描述实施例之前,将描述可以应用的实施例的集成智能系统。图1是根据一个实施例的集成智能系统10的示图。参照图1,集成智能系统10可以包括用户终端100、智能服务器200、个性化信息服务器300、建议服务器400和通信网络500。用户终端100可以通过存储在用户终端100中的app(或应用程序)(例如,闹钟app、消息app或图片(图库)app)向用户提供所需的服务。例如,用户终端100可以通过存储在用户终端100中的智能app(或语音识别app)本文档来自技高网
...

【技术保护点】
1.一种系统,所述系统包括:通信接口;至少一个处理器,所述至少一个处理器可操作地耦接到所述通信接口;以及至少一个存储器,所述至少一个存储器可操作地耦接到所述至少一个处理器,其中,所述至少一个存储器被配置为存储指令,所述指令被配置为使所述至少一个处理器通过所述通信接口从第一外部装置接收声音数据,使用至少一些自动语音识别模块来从所述声音数据获得语音信号和噪声信号,将所述语音信号转换为文本数据,基于至少一些所述噪声信号来确定噪声模式,以及当所述存储器工作时使用所述文本数据和所述噪声模式来确定所述声音数据的域。

【技术特征摘要】
2018.03.19 KR 10-2018-00314721.一种系统,所述系统包括:通信接口;至少一个处理器,所述至少一个处理器可操作地耦接到所述通信接口;以及至少一个存储器,所述至少一个存储器可操作地耦接到所述至少一个处理器,其中,所述至少一个存储器被配置为存储指令,所述指令被配置为使所述至少一个处理器通过所述通信接口从第一外部装置接收声音数据,使用至少一些自动语音识别模块来从所述声音数据获得语音信号和噪声信号,将所述语音信号转换为文本数据,基于至少一些所述噪声信号来确定噪声模式,以及当所述存储器工作时使用所述文本数据和所述噪声模式来确定所述声音数据的域。2.根据权利要求1所述的系统,其中,所述至少一个存储器还被配置为存储指令,所述指令被配置为使所述至少一个处理器在所述存储器工作时基于至少一些所述文本数据来确定所述声音数据的意图。3.根据权利要求2所述的系统,其中,所述至少一个存储器还被配置为存储指令,所述指令被配置为使所述至少一个处理器在所述存储器工作时确定使所述第一外部装置能够执行与所述语音信号相关的任务的状态序列。4.根据权利要求3所述的系统,其中,所述至少一个存储器还被配置为存储指令,所述指令被配置为使所述至少一个处理器在所述存储器工作时通过所述通信接口向所述第一外部装置提供所述状态序列。5.根据权利要求3所述的系统,其中,所述至少一个存储器还被配置为存储指令,所述指令被配置为使所述至少一个处理器在所述存储器工作时确定使第二外部装置能够执行与所述语音信号相关的任务的状态序列。6.根据权利要求5所述的系统,其中,所述至少一个存储器还被配置为存储指令,所述指令被配置为使所述至少一个处理器在所述至少一个存储器工作时通过所述通信接口向所述第一外部装置提供所述状态序列。7.一种用户终端,所述用户终端包括:输入模块;存储器;以及处理器,其中,所述存储器被配置为存储指令,所述指令被配置为使所述处理器通过将包括通过所述输入模块接收到的语音信号和环境声音信号的音频数据应用于使用人工智能算法训练过的训练模型,来生成通过估计所述音频数据的内容而获得的路径规则,其中,所述训练模型被配置为使用从所述环境声音信号获得的所述环境声音信号的模式来生成所述路径规则,...

【专利技术属性】
技术研发人员:金兑九朴相勇朴正煜鲁大日张东镐
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1