电子装置及其控制方法制造方法及图纸

技术编号:25409297 阅读:41 留言:0更新日期:2020-08-25 23:11
提供了一种电子设备,包括包含电路的麦克风、包含电路的扬声器和电连接到麦克风和扬声器的处理器,其中,处理器被配置为,当通过麦克风输入了第一用户语音时,识别发出第一用户语音的用户,并通过扬声器提供通过将第一用户语音输入到经过人工智能算法训练的人工智能模型中而获取的第一响应声音,当通过麦克风输入了第二用户语音时,识别发出第二用户语音的用户,且如果发出第一用户语音的用户与发出第二用户语音的用户相同,则通过扬声器提供通过将第二用户语音和话语历史信息输入到人工智能模型中而获取的第二响应声音。特别是,提供对用户语音的响应声音的至少一些方法可以使用根据机器学习、神经网络或深度学习算法中的至少一种进行过学习的人工智能模型。

【技术实现步骤摘要】
【国外来华专利技术】电子装置及其控制方法
本公开涉及电子设备及其控制方法,特别涉及识别用户语音并根据识别出的用户语音提供各种交互的电子设备及其控制方法。本公开进一步涉及使用机器学习算法模拟人类大脑功能诸如识别或确定的人工智能(AI)系统及其应用。
技术介绍
近年来,实现人类智能水平的人工智能系统已应用于各个领域。与传统的基于规则的智能系统不同,人工智能系统是一个机器自身训练、确定并变得智能的系统。随着人工智能系统的使用,提高了识别率,更准确地理解用户喜好,因此,传统的基于规则的系统逐渐被基于深度学习的人工智能系统所取代。人工智能技术由机器学习(如深度学习)和使用机器学习的基本技术组成。机器学习是对输入数据的特征进行自分类/自训练的算法技术,而基本技术是利用机器学习算法(诸如深度学习)来模拟人类大脑功能诸如识别或确定的技术,由语言理解、视觉理解、推理/预测、知识表示、操作控制等等
组成。人工智能技术应用于如下各个领域。语言理解是识别人类语言/字母并对其进行应用/处理的技术,且包括自然语言处理、机器翻译、转换系统、问答、语音识别/合成,等等。视觉理解是从人类角度来识别物体并对其进行处理的技术,且包括物体识别、物体跟踪、图像搜索、人体识别、场景理解、空间理解、图像改进,等等。推理/预测是识别信息并对其进行逻辑推理和预测的技术,且包括基于知识/可能性的推理、优化预测、基于喜好的规划、推荐,等等。知识表示是执行将人类的实验信息自动处理为知识数据的技术,且包括知识构建(数据生成/分类)、知识管理(数据应用),等等。操作控制是控制车辆自动行驶或机器人运动的技术,且包括运动控制(导航、碰撞或行走)、操作控制(行为控制),等等。与此同时,传统上已经开发出识别用户语音并根据识别出的用户语音提供各种交互的电子设备。此外,电子设备不仅可以对一次性的用户语音进行响应,还可以接收连续的用户语音,并通过反映话语历史提供响应。然而,当在连续的用户语音之间接收到另一个用户的用户语音时,电子设备无法区分这些语音,并会提供完全错误的响应。
技术实现思路
技术问题本公开是基于上述需要而作出的,且本公开的目的是提供尽管用户的语音分别来自多个用户的输入,也能提供具有维持上下文的响应的电子设备及其控制方法。技术方案为实现上述目标,根据本公开的实施例,提供了一种电子设备,包括麦克风、扬声器和配置为电连接到麦克风和扬声器的处理器,其中处理器被配置为,基于通过麦克风输入了第一用户语音,识别发出第一用户语音的用户,通过扬声器提供通过将第一用户语音输入到经过人工智能算法训练的人工智能模型中而获取的第一响应声音,基于通过麦克风输入了第二用户语音,识别发出第二用户语音的用户,并基于发出第一用户语音的用户与发出第二用户语音的用户相同,通过扬声器提供通过将第二用户语音和话语历史信息输入到人工智能模型中而获取的第二响应声音。该设备可以进一步包括存储器,且处理器可以被配置为,基于发出第二用户语音的用户与发出第一用户语音的用户不同,将第二用户语音存储在存储器中,以及基于发出第一用户语音的用户在预定时间周期或更长时间里未输入用户语音,提供通过输入第二用户语音到人工智能模型中而获取的第三响应声音。处理器可以被配置为,基于输入的第一用户语音,识别发出第一用户语音的第一用户,并通过扬声器提供通过将第一用户语音输入到人工智能模型中而获取的第一响应声音,以及基于输入的第二用户语音,识别发出第二用户语音的第二用户,并通过扬声器提供通过将第二用户语音输入到人工智能模型中而获取的区别于第一响应声音的第三响应声音。处理器可以被配置为,基于第一用户输入了第一附加用户语音,通过扬声器提供通过将第一附加用户语音和与第一用户语音相对应的第一话语历史信息输入到人工智能模型中而获取的第一附加响应声音,以及基于第二用户输入了第二附加用户语音,通过扬声器提供通过将第二附加用户语音和与第二用户语音相对应的第二话语历史信息输入到人工智能模型中而获取的区别于第一附加响应声音的第二附加响应声音。该设备可以进一步包括电连接到处理器的显示器,且处理器可以配置为,在提供第一附加响应声音时,通过显示器显示与第一用户相对应的第一UI,以及在提供第二附加响应声音时,通过显示器显示与第二用户相对应的第二UI。处理器可以配置为,基于发出第一用户语音的用户与发出第二用户语音的用户不同,获取与第一用户语音对应的第一域和与第二用户语音对应的第二域,以及基于第一域与第二域相同,通过扬声器提供通过向人工智能模型输入第二用户语音和话语历史信息而获取的第二响应声音。该设备可以进一步包括电连接到处理器的存储器,并且处理器可以被配置为,基于在从第一用户语音输入时起的第一预定时间周期内输入的了第二用户语音,发出第一用户语音的用户与发出第二用户语音的用户相同,且与第一用户语音对应的第一域不同于与第二用户语音对应的第二域,可以将第一用户语音存储在存储器中,而不提供第一响应声音,并通过扬声器提供通过将第二用户语音输入到人工智能模型中而获取的第三响应声音。处理器可以配置为,基于用户在第二预定时间周期内或更长时间内未输入与第二域对应的用户语音,通过扬声器提供通过将存储在存储器中的第一用户语音输入到人工智能模型中而获取的第一响应声音。该设备可以进一步包括相机,并且处理器可以被配置为,基于相机捕获的图像或通过麦克风输入的用户语音中的至少一个,来识别用户。处理器可以被配置为,基于在输入第一用户语音的时间周期内包含在图像中的用户嘴形,来识别发出第一用户语音的用户,以及基于在输入第二用户语音时间周期内包含在图像中的已识别出的用户嘴形发生了变化,识别出发出第二用户语音的用户与发出第一用户语音的用户相同。根据本公开的实施例,提供电子设备的控制方法,该方法包括,基于输入了第一用户语音,识别发出第一用户语音的用户,提供通过将第一用户语音输入到经过人工智能算法训练的人工智能模型中而获取的第一响应声音,基于输入了第二用户语音,识别发出第二用户语音的用户,并基于发出第一用户语音的用户与发出第二用户语音的用户相同,提供通过将第二用户语音和话语历史信息输入到人工智能模型中而获取的第二响应声音。该方法可以进一步包括,基于发出第二用户语音的用户与发出第一用户语音的用户不同,存储第二用户语音,以及基于发出第一用户语音的用户在预定时间周期或更长时间里未输入用户语音上,提供通过输入第二用户语音到人工智能模型中而获取的第三响应声音。识别发出第一用户语音的用户可以包括基于输入的第一用户语音识别发出第一用户语音的第一用户,提供第一响应声音可以包括提供通过向人工智能模型输入第一用户语音而获取的第一响应声音,识别发出第二用户语音的用户可以包括识别发出第二用户语音的第二用户,并且该方法还可以包括提供通过将第二用户语音输入到人工智能模型中而获取的区别于第一响应声音的第三响应声音。该方法可以进一步包括,基于第一用户输入了第一附加用户语音,提供通过将第一附加用户语音和与第一用户语音相对应的第一话语本文档来自技高网
...

【技术保护点】
1.一种电子装置,包括:/n包括电路的麦克风;/n包括电路的扬声器;以及/n电连接到所述麦克风和所述扬声器的处理器,/n其中所述处理器被配置为,/n基于通过所述麦克风输入了第一用户语音,识别发出所述第一用户语音的用户,并通过所述扬声器提供通过将所述第一用户语音输入到经过人工智能算法训练的人工智能模型中而获取的第一响应声音,/n基于通过所述麦克风输入了第二用户语音,识别发出所述第二用户语音的用户,并基于发出所述第一用户语音的用户与发出所述第二用户语音的用户相同,通过所述扬声器提供通过将所述第二用户语音和话语历史信息输入到所述人工智能模型中而获取的第二响应声音。/n

【技术特征摘要】
【国外来华专利技术】20180223 KR 10-2018-00218761.一种电子装置,包括:
包括电路的麦克风;
包括电路的扬声器;以及
电连接到所述麦克风和所述扬声器的处理器,
其中所述处理器被配置为,
基于通过所述麦克风输入了第一用户语音,识别发出所述第一用户语音的用户,并通过所述扬声器提供通过将所述第一用户语音输入到经过人工智能算法训练的人工智能模型中而获取的第一响应声音,
基于通过所述麦克风输入了第二用户语音,识别发出所述第二用户语音的用户,并基于发出所述第一用户语音的用户与发出所述第二用户语音的用户相同,通过所述扬声器提供通过将所述第二用户语音和话语历史信息输入到所述人工智能模型中而获取的第二响应声音。


2.如权利要求1所述的电子装置,进一步包括:
包括电路的存储器;
其中所述处理器被配置为,
基于发出所述第二用户语音的用户与发出所述第一用户语音的用户不同,将所述第二用户语音存储在所述存储器中,以及
基于发出所述第一用户语音的用户在预定时间周期或更长时间里未输入用户语音,提供通过输入所述第二用户语音到所述人工智能模型中而获取的第三响应声音。


3.如权利要求1所述的电子装置,其中,所述处理器被进一步配置为,
基于输入的所述第一用户语音,识别发出所述第一用户语音的第一用户,并通过所述扬声器提供通过将所述第一用户语音输入到所述人工智能模型中而获取的所述第一响应声音,以及
基于输入的所述第二用户语音,识别发出所述第二用户语音的第二用户,并通过所述扬声器提供通过将所述第二用户语音输入到所述人工智能模型中而获取的区别于所述第一响应声音的第三响应声音。


4.如权利要求3所述的电子装置,其中,所述处理器被进一步配置为,
基于所述第一用户输入了第一附加用户语音,通过所述扬声器提供通过将所述第一附加用户语音和与所述第一用户语音相对应的第一话语历史信息输入到所述人工智能模型中而获取的第一附加响应声音,以及
基于所述第二用户输入了第二附加用户语音,通过所述扬声器提供通过将所述第二附加用户语音和与所述第二用户语音相对应的第二话语历史信息输入到所述人工智能模型中而获取的区别于所述第一附加响应声音的第二附加响应声音。


5.如权利要求4所述的电子装置,进一步包括:
电连接到所述处理器的显示器,
其中,所述处理器被进一步配置为,在提供所述第一附加响应声音时,控制所述显示器显示与所述第一用户相对应的第一UI,以及在提供所述第二附加响应声音时,控制所述显示器显示与所述第二用户相对应的第二UI。


6.如权利要求1所述的电子装置,其中,所述处理器被进一步配置为,
基于发出所述第一用户语音的用户与发出所述第二用户语音的用户不同,获取与所述第一用户语音对应的第一域和与所述第二用户语音对应的第二域,以及
基于所述第一域与所述第二域相同,通过所述扬声器提供通过向所述人工智能模型输入所述第二用户语音和所述话语历史信息而获取的所述第二响应声音。


7.如权利要求1所述的电子装置,进一步包括:
电连接到所述处理器的存储器,
其中,所述处理器被进一步配置为,基于在当所述第一用户语音输入后的第一预定时间周期内输入了所述第二用户语音、发出所述第一用户语音的用户与发出所述第二用户语音的用户相同、并且与所述第一用户语音...

【专利技术属性】
技术研发人员:崔馨铎高炫睦金芝希金泓澈黄寅喆
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1