基于人工智能的语音交互方法和装置制造方法及图纸

技术编号:15799488 阅读:148 留言:0更新日期:2017-07-11 13:33
本发明专利技术提出一种基于人工智能的语音交互方法和装置,其中,方法包括:通过当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字。进而对该文字进行识别,得到用户的交互需求和交互类型。根据交互类型,选择电视业务的展示界面,或者选择电视业务的展示界面上方显示的悬浮窗口,反馈用户的交互需求。由于根据交互类型,选择与交互需求相适应的反馈呈现方式,以提高语音交互的呈现效果,避免语音交互过程对用户使用智能电视的过程造成干扰,解决现有技术中语音交互呈现效果较差的技术问题。

Method and apparatus for voice interaction based on Artificial Intelligence

The invention provides an artificial intelligent voice interaction method and device, the method includes: when the probe to begin by interactive voice, voice acquisition and user input, the corresponding text recognition. Then the text is recognized to obtain the user's interactive requirements and types of interaction. According to the interaction type, select the display interface of the TV business, or select the suspending window displayed on the display screen of the TV business, and feedback the interactive demands of the users. According to the type of interaction, to adapt to the needs of the feedback selection and interactive presentation, in order to improve the voice interactive rendering effect, avoid voice interaction cause interference on the process of smart TV users, solve the technical problems of voice interactive rendering is poor in the prior art.

【技术实现步骤摘要】
基于人工智能的语音交互方法和装置
本专利技术涉及互联网
,尤其涉及一种基于人工智能的语音交互方法和装置。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,人工智能最重要的方面就是语音识别技术。现有技术中,在智能电视产品中已经应用了语音识别技术进行语音交互,极大方便了智能电视的使用。但是,由于现有技术中当需要对用户的语音进行反馈时,往往单一地采用对话的方式,或者,采用独立的页面进行反馈,对用户观看电视,或者使用智能电视的过程造成了干扰,语音交互的呈现效果不佳。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于人工智能的语音交互方法,以提高语音交互的呈现效果,避免语音交互过程对用户使用智能电视的过程造成干扰。本专利技术的第二个目的在于提出一种基于人工智能的语音交互装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技术第一方面实施例提出了一种基于人工智能的语音交互方法,包括:当探测到进行语音交互时,采集用户输入的语音,识别得到对应的文字;对语音对应的文字进行识别,得到用户的交互类型和交互需求;根据交互类型,选择电视业务的展示界面,或者选择电视业务展示界面的上方显示的悬浮窗口,反馈用户的交互需求。本专利技术实施例的基于人工智能的语音交互方法,通过当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字。进而对该文字进行识别,得到用户的交互需求和交互类型。根据交互类型,选择电视业务的展示界面,或者选择电视业务的展示界面上方显示的悬浮窗口,反馈用户的交互需求。由于根据交互类型,选择与交互需求相适应的反馈呈现方式,以提高语音交互的呈现效果,避免语音交互过程对用户使用智能电视的过程造成干扰,解决现有技术中语音交互呈现效果较差的技术问题。为达上述目的,本专利技术第二方面实施例提出了一种基于人工智能的语音交互的装置,包括:采集模块,用于当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字;识别模块,用于对所述语音对应的文字进行识别,得到用户的交互需求和交互类型;反馈模块,用于根据所述交互类型,选择所述电视业务的展示界面,或者选择所述电视业务的展示界面上方显示的悬浮窗口,反馈所述用户的交互需求。本专利技术实施例的基于人工智能的语音交互装置中,采集模块用于当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字。识别模块用于对语音对应的文字进行识别,得到用户的交互需求和交互类型。反馈模块用于根据交互类型,选择电视业务的展示界面,或者选择电视业务的展示界面上方显示的悬浮窗口,反馈用户的交互需求。由于根据交互类型,选择与交互需求相适应的反馈呈现方式,以提高语音交互的呈现效果,避免语音交互过程对用户使用智能电视的过程造成干扰,解决现有技术中语音交互呈现效果较差的技术问题。为达上述目的,本专利技术第三方面实施例还提出了一种计算机设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,用于执行第一方面所述的方法。为达上述目的,本专利技术第四方面实施例还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,执行第一方面所述的方法。为达上述目的,本专利技术第五方面实施例还提出了一种计算机程序产品,当所述程序产品中的指令被处理器执行时,执行第一方面所述的方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例所提供的一种基于人工智能的语音交互方法的流程示意图;图2为本专利技术实施例提供的一种语音采集流程示意图;图3为本专利技术实施例提供的一种文字语义识别的流程示意图;图4为本专利技术实施例所提供的另一种基于人工智能的语音交互方法的流程示意图;图5a是本专利技术实施例的一种基于人工智能的语音交互方法的示例性操作示意图之一;图5b是本专利技术实施例的一种基于人工智能的语音交互方法的示例性操作示意图之二;图5c是本专利技术实施例的一种基于人工智能的语音交互方法的示例性操作示意图之三;图5d是本专利技术实施例的一种基于人工智能的语音交互方法的示例性操作示意图之四;图5e是本专利技术实施例的一种基于人工智能的语音交互方法的示例性操作示意图之五;图5f是本专利技术实施例的一种基于人工智能的语音交互方法的示例性操作示意图之六;图5g是本专利技术实施例的一种基于人工智能的语音交互方法的示例性操作示意图之七;图6为本专利技术实施例所提供的一种基于人工智能的语音交互装置的结构示意图;以及图7为本专利技术实施例所提供的另一种基于人工智能的语音交互装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的基于人工智能的语音交互方法和装置。图1为本专利技术实施例所提供的一种基于人工智能的语音交互方法的流程示意图。如图1所示,该基于人工智能的语音交互方法包括以下步骤:步骤101,当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字。具体地,在进行语音交互之前,需要先打开进行语音交互的悬浮窗口。在用户进行语音输入的过程中,悬浮窗口采集用户输入的语音,将所采集的语音发送至服务器,将语音识别成对应的文字,并在悬浮窗口中实时显示。步骤102,对语音对应的文字进行识别,得到用户的交互需求和交互类型。具体地,对用户语音进行文字识别后,将语音对应的文字发送到服务器进行语义的识别,并进行数据分类,得到用户的交互需求和交互类型。这里的交互类型可以包括电视业务,其余非电视业务可以称为资讯业务。交互需求包括了信息查询、音量控制、显示控制等等。例如:基于电视业务的交互需求包括搜索电影,搜索电视节目,音量大小调节、屏幕亮度调节等等,基于资讯业务的交互需求包括查询天气状况,查看专辑等等。步骤103,根据交互类型,选择电视业务的展示界面,或者电视业务的展示界面的上方显示的悬浮窗口,反馈用户的交互需求。具体地,交互类型分为电视业务和资讯类业务,当交互类型为电视业务时,将用户的交互需求在电视业务的展示界面中反馈,当交互类型为资讯类业务时,将用户的交互需求在电视业务的展示界面上方显示的悬浮窗口中反馈。为了进一步解释说明上述步骤101,作为一种可能的实现方式,图2为本专利技术实施例提供的一种语音采集流程示意图。如图2所示,步骤101包括以下子步骤:步骤1011,麦克风初始化。具体地,当本文档来自技高网...
基于人工智能的语音交互方法和装置

【技术保护点】
一种基于人工智能的语音交互方法,其特征在于,包括以下步骤:当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字;对所述语音对应的文字进行识别,得到用户的交互需求和交互类型;根据所述交互类型,选择所述电视业务的展示界面,或者选择所述电视业务的展示界面上方显示的悬浮窗口,反馈所述用户的交互需求。

【技术特征摘要】
1.一种基于人工智能的语音交互方法,其特征在于,包括以下步骤:当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字;对所述语音对应的文字进行识别,得到用户的交互需求和交互类型;根据所述交互类型,选择所述电视业务的展示界面,或者选择所述电视业务的展示界面上方显示的悬浮窗口,反馈所述用户的交互需求。2.根据权利要求1所述的基于人工智能的语音交互方法,其特征在于,所述根据所述交互类型,选择所述电视业务的展示界面,或者选择所述电视业务的展示界面上方显示的悬浮窗口,反馈所述用户的交互需求,包括:当所述交互类型为电视业务时,在所述电视业务的展示界面内,反馈所述用户的交互需求;当所述交互类型为资讯业务时,在所述电视业务的展示界面上方显示的悬浮窗口内,反馈所述用户的交互需求。3.根据权利要求2所述的基于人工智能的语音交互方法,其特征在于,所述当所述交互类型为电视业务时,在所述电视业务的展示界面内,反馈所述用户的交互需求,包括:当所述交互需求为搜索内容的关键字时,在所述电视业务中,搜索目标内容,其中,所述目标内容与所述交互需求所指示的关键字匹配;若搜索到所述目标内容,隐藏所述悬浮窗口,并在所述电视业务的展示界面内,显示所述目标内容。4.根据权利要求2所述的基于人工智能的语音交互方法,其特征在于,所述电视业务的展示界面上方显示的悬浮窗口包括第一悬浮窗口;所述当所述交互类型为资讯业务时,在所述电视业务的展示界面上方显示的悬浮窗口内,反馈所述用户的交互需求,包括:当所述交互类型为资讯业务时,在所述第一悬浮窗口内,反馈所述用户的交互需求。5.根据权利要求4所述的基于人工智能的语音交互方法,其特征在于,所述当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字,包括:当探测到开始进行语音交互时,显示所述第一悬浮窗口;采集用户输入的语音,将所采集到的语音转化为相应的文字;在所述第一悬浮窗口内显示所述文字。6.根据权利要求5所述的基于人工智能的语音交互方法,其特征在于,所述在所述第一悬浮窗口内,反馈所述用户的交互需求之前,还包括:扩展所述第一悬浮窗口的显示大小。7.根据权利要求4所述的基于人工智能的语音交互方法,其特征在于,所述电视业务的展示界面上方显示的悬浮窗口还包括第二悬浮窗口,其中,第一悬浮窗口浮于所述第二悬浮窗口上方,或者,所述第二悬浮窗口与所述第一悬浮窗口不重叠;所述当探测到开始进行语音交互时,采集用户输入的语音,识别得到对应的文字,包括:当探测到开始进行语音交互时,显示所述第二悬浮窗口;采集用户输入的语音,将所采集到的语音转化为相应的文字;在所述第二悬浮窗口内显示所述文字。8.根据权利要求1-7任一项所述的基于人工智能的语音交互方法,其特征在于,所述采集用户输入的语音,识别得到对应的文字,包括:在采集用户语音的过程中,将所采集到的语音发送至服务器,并从所述服务器获取所述语音对应的文字。9.根据权利要求8所述的基于人工智能的语音交互方法,其特征在于,所述对所述语音对应的文字进行识别,得到用户的交互需求和交互类型,包括:当采集语音结束时,将所述语音对应的文字发送至服务器,并从所述服务器获取对所述文字解析所得到的交互需求和交互...

【专利技术属性】
技术研发人员:侯在鹏赵毅马悦李静张岩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1