一种智能交互方法及装置制造方法及图纸

技术编号:20622611 阅读:31 留言:0更新日期:2019-03-20 14:26
本发明专利技术公开了一种智能交互方法及装置,该方法包括:接收文本内容;将所述文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,所述搜索场景包括意图集的提问模板场景、应答上下文场景或句子上下文信息场景;将所述音频内容返回给用户。本发明专利技术实施例提供的技术方案,设置了多种搜索场景,因此对于用户音频转换而来的文本内容及其相关的标注内容和属性可以与多种搜索场景进行匹配,从而可以实现了对音频的复杂查询,与用户可以形成有趣的互动,提高了用户体验。

An Intelligent Interactive Method and Device

The invention discloses an intelligent interactive method and device, which includes: receiving text content; matching the text content with each search scene to determine the audio content matched with the text content, the search scene includes a question template scene of an intent set, a response context scene or a sentence context information scene; and returning the audio content to use. Households. The technical scheme provided by the embodiment of the present invention sets up a variety of search scenarios, so the text content converted from user audio and its related tagging content and attributes can be matched with a variety of search scenarios, thus realizing complex audio queries, forming interesting interaction with users and improving user experience.

【技术实现步骤摘要】
一种智能交互方法及装置
本专利技术涉及人工智能
,特别是涉及一种智能交互方法及装置。
技术介绍
随着人工智能技术的发展,各大科技公司分别推出自己研制的智能音箱,并在市场上进行大力度的普及推广。智能音箱正在成为智能家居控制的入口,并且具有自然语言交互的能力,更贴近用户的使用习惯。目前智能音箱可以采用点播式进行内容播报。点播式通常被用户用来播放音频(音乐、故事、诗词、笑话等)完整的内容,用户可以说出内容的名字,然后智能音箱找到对应的音频并进行播放。专利技术人在对现有技术的研究过程中发现,用户对于点播式的优质内容,无法进行更复杂的查询,也无法形成更有趣的互动,比如用户想说:“播放春晚歌曲《岁月》中王菲唱的和声部分”,目前几乎没有智能音箱的技能可以支持。
技术实现思路
为解决上述技术问题,本专利技术实施例提供了一种智能交互方法及装置,技术方案如下:一种智能交互方法,应用于智能音箱,包括:接收文本内容;将所述文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,所述搜索场景包括意图集的提问模板场景、应答上下文场景或句子上下文信息场景;将所述音频内容返回给用户。优选地,将文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,包括:判断意图集的提问模板中是否有与所述文本内容匹配的提问模板;若有与所述文本内容匹配的提问模板,获取所述文本内容的意图和关键词的槽值名称;检索得到与所述匹配的提问模板对应的音频集;从所述音频集中检索标注有所述意图的子音频集,并从所述子音频集中检索包含所述槽值名称的音频内容,并将所述音频内容返回给用户。优选地,当没有与所述文本内容匹配的提问模板时,将文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,还包括:判断是否能从音频数据库中匹配出与所述文本内容相关的音频上下文;若能匹配出相关的音频上下文,将所述音频上下文返回给用户。优选地,若未能匹配出与所述文本内容相关的音频上下文,还包括:将所述文本内容发送给智能应答服务,并接收所述智能应答服务返回的智能应答结果;判断是否能从音频数据库中匹配出与所述智能应答结果相似度满足要求的音频;若能匹配出与所述智能应答结果相似度满足要求的音频,将所述音频返回给用户。优选地,当没有相似度满足要求的音频上下文时,将文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的文本内容,还包括:提取所述文本内容的关键词;判断是否能从句子的上下文信息中检索到与所述关键词对应的音频内容;若是,将检索到的所述音频内容返回给用户。优选地,还包括:对于每一部音频作品,将所述音频作品分割为N个音频文件,N为正整数;将分割出的所述音频文件转换成文本,对所述文本进行属性标注并确定文本的上下文信息,其中对文本进行属性标注包括确定文本的意图和文本的关键词的槽值名称;存储所述文本。一种智能交互装置,应用于智能音箱,包括:语义理解模块和音频搜索模块;所述语义理解模块,用于接收文本内容;所述音频搜索模块,用于将所述文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,所述搜索场景包括意图集的提问模板场景、应答上下文场景或句子上下文信息场景;将所述音频内容返回给用户。优选地,所述语义理解模块具体用于:提取所述文本内容的意图和关键词的槽植名称;相应地,所述音频搜索模块具体用于:判断意图集的提问模板中是否有与所述文本内容匹配的提问模板;若有与所述文本内容匹配的提问模板,获取所述文本内容的意图和关键词的槽值名称;检索得到与所述匹配的提问模板对应的音频集;从所述音频集中检索标注有所述意图的子音频集,并从所述子音频集中检索包含所述槽值名称的音频内容,并将所述音频内容返回给用户。优选地,当没有与所述文本内容匹配的提问模板时,所述音频搜索模块还用于:判断是否能从音频数据库中匹配出与所述文本内容相关的音频上下文;若能匹配出相关的音频上下文,将所述音频上下文返回给用户。优选地,若未能匹配出与所述文本内容相关的音频上下文,所述音频搜索模块还用于:将所述文本内容发送给智能应答服务,并接收所述智能应答服务返回的智能应答结果;判断是否能从音频数据库中匹配出与所述智能应答结果相似度满足要求的音频;若能匹配出与所述智能应答结果相似度满足要求的音频,将所述音频返回给用户。优选地,当没有相似度满足要求的音频上下文时,所述语义理解模块还用于:提取所述文本内容的关键词;相应地,所述音频搜索模块还用于:判断是否能从句子的上下文信息中检索到与所述关键词对应的音频内容;若是,将检索到的所述音频内容返回给用户。优选地,还包括:音频预处理模块,用于对于每一部音频作品,将所述音频作品分割为N个音频文件,N为正整数;将分割出的所述音频文件转换成文本,对所述文本进行属性标注并确定文本的上下文信息,其中对文本进行属性标注包括确定文本的意图和文本的关键词的槽值名称;存储所述文本。本专利技术实施例提供的技术方案,设置了多种搜索场景,因此对于用户音频转换而来的文本内容可以与多种搜索场景进行匹配,从而可以实现了对音频的复杂查询,与用户可以形成有趣的互动,提高了用户体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例所提供的一种智能交互方法的一种流程示意图;图2为本专利技术实施例所提供的一种智能交互方法的另一种流程示意图;图3为本专利技术实施例所提供的一种智能交互方法的另一种流程示意图;图4为本专利技术实施例所提供的一种智能交互装置的一种结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,图1为本专利技术实施例提供的一种智能交互方法中音频数据分割和标注的实现流程图,包括:步骤S101、切分音频文件。一个完整的音频内容文件,如一首歌曲或者一部影视作品的音频。可以按照某规则(如按照每句话分割,或者按照产生音频的角色分割等)。分割的方式可以通过设定静默时间的阈值或者发音者的不同特征,自动进行分割;也可以采用某些编辑软件手工分割。分割后需要进行一些检查核对修复工作。步骤S102、对切分后的文件进行多种属性的标注。切分后的音频文件,首先需要获取其对应的文本内容。这些文本内容可以来自音频相关的字幕信息,也可以通过目前的语音转文字服务,由其转换成文字。之后对文本进行属性标注并确定文本的上下文信息。对文本进行属性标注包括确定文本的意图和文本的关键词的槽值名称。文本的意图也可以称之为文本的标签,意在表示文本所表达的意图。比如句子内容为“大黄蜂,你做的很好”,表达的就是“评价”或者“鼓励”的意图,比如句子内容“很快,我们就可以控制海洋了,哈哈哈”,表达的是“计划”或者“愿望”这个意图。对于转换而来的文本,可以由人工的方式标注出来文本所对应的一个或者多个意图,有了一定的人工本文档来自技高网...

【技术保护点】
1.一种智能交互方法,其特征在于,应用于智能音箱,包括:接收文本内容;将所述文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,所述搜索场景包括意图集的提问模板场景、应答上下文场景或句子上下文信息场景;将所述音频内容返回给用户。

【技术特征摘要】
1.一种智能交互方法,其特征在于,应用于智能音箱,包括:接收文本内容;将所述文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,所述搜索场景包括意图集的提问模板场景、应答上下文场景或句子上下文信息场景;将所述音频内容返回给用户。2.根据权利要求1所述的方法,其特征在于,将文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,包括:判断意图集的提问模板中是否有与所述文本内容匹配的提问模板;若有与所述文本内容匹配的提问模板,获取所述文本内容的意图和关键词的槽值名称;检索得到与所述匹配的提问模板对应的音频集;从所述音频集中检索标注有所述意图的子音频集,并从所述子音频集中检索包含所述槽值名称的音频内容,并将所述音频内容返回给用户。3.根据权利要求2所述的方法,其特征在于,当没有与所述文本内容匹配的提问模板时,将文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的音频内容,还包括:判断是否能从音频数据库中匹配出与所述文本内容相关的音频上下文;若能匹配出相关的音频上下文,将所述音频上下文返回给用户。4.根据权利要求3所述的方法,其特征在于,若未能匹配出与所述文本内容相关的音频上下文,还包括:将所述文本内容发送给智能应答服务,并接收所述智能应答服务返回的智能应答结果;判断是否能从音频数据库中匹配出与所述智能应答结果相似度满足要求的音频;若能匹配出与所述智能应答结果相似度满足要求的音频,将所述音频返回给用户。5.根据权利要求4所述的方法,其特征在于,当没有相似度满足要求的音频时,将文本内容与每一搜索场景进行匹配,以确定与所述文本内容匹配的文本内容,还包括:提取所述文本内容的关键词;判断是否能从句子的上下文信息中检索到与所述关键词对应的音频内容;若是,将检索到的所述音频内容返回给用户。6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:对于每一部音频作品,将所述音频作品分割为N个音频文件,N为正整数;将分割出的所述音频文件转换成文本,对所述文本进行属性标注并确定文本的上下文信息,其中对文本进行属性标注包括确定文本的意图和文本的关键词的槽值名称;存储所述文本。7.一种智能交互装置,其特征在于,...

【专利技术属性】
技术研发人员:侯桂森
申请(专利权)人:廊坊市森淼春食用菌有限公司
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1