基于语音识别的内容搜索方法、装置、计算机设备及介质制造方法及图纸

技术编号:39193345 阅读:9 留言:0更新日期:2023-10-27 08:40
本申请涉及语音识别技术领域,具体公开了一种基于语音识别的内容搜索方法、装置、计算机设备及介质。该方法可在用户允许用户媒体获得接口访问音频采集设备时,获取包含用户语音的媒体流,利用语音服务控制接口对媒体流中的语音进行提取,获得用户语音,基于语音识别接口,调用语音识别服务对语音进行识别,获得用户语音对应的文本信息,进而根据文本信息进行搜索获得用户所需的内容,利用语音识别技术,提高了用户输入效率,进而提高了用户搜索内容的效率。的效率。的效率。

【技术实现步骤摘要】
基于语音识别的内容搜索方法、装置、计算机设备及介质


[0001]本申请涉及语音识别
,尤其涉及一种基于语音识别的内容搜索方法、装置、计算机设备及介质。

技术介绍

[0002]语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列,通过语音识别技术可以将输入的语音转换为文本。鉴于现在大多搜索组件都是手动输入,对于某些用户其实并不友好,在有些时候手动输入也并不方便,并且在长关键字搜索时,基于语音输入的搜索方法效率更高,更加省事方便。因此,如何利用语音识别技术,提高用户搜索内容的效率成为了亟需解决的问题。

技术实现思路

[0003]本申请提供了一种基于语音识别的内容搜索方法、装置、计算机设备及介质,以提高用户搜索内容的效率。
[0004]第一方面,本申请提供了一种基于语音识别的内容搜索方法,所述方法包括:
[0005]在检测到用户操作时,调用媒体输入授权接口,获得用户授权结果;
[0006]调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流;
[0007]基于语音服务控制接口,获取所述媒体流中的用户语音;
[0008]调用语音识别接口,对所述用户语音进行识别,获得文本信息,并基于所述文本信息,获取与所述文本信息相匹配的信息内容。
[0009]进一步地,所述调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流,包括:
[0010]调用所述用户媒体获得接口,访问音频采集设备,生成承诺对象;
[0011]在所述用户授权结果为用户允许时,调用与所述承诺对象对应的第一回调函数,采集音频信息,生成所述媒体流。
[0012]进一步地,所述调用所述用户媒体获得接口,访问音频采集设备,生成承诺对象之后,还包括:
[0013]在所述用户授权结果为用户拒绝时,调用与所述承诺对象对应的第二回调函数,生成异常提示;
[0014]基于所述异常提示,发起授权提示页面,并重新调用所述授权许可接口,获取用户授权结果。
[0015]进一步地,所述调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流之后,还包括:
[0016]调用语音服务控制接口,确定所述媒体流中是否存在所述用户语音;
[0017]在所述媒体流中不存在所述用户语音时,发起语音获取失败提示,以提醒用户未接收到所述用户语音。
[0018]进一步地,所述调用语音识别接口,对所述用户语音进行识别,获得文本信息,并基于所述文本信息,获取与所述文本信息相匹配的信息内容,包括:
[0019]基于所述语音识别接口,调用预设的语音识别服务,对所述用户语音进行识别,获得所述文本信息;
[0020]对所述文本信息进行语义分析,获得所述文本信息对应的语义信息;
[0021]基于所述语义信息,在后端服务器中查找与所述语义信息相匹配的信息内容。
[0022]进一步地,所述调用语音识别接口,对所述用户语音进行识别之后,还包括:
[0023]在所述用户语音识别失败时,发起语音识别提示页面,以提醒用户语音转换失败。
[0024]进一步地,所述调用语音识别接口,对所述用户语音进行识别,获得文本信息,并基于所述文本信息,获取与所述文本信息相匹配的信息内容之后,还包括:
[0025]基于所述信息内容,生成信息展示页面,以向用户展示所述信息内容。
[0026]第二方面,本申请还提供了一种基于语音识别的内容搜索装置,所述装置包括:
[0027]授权结果获得模块,用于在检测到用户操作时,调用媒体输入授权接口,获得用户授权结果;
[0028]媒体流生成模块,用于调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流;
[0029]用户语音获取模块,用于基于语音服务控制接口,获取所述媒体流中的用户语音;
[0030]信息内容获取模块,用于调用语音识别接口,对所述用户语音进行识别,获得文本信息,并基于所述文本信息,获取与所述文本信息相匹配的信息内容。
[0031]第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的基于语音识别的内容搜索方法。
[0032]第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的基于语音识别的内容搜索方法。
[0033]本申请公开了一种基于语音识别的内容搜索方法、装置、计算机设备及介质,在检测到用户操作时,调用媒体输入授权接口,获得用户授权结果;调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流;基于语音服务控制接口,获取所述媒体流中的用户语音;调用语音识别接口,对所述用户语音进行识别,获得文本信息,并基于所述文本信息,获取与所述文本信息相匹配的信息内容。该方法可在用户允许用户媒体获得接口访问音频采集设备时,获取包含用户语音的媒体流,利用语音服务控制接口对媒体流中的语音进行提取,获得用户语音,基于语音识别接口,调用语音识别服务对语音进行识别,获得用户语音对应的文本信息,进而根据文本信息进行搜索获得用户所需的内容,利用语音识别技术,提高了用户输入效率,进而提高了用户搜索内容的效率。
附图说明
[0034]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本申请的实施例提供的一种基于语音识别的内容搜索方法的第一实施例示意流程图;
[0036]图2是本申请的实施例提供的一种基于语音识别的内容搜索方法的实施步骤流程图;
[0037]图3是本申请的实施例提供的一种基于语音识别的内容搜索方法的第二实施例示意流程图;
[0038]图4是本申请的实施例提供的一种基于语音识别的内容搜索方法的第三实施例示意流程图;
[0039]图5为本申请的实施例提供的一种基于语音识别的内容搜索装置的示意性框图;
[0040]图6为本申请的实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
[0041]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的内容搜索方法,其特征在于,包括:在检测到用户操作时,调用媒体输入授权接口,获得用户授权结果;调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流;基于语音服务控制接口,获取所述媒体流中的用户语音;调用语音识别接口,对所述用户语音进行识别,获得文本信息,并基于所述文本信息,获取与所述文本信息相匹配的信息内容。2.根据权利要求1所述的基于语音识别的内容搜索方法,其特征在于,所述调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流,包括:调用所述用户媒体获得接口,访问音频采集设备,生成承诺对象;在所述用户授权结果为用户允许时,调用与所述承诺对象对应的第一回调函数,采集音频信息,生成所述媒体流。3.根据权利要求2所述的基于语音识别的内容搜索方法,其特征在于,所述调用所述用户媒体获得接口,访问音频采集设备,生成承诺对象之后,还包括:在所述用户授权结果为用户拒绝时,调用与所述承诺对象对应的第二回调函数,生成异常提示;基于所述异常提示,发起授权提示页面,并重新调用所述授权许可接口,获取用户授权结果。4.根据权利要求1所述的基于语音识别的内容搜索方法,其特征在于,所述调用用户媒体获得接口,访问音频采集设备,并在所述用户授权结果为用户允许时,采集音频信息,生成媒体流之后,还包括:调用语音服务控制接口,确定所述媒体流中是否存在所述用户语音;在所述媒体流中不存在所述用户语音时,发起语音获取失败提示,以提醒用户未接收到所述用户语音。5.根据权利要求1所述的基于语音识别的内容搜索方法,其特征在于,所述调用语音识别接口,对所述用户语音进行识别,获得文本信息,并基于所述文本信息,获取与所述文本信息相匹配的信息内容,包括:基于所述语音识别接口,调用预设的...

【专利技术属性】
技术研发人员:黄国辉陶建伟
申请(专利权)人:广州三叠纪元智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1