语音互动方法和装置制造方法及图纸

技术编号:17201400 阅读:46 留言:0更新日期:2018-02-04 02:28
本申请提供了一种语音互动方法和装置。其中,先获取推送信息对应的第一文本信息,并展示所述第一文本信息。然后将所述第一文本信息转换为第一拼音字符串。之后接收用户输入的语音,将所述语音提供给服务器进行语音识别,并从所述服务器获得通过语音识别得到的第二文本信息。将所述第二文本信息转换为第二拼音字符串。确定所述第一拼音字符串与所述第二拼音字符串的相似度。根据所述相似度和预设的阈值确定互动结果,并根据所述互动结果执行所述互动结果对应的操作。本申请的语音互动方式比较新颖,增加了用户与广告之间的互动,在满足广告商利益的情况下,增强了用户观看的趣味性,提高了用户体验。

【技术实现步骤摘要】
语音互动方法和装置
本申请涉及互联网
,特别涉及一种语音互动方法和装置。
技术介绍
随着互联网的发展,广告主通过各种形式在互联网上投放广告。例如,在视频网站中,播放电视剧、电影、综艺节目等视频之前会有一段广告。通常,用户需要看完整段广告才可以看到电视剧、电影、综艺节目等视频,或者,用户需要付费成为会员,才可以不用看广告。
技术实现思路
本申请的目的在于提供一种语音互动方法和装置,在用户观看视频的过程中,通过和广告进行互动,可以跳过广告。本申请实施例提供了一种语音互动方法,该方法包括:获取推送信息对应的第一文本信息,展示所述第一文本信息;将所述第一文本信息转换为第一拼音字符串;接收用户输入的语音;将所述语音提供给服务器进行语音识别,并从所述服务器获得通过语音识别得到的第二文本信息;将所述第二文本信息转换为第二拼音字符串;确定所述第一拼音字符串与所述第二拼音字符串的相似度;根据所述相似度和预设的阈值确定互动结果,并根据所述互动结果执行所述互动结果对应的操作。另外,本申请实施例提供了一种语音互动装置,该装置包括:第一文本获取模块,用于获取推送信息对应的第一文本信息,展示所述第一文本信息;第一转换模块,用于将所述第一文本信息转换为第一拼音字符串;语音接收模块,接收用户输入的语音;收发模块,用于将所述语音提供给服务器进行语音识别,并从所述服务器获得通过语音识别得到的第二文本信息;第二转换模块,用于将所述第二文本信息转换为第二拼音字符串;相似度确定模块,用于确定所述第一拼音字符串与所述第二拼音字符串的相似度;操作模块,用于根据所述相似度和预设的阈值确定互动结果,并根据所述互动结果执行所述互动结果对应的操作。本申请实施例的语音互动方式比较新颖,增加了用户与广告之间的互动,在满足广告商利益的情况下,增强了用户观看的趣味性,提高了用户体验。附图说明为了更清楚的说明本申请中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。其中,图1为根据本申请实施例的语音互动方法和装置的应用场景示意图;图2a至2e为根据本申请实施例的语音互动用户界面示意图;图3为根据本申请实施例的语音互动方法流程图;图4为根据本申请实施例的语音互动方法流程图;图5为根据本申请实施例的语音互动装置示意图;图6为根据本申请实施例的语音互动装置的硬件结构示意图。具体实施方式以下结合说明书附图及具体实施例进一步说明本申请。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。图1为根据本申请实施例的语音互动方法和装置的应用场景示意图,其中包括终端设备10、业务供应商服务器20、网络30、广告商设备40。终端设备10和业务供应商服务器20通过网络30进行有线或无线通信。广告商设备40可以和业务供应商服务器20通过网络30或其他网络进行通信。终端设备10可以为手机、智能电话、笔记本电脑、台式电脑、PDA(个人数字助理)、PAD(平板电脑)、掌上电脑、PMP(便携式多媒体播放器)、穿戴式设备(比如智能手环、智能手表等)等等。终端设备10可以包括:处理器(例如CPU)、存储器、通信总线。其中,通信总线用于实现该终端设备中各组成部件之间的连接通信。另外,终端设备可以包括用户接口,例如,显示屏、键盘、鼠标等组件,用于接收用户输入的信息,并将接收的信息发送至处理器进行处理。显示屏可以为LCD显示屏、LED显示屏,也可以为触摸屏。可选用户接口还可以包括标准的有线接口、无线接口(如WI-FI接口)等网络接口。存储器可以是高速RAM存储器,也可以是非易失性存储器,例如磁盘存储器。存储器可选的还可以是独立于前述处理器的存储装置。业务供应商服务器20例如为计算机设备,其包括:处理器、存储器、通信总线和各种接口等,用于由业务供应商给用户提供各种业务,例如:电影、电视剧、综艺节目等视频和电子红包。当广告商需要在业务供应商提供的业务中投放一则广告时,可以通过广告商设备40访问业务供应商服务器20提供的网站,上传相应的广告文件及广告语到业务供应商服务器20。这些广告文件例如为可以加在业务供应商的电影、电视剧、综艺节目等视频之前或中间,或者可以贴在业务供应商的电子红包上的视频广告、图片广告等。当用户使用终端设备10观看电影、电视剧、综艺节目视频时,终端设备10会先播放广告商的广告,同时显示广告语。用户可以通过说出广告语,跳过广告,开始观看电视剧、电影、综艺节目的视频。或者当用户使用终端设备10收到电子红包时,通过喊出广告语,可以打开电子红包。图2a至2e为根据本申请实施例的语音互动用户界面(UI)示意图。如图2a所示,广告商的广告例如为“农夫山泉”的视频广告22,在终端设备10的显示屏上通过应用程序呈现的播放窗口21上播放。同时,在播放窗口21上展示用户界面23。用户界面23可以是透明的或半透明的,上面显示有一些可见的控件,例如图标和提示框,供用户操作或获得信息,也可以是其他形式。如图2a所示,用户界面23中显示有可供用户操作的录音图标26和包含广告商的广告语“农夫山泉”24的提示框25。除广告语24之外,提示框25还可以包括提示用户如何和广告进行互动的语句,例如,“说出‘农夫山泉’跳过当前广告长按录音松开分析”。提示框25例如是可伸缩的,在其显示5秒后,可以缩回到录音图标26处看不见,在用户点击录音图标26后再次显示。如果用户希望跳过广告,则可以长按用户界面23上的录音图标26开始录音。然后,用户界面由图2a变为图2b。在图2b的状态下,当用户说完广告语,松开录音图标26后,用户界面可以由图2b变为图2c。在图2c的用户界面23上,提示框25中的提示变为“分析中,请稍等……”。如果通过分析,判断用户说出的广告语“农夫山泉”是正确的,则用户界面23由图2c变为图2d,其中录音图标26变为打“√”的图标,提示框25中的语句变为“农夫山泉”。这时,如果视频广告是在电影视频的开头,则终端设备的应用程序便停止播放视频广告22,开始播放电影视频;如果视频广告22是在电影视频的中间,因为在播放视频广告期间,电影视频是暂停的,当判断用户说出的广告语是正确的情况下,停止播放视频广告,接着播放电影视频。如果通过分析,判断用户说出的广告语不正确,则用户界面从图2c变为图2e,其中,提示框25中的提示为“说的不对哦,继续观看”。然后用户可以选择重新说出广告语,重复上述处理过程,或者选择继续观看广告。本申请实施例的语音互动方式比较新颖,增加了用户与广告之间的互动,在满足广告商利益的情况下,增强了用户观看的趣味性,提高了用户体验。图3为根据本申请实施例的语音互动方法的流程图。该语音互动方法应用于终端设备上,可以通过终端设备或终端设备的应用程序来实现。如图3所示,根据本申请实施例的语音互动方法包括以下步骤:步骤101:获取推送信息对应的第一文本信息,展示所述第一文本信息。例如,在终端设备上安装有应用程序,用于业务供应商向用户提供各种业务,例如,电影、电视剧、综艺节目等主媒体内容。在应用程序提供主媒体内容之前,会从服务器获取主媒体内容、推送信息及与推送信息对应的第一文本信息,也可以在提供主媒体内容的过程中,获取推送信息及与推送信息对应的第一文本信息。推送信息为主媒体内容的附加媒体本文档来自技高网...
语音互动方法和装置

【技术保护点】
一种语音互动方法,其特征在于,该方法包括:获取推送信息对应的第一文本信息,展示所述第一文本信息;将所述第一文本信息转换为第一拼音字符串;接收用户输入的语音;将所述语音提供给服务器进行语音识别,并从所述服务器获得通过语音识别得到的第二文本信息;将所述第二文本信息转换为第二拼音字符串;确定所述第一拼音字符串与所述第二拼音字符串的相似度;根据所述相似度和预设的阈值确定互动结果,并根据所述互动结果执行所述互动结果对应的操作。

【技术特征摘要】
1.一种语音互动方法,其特征在于,该方法包括:获取推送信息对应的第一文本信息,展示所述第一文本信息;将所述第一文本信息转换为第一拼音字符串;接收用户输入的语音;将所述语音提供给服务器进行语音识别,并从所述服务器获得通过语音识别得到的第二文本信息;将所述第二文本信息转换为第二拼音字符串;确定所述第一拼音字符串与所述第二拼音字符串的相似度;根据所述相似度和预设的阈值确定互动结果,并根据所述互动结果执行所述互动结果对应的操作。2.根据权利要求1的语音互动方法,其中,将所述第一文本信息转换为第一拼音字符串包括:根据预设的拼音转换规则表和预设的模糊音转换规则表,将所述第一文本信息转换为第一拼音字符串,其中所述模糊音转换规则表使用了口音特征;将所述第二文本信息转换为第二拼音字符串包括:根据所述预设的拼音转换规则表和所述预设的模糊音转换规则表,将所述第二文本信息转换为第二拼音字符串。3.根据权利要求2的语音互动方法,其中,确定所述第一拼音字符串与所述第二拼音字符串的相似度包括:使用字符串相似度算法,计算从所述第一拼音字符串转成所述第二拼音字符串所需的最少编辑次数;根据该最少编辑次数和所述第一拼音字符串与所述第二拼音字符串中长度较大者的长度,计算所述第一拼音字符串与所述第二拼音字符串的相似度。4.根据权利要求1至3任一项的语音互动方法,其中,所述推送信息为`主媒体内容的附加媒体内容,所述方法进一步包括:在播放所述主媒体内容之前或期间,播放所述附加媒体内容;其中,根据所述相似度和预设的阈值确定互动结果,并根据所述互动结果执行所述互动结果对应的操作包括:在所述相似度满足所述预设的阈值时,停止播放所述附加媒体内容,并开始播放或者继续播放所述主媒体内容。5.根据权利要求4的语音互动方法,其中,接收用户输入的语音包括:在所播放的所述附加媒体内容上提供用户界面,该用户界面中包括可触发录音功能的图标;响应于用户对所述图标的操作,打开声音输入设备,开始录音;在判断用户停止录音后,获取所录制的语音。6.根据权利要求5的语音互动方法,其中,用户对所述图标的操作包括:用户长按所述图标;用户停止录音包括:用户松开所述图标。7.根据权利要求5的语音互动方法,其中,所述第一文本信息显示在所述用户界面上。8.根据权利要求1的语音互动方法,其中,所述方法进一步包括:从服务器获取所述推送信息的配置文件,其中该配置文件包括下列信息:所述第一文本信息、所述预设的阈值;其中,从所述配置文件获取所述第一文本信息,根据所述相似度和所述配置文件中的所述预设的阈值确定互动结果。9...

【专利技术属性】
技术研发人员:任春剑柳萌宇王平吴兵周彬
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1