语音互动方法和装置制造方法及图纸

技术编号：17201400 阅读：46 留言：0更新日期：2018-02-04 02:28

本申请提供了一种语音互动方法和装置。其中，先获取推送信息对应的第一文本信息，并展示所述第一文本信息。然后将所述第一文本信息转换为第一拼音字符串。之后接收用户输入的语音，将所述语音提供给服务器进行语音识别，并从所述服务器获得通过语音识别得到的第二文本信息。将所述第二文本信息转换为第二拼音字符串。确定所述第一拼音字符串与所述第二拼音字符串的相似度。根据所述相似度和预设的阈值确定互动结果，并根据所述互动结果执行所述互动结果对应的操作。本申请的语音互动方式比较新颖，增加了用户与广告之间的互动，在满足广告商利益的情况下，增强了用户观看的趣味性，提高了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音互动方法和装置
本申请涉及互联网
，特别涉及一种语音互动方法和装置。
技术介绍
随着互联网的发展，广告主通过各种形式在互联网上投放广告。例如，在视频网站中，播放电视剧、电影、综艺节目等视频之前会有一段广告。通常，用户需要看完整段广告才可以看到电视剧、电影、综艺节目等视频，或者，用户需要付费成为会员，才可以不用看广告。
技术实现思路
本申请的目的在于提供一种语音互动方法和装置，在用户观看视频的过程中，通过和广告进行互动，可以跳过广告。本申请实施例提供了一种语音互动方法，该方法包括：获取推送信息对应的第一文本信息，展示所述第一文本信息；将所述第一文本信息转换为第一拼音字符串；接收用户输入的语音；将所述语音提供给服务器进行语音识别，并从所述服务器获得通过语音识别得到的第二文本信息；将所述第二文本信息转换为第二拼音字符串；确定所述第一拼音字符串与所述第二拼音字符串的相似度；根据所述相似度和预设的阈值确定互动结果，并根据所述互动结果执行所述互动结果对应的操作。另外，本申请实施例提供了一种语音互动装置，该装置包括：第一文本获取模块，用于获取推送信息对应的第一文本信息，展示所述第一文本信息；第一转换模块，用于将所述第一文本信息转换为第一拼音字符串；语音接收模块，接收用户输入的语音；收发模块，用于将所述语音提供给服务器进行语音识别，并从所述服务器获得通过语音识别得到的第二文本信息；第二转换模块，用于将所述第二文本信息转换为第二拼音字符串；相似度确定模块，用于确定所述第一拼音字符串与所述第二拼音字符串的相似度；操作模块，用于根据所述相似度和预设的阈值确定互动结果，并根...
语音互动方法和装置

【技术保护点】
一种语音互动方法，其特征在于，该方法包括：获取推送信息对应的第一文本信息，展示所述第一文本信息；将所述第一文本信息转换为第一拼音字符串；接收用户输入的语音；将所述语音提供给服务器进行语音识别，并从所述服务器获得通过语音识别得到的第二文本信息；将所述第二文本信息转换为第二拼音字符串；确定所述第一拼音字符串与所述第二拼音字符串的相似度；根据所述相似度和预设的阈值确定互动结果，并根据所述互动结果执行所述互动结果对应的操作。

【技术特征摘要】
1.一种语音互动方法，其特征在于，该方法包括：获取推送信息对应的第一文本信息，展示所述第一文本信息；将所述第一文本信息转换为第一拼音字符串；接收用户输入的语音；将所述语音提供给服务器进行语音识别，并从所述服务器获得通过语音识别得到的第二文本信息；将所述第二文本信息转换为第二拼音字符串；确定所述第一拼音字符串与所述第二拼音字符串的相似度；根据所述相似度和预设的阈值确定互动结果，并根据所述互动结果执行所述互动结果对应的操作。2.根据权利要求1的语音互动方法，其中，将所述第一文本信息转换为第一拼音字符串包括：根据预设的拼音转换规则表和预设的模糊音转换规则表，将所述第一文本信息转换为第一拼音字符串，其中所述模糊音转换规则表使用了口音特征；将所述第二文本信息转换为第二拼音字符串包括：根据所述预设的拼音转换规则表和所述预设的模糊音转换规则表，将所述第二文本信息转换为第二拼音字符串。3.根据权利要求2的语音互动方法，其中，确定所述第一拼音字符串与所述第二拼音字符串的相似度包括：使用字符串相似度算法，计算从所述第一拼音字符串转成所述第二拼音字符串所需的最少编辑次数；根据该最少编辑次数和所述第一拼音字符串与所述第二拼音字符串中长度较大者的长度，计算所述第一拼音字符串与所述第二拼音字符串的相似度。4.根据权利要求1至3任一项的语音互动方法，其中，所述推送信息为`主媒体内容的附加媒体内容，所述方法进一步包括：在播放所述主媒体内容之前或期间，播放所述附加媒体内容；其中，根据所述相似度和预设的阈值确定互动结果，并根据所述互动结果执行所述互动结果对应的操作包括：在所述相似度满足所述预设的阈值时，停止播放所述附加媒体内容，并开始播放或者继续播放所述主媒体内容。5.根据权利要求4的语音互动方法，其中，接收用户输入的语音包括：在所播放的所述附加媒体内容上提供用户界面，该用户界面中包括可触发录音功能的图标；响应于用户对所述图标的操作，打开声音输入设备，开始录音；在判断用户停止录音后，获取所录制的语音。6.根据权利要求5的语音互动方法，其中，用户对所述图标的操作包括：用户长按所述图标；用户停止录音包括：用户松开所述图标。7.根据权利要求5的语音互动方法，其中，所述第一文本信息显示在所述用户界面上。8.根据权利要求1的语音互动方法，其中，所述方法进一步包括：从服务器获取所述推送信息的配置文件，其中该配置文件包括下列信息：所述第一文本信息、所述预设的阈值；其中，从所述配置文件获取所述第一文本信息，根据所述相似度和所述配置文件中的所述预设的阈值确定互动结果。9...

【专利技术属性】
技术研发人员：任春剑，柳萌宇，王平，吴兵，周彬，
申请(专利权)人：腾讯科技北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人