基于自然语音识别的音频/视频点播方法和系统技术方案

技术编号：7045299 阅读：325 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开一种基于自然语音识别的音频/视频点播方法和系统，涉及通信领域。只需按动一键，便可以通过终端设备连接到网络侧的云计算平台服务器，通过云计算平台服务器进行语音音频/视频点播。其中，云计算平台服务器采用非特定人语音识别技术以及自然语音识别技术对用户输入的音频/视频点播语音信息进行语音识别，获取用户进行音频/视频点播地址，并将该音频/视频点播地址通过自动音频/视频点播控制信息发送给终端设备，以使得终端设备根据该自动音频/视频点播控制信息自动启动音频/视频播放功能，从音频/视频服务器获取音频/视频媒体流，将该音频/视频媒体流播放述用户。本发明专利技术实施例提供的技术方案可以应用在语音音频/视频点播系统中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及通信领域，尤其涉及一种基于自然语音识别的音频/视频点播方法和系统。
技术介绍
随着科技的进步，车辆已经成为认为生活中不可或缺的代步工具，驾车。在行车驾驶过程中，车载娱乐设备能够播放音频/视频媒体内容，以消除驾驶人员的疲劳。在现有技术中，用户一般采用手动点播音频/视频媒体的方法获取音频/视频服务，例如用户手动点击车载娱乐设备的屏幕或者配套按键，通过屏幕或者案件输入想要点播的音频/视频描述信息，从音频/视频服务器获取音频/视频描述信息对应的音频/视频媒体流并进行播放。然而，在用户驾驶车辆的过程中，手动操作需要转移视线到车载娱乐设备上，会分散用户的精力，使得用户驾驶车辆的危险性大大增强。为解决上述技术问题，现有技术公开了一些语音音频/视频点播技术，对于不同的语言，语音音频/视频点播技术所采用的语音识别方法各不相同，例如对于英文而言，句中的单词均由26个字母表中的字母构成，在进行语音音频/视频点播服务时，语音音频/ 视频点播系统需要对语句中的字母以及句子的语法结构进行识别，才能识别出语音信息对应的文本信息，从而根据该识别出的文本信息进行相关的音频/视频点播操作。中文与英文最大的区别在于，中文汉字数量较大，目前，汉字的总数已经超过了 8 万，其中常用汉字大约有3500字左右，面对如此庞大的中文汉字库，传统的中文语音音频/ 视频点播技术采用基于关键词的语音识别方法进行语音识别。语音音频/视频点播系统需要将用户发送的语音内容从头到尾按字/词的方式与词表中预先存储的文本内容进行逐一匹配，只有语音内容与词表中存储的某条文本内容完全匹配时，语音音频/视频点播...

【技术保护点】
１．一种基于自然语音识别的音频／视频点播系统，其特征在于，包括：一键式控制装置、终端设备以及云计算平台服务器；所述一键式控制装置，安装在车辆的固定部件上，用于在用户按下启动键以后，通过直接或短距离通信方式与所述终端设备建立连接，并通过直接或短距离通信方式驱动所述终端设备与所述云计算平台服务器建立连接；所述终端设备，用于与所述一键式控制装置建立连接以后，通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立连接，接收用户发送的音频／视频点播语音信息，将所述音频／视频点播语音信息发送给所述云计算平台服务器，接收所述云计算平台服务器返回的包含音频／视频点播地址的自动音频／视频播放控制信息，根据该自动音频／视频播放控制信息启动音频／视频播放功能，根据所述音频／视频点播地址与音频／视频服务器建立音频／视频媒体流传输通道连接，从所述音频／视频服务器获取音频／视频媒体流，将该音频／视频媒体流播放给所述用户；所述云计算平台服务器，位于网络侧，包括：非特定人语音识别模块，用于对所述终端设备发送的音频／视频点播语音信息进行识别、解析，获取该音频／视频点播语音信息对应的文字信息；自然语音识别模块，...

【技术特征摘要】

【专利技术属性】
技术研发人员：沈嘉鑫，王力劭，许军，庞泽耀，王力勃，
申请(专利权)人：深圳市子栋科技有限公司，
类型：发明
国别省市：94

全部详细技术资料下载我是这个专利的主人