语音识别多信息文本获取装置及方法制造方法及图纸

技术编号：6824939 阅读：263 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种语音识别多信息文本获取装置及方法，在通过语音识别将语音音频转换为纯文本信息之后，还将语音音频中的单字发音语速、单字发音强度、单字发音语调通过一定表现方式整合至初始生成的纯文本信息中生成多信息的文本信息。本发明专利技术的语音识别多信息文本获取装置及方法可广泛应用于微博、短信和签名档等信息发布平台。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机语音识别
，特别涉及一种。
技术介绍
近二十年来，语音识别技术取得显著进步，已经获得越来越广泛的应用。预计在未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。所谓语音识别，是指计算机或机械等自动理解人的语音。例如，通过利用语音识别，使计算机或机械能够根据人的语音进行动作，或者能够使人的语音变换为文字。语音识别中主要采用的方法是，抽取发出的语音所具有的频谱等物理特征，与预先存储的母音、子音或单词的物理特征模型进行比较，最终得到同人的语音内容相同的表达信息。但现有技术中，通过语音识别技术获取的文本信息通常只能是纯文本信息，所述纯文本信息是指文字大小格式统一、除标点符号外没有特殊符号的文本信息，说明书中所有提及纯文本信息之处均指此意。因此语音中的很多有价值的信息，例如说话人的语速、重音、音调等信息，无法在语音识别后的纯文本信息中表现出来。
技术实现思路
本专利技术要解决的技术问题是提供一种，以解决现有技术中通过语音识别技术获取的文本信息通常只能是纯文本信息，语音中的很多有价值的信息无法在语音识别后...

【技术保护点】
１．一种语言识别多信息文本获取装置，其特征在于，包括：纯文本信息及单字发音时间生成模块，用于通过语音识别将语音音频转换为纯文本信息，同时用于获得所述语音音频中的单字发音时间，通过所述单字发音时间的长短确定单字发音语速；多信息文本生成模块，用于将所述纯文本信息生成多信息的文本信息。

【技术特征摘要】

【专利技术属性】
技术研发人员：张峰，黄伟，
申请(专利权)人：盛乐信息技术上海有限公司，
类型：发明
国别省市：31

全部详细技术资料下载我是这个专利的主人