一种基于Android操作系统的语音识别文字方法技术方案

技术编号：39296039 阅读：8 留言：0更新日期：2023-11-07 11:03

本发明专利技术涉及语音识别文字技术领域，本发明专利技术涉及一种基于Android操作系统的语音识别文字系统及方法，旨在通过移动设备将人类语音录音转换为文字，并提供便利性、高准确性和隐私保护。在实施本发明专利技术的技术中，用户可以使用Android手机或Android平板等Android设备进行录音操作。用户可以录制各种类型的声音，如会议记录、讲座、语音备忘录等。录音文件被传输到语音识别模块进行处理。语音识别模块基于机器学习算法和语音识别技术，通过深度神经网络等模型训练，将声音转换为文字。这种技术可以实现高准确性和鲁棒性(即健壮性、稳健性)，能够准确识别多种语音。识别得到的文字可以通过Android设备进行输出。用户可以选择将文字文件保存在设备本地，方便随时查看、编辑和分享。编辑和分享。编辑和分享。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Android操作系统的语音识别文字方法

[0001]本专利技术涉及语音识别文字
，具体为一种基于Android操作系统的语音识别文字方法。

技术介绍

[0002]在移动设备的普及和功能的不断增强下，人们已经习惯使用手机进行语音录制，将重要的对话及内容使用语音的方式记录下来。
[0003]但是，部分语音内容需要将其转化为文字内容，现有的转化方式需要依赖于其他设备或在线服务APP，语音转化方式较为麻烦，用户使用较为不变，转化速度较慢，因此，开发一种能够在Android设备上实现录音识别文字的技术对于用户方便、快捷地进行录音转文字操作具有重要意义。

技术实现思路

[0004]本专利技术的目的在于提供基于Android操作系统的录音识别文字技术，以解决上述
技术介绍
提出方便用户，提升工作、办公效率的问题。
[0005]为实现上述目的，本专利技术提供如下技术方案：一种基于Android系统的语音识别文字系统，由APP音频采集设备、任务分发服务器、RabbitMQ消息服务器、Mongodb数据库、预先训练好的模型、对象存储服务器及集群管理服务组成；
[0006]任务分发服务器负责接收APP端用户上传的声音采样，并由RabbitMQ消息服务器向预先训练好的模型进行分发；Mongodb数据库负责存储待处理语音解码任务；对象存储服务器存储解码和处理后的文本转写结果。
[0007]优选地，预先训练好的模型一般都是基于机器学习算法训练得到的，例如隐马尔可夫模型(Hidden M

【技术保护点】

【技术特征摘要】
1.一种基于Android系统的语音识别文字系统，其特征在于：由APP音频采集设备、任务分发服务器、RabbitMQ消息服务器、Mongodb数据库、预先训练好的模型、对象存储服务器及集群管理服务组成；任务分发服务器负责接收APP端用户上传的声音采样，并由RabbitMQ消息服务器向预先训练好的模型进行分发；Mongodb数据库负责存储待处理语音解码任务；对象存储服务器存储解码和处理后的文本转写结果。2.根据权利要求1所述的一种基于Android系统的语音识别文字系统，其特征在于：预先训练好的模型一般都是基于机器学习算法训练得到的，例如隐马尔可夫模型(Hidden Markov Model,HMM)和循环神经网络(Recurrent Neural Networks,RNN)。3.一种基于Android系统的语音识别文字处理方法，其特征在于：包括以下步骤：A、用户通过APP调用系统录音设备；B、录音设备将声音信号以离散的方式采样；C、采用噪音消除算法来降低噪音的影响；D、降噪后的声音采样上传到任务分发服务器；E、任务分发服务器在Mongodb数据库中创建一条新任务记录；F、任务分发服务器通过RabbitMQ消息队列广播任务；G、语音识别系统将接收到的语音信号进行特征提取，再与预先训练好的模型进行匹配，以识别语音中的单词、短句或者连续语音；H、预先训练好的模型将匹配好的文字上传到对象存储服务器；I、预先训练好的模型通过RabbitMQ消息队列通知任务处理成功；J、任务分发服务器将任务处理完毕的结果通过URL下发给APP；K、用户在APP中下载处理好的结果，以文本的形式输出。4.根据权利要求3所述的一种基于Android系统的语音识别文字处理方法，其特征在于：步骤E中任务分发服务器在Mongodb数据库创建的...

【专利技术属性】
技术研发人员：李海帆，
申请(专利权)人：上海砾捷信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人