一种基于百度AI的网页版在线语音包转文字的方法技术

技术编号:20518666 阅读:478 留言:0更新日期:2019-03-06 03:03
本发明专利技术涉及语音识别的技术领域,特别涉及一种基于百度AI的网页版在线语音包转文字的方法。本发明专利技术方法步骤是:1、下载百度AI的语音识别SDK;2、创建一个html页面,并定义需要的标签;3、利用js检测用户上传的语音包的类型,并判断是否为合法类型;4、用户点击上传时,服务器对上传的文件进行处理;5、服务器调用百度AI提供的方法对用户上传的语音包检测,并将结果返回给用户;本发明专利技术解决了在以往的想要将一段语音包中的语音转换为文字时,往往都需要手动的多次播放和聆听语音包并将语音记录为文字,或下载软件来转换等,本发明专利技术提供了一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。

A Method of Online Voice Packet Text Transfer Based on Baidu AI

The invention relates to the technical field of speech recognition, in particular to a method of online voice packet transcription based on Baidu AI. The method steps of the invention are as follows: 1. Download the voice recognition SDK of Baidu AI; 2. Create an HTML page and define the required label; 3. Use JS to detect the type of voice packets uploaded by users and determine whether they are legal types; 4. When users click on the upload, the server processes the uploaded files; 5. The server calls the method provided by Baidu AI to upload voice packets by users. Detection and return the result to the user; The invention solves the problem that in the past, when you want to convert the voice in a voice package into text, you often need to play and listen to the voice package manually many times, record the voice into text, or download software to convert, etc. The invention provides a real-time, efficient, online, low-cost Web version of the voice package into text. Law.

【技术实现步骤摘要】
一种基于百度AI的网页版在线语音包转文字的方法
本专利技术涉及语音识别
,特别涉及一种基于百度AI的网页版在线语音包转文字的方法。
技术介绍
语音识别技术,也被称为自动语音识别AutomaticSpeechRecognit1n,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入。但是,目前面临的主要问题有:在以往的想要将一段语音包中的语音转换为文字时,往往都需要手动的多次播放和聆听语音包并将语音记录为文字,或下载各种软件提供语音转文字的技术支持等,缺乏一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。
技术实现思路
本专利技术解决了在以往的想要将一段语音包中的语音转换为文字时,往往都需要手动的多次播放和聆听语音包并将语音记录为文字,或下载各种软件将语音转文字等,本专利技术提供了一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。本专利技术解决上述技术问题的技术方案是:所述的方法包含以下几个步骤:步骤一、下载百度AI的语音识别SDK;步骤二、创建一个html页面,并定义需要的标签;步骤三、利用js检测用户上传的语音包的类型,并判断是否为合法类型;步骤四、用户点击上传时,服务器对上传的文件进行处理;步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测,并将结果转换返回给用户;本专利技术的有益效果:提供了一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。附图说明下面结合附图对本专利技术进一步说明:图1为本专利技术的方法流程图。具体实施方式如图1所示,本专利技术采用如下步骤可以实现一种基于百度AI的网页版在线语音包转文字的方法。步骤一、下载百度AI的语音识别SDK,下载百度AI提供的SDK,本专利使用node.js做服务器,需要安装node和express依赖包和formidable中间件。步骤二、创建一个html页面,并定义需要的标签;<formid="uploadForm"action="/uploadFile"method="post"enctype="multipart/form-data"><inputtype="file"name="file"onchange="changFn(this)"id="uploadFile"/><inputtype="submit"value="上传"/></form>步骤三、利用js检测用户上传的语音包的格式,并判断是否为合法格式;varflag=false;functionchangFn(obj){varexe=obj.files[0].name.split(".").splice(-1);vararr=["pcm","wav","amr"];$.each(arr,function(i){if(exe==arr[i]){flag=true;returnfalse;}});if(!flag){alert("上传的文件格式非法");}}步骤四、用户点击上传时,服务器对上传的文件进行处理;constfs=require('fs');constpath=require("path");consthttp=require("http");constformidable=require('formidable');constexpress=require("express");constapp=express();app.post("/uploadFile",function(req,res,next){varform=newformidable.IncomingForm();form.uploadDir=path.join(__dirname,"./statics/audio");form.parse(req,function(err,fields,files){varoldPath=files.file.path;varextname=path.extname(files.file.name);varnewPath=path.join(__dirname,"./statics/audio/",parseInt(Math.random()*10000000)+extname);fs.rename(oldPath,newPath,function(err){if(err){res.send("上传失败");return;}console.log("上传成功");transformYY(res,newPath);});});});http.createServer(app).listen(3000,"127.0.0.1");步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测转换,并将转换结果以文字形式返回给用户;varAipSpeechClient=require("baidu-aip-sdk").speech;//设置APPID/AK/SKvarAPP_ID="您百度AI的APP_ID";varAPI_KEY="您百度AI的API_KEY";varSECRET_KEY="您百度AI的SECRET_KEY";functiontransformYY(res,newPath){letfilePath=fs.readFileSync(newPath);letfileBuffer=newBuffer(filePath);client.recognize(fileBuffer,'pcm',16000).then(function(result){res.send(result['result']);},function(err){console.log(err);});}。本文档来自技高网...

【技术保护点】
1.一种基于百度AI的网页版在线语音包转文字的方法,其特征在于:所述的方法包含以下几个步骤:步骤一、下载百度AI的语音识别SDK;步骤二、创建一个html页面,并定义需要的标签;步骤三、利用js检测用户上传的语音包的类型,并判断是否为合法类型;步骤四、用户点击上传时,服务器对上传的文件进行处理;步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测,并将转换结果返回给用户。

【技术特征摘要】
1.一种基于百度AI的网页版在线语音包转文字的方法,其特征在于:所述的方法包含以下几个步骤:步骤一、下载百度AI的语音识别SDK;步骤二、创建一个html页面,并定义需要的标签;步骤三、利用js检测用户上传的语音包的类型,并判断是否为合法类型;步骤四、用户点击上传时,服务器对上传的文件进行处理;步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测,并将转换结果返回给用户。2.根据权利要求1所述的一种基于百度AI的网页版在线语音包转文字的方法,其特征在于:所述的步骤一中,下载百度AI提供的SDK,本专利使用node.js做服务器,需要安装node和express依赖包和formidable中间件。3.根据权利要求1所述的一种基于百度AI的网页版在线语音包转文字的方法,其特征在于:所述的步骤二中,创建一个html页面,并定义...

【专利技术属性】
技术研发人员:冯捷雄张来卿庞严冬
申请(专利权)人:珠海横琴盛达兆业科技投资有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1