一种基于阿里云的录音上传识别与情感分析方法及系统技术方案

技术编号：32325795 阅读：18 留言：0更新日期：2022-02-16 18:32

本发明专利技术公开了一种基于阿里云的录音上传识别与情感分析方法及系统，包括以下步骤：人工上传需要识别的录音文件到服务器；服务器上传音频文件至阿里云进行录音的识别与文字的转换；将阿里云回传的JSON串进行重组与解析，拼装成句；对句子进行时间点切分、电话号码识别处理，并输出到网页；将这些句子上传至阿里云进行情感分析；将阿里云回传的情感分析JSON串进行解析；将解析完的数据与切分好的句子进行匹配；产生情感分析热图。本发明专利技术基于阿里云的智能语音交互以及自然语言处理，对识别后的结果进行了充分的利用；在编程上也采用异步方式避免阻塞。本发明专利技术具有高可用性、高准确率与高效率的优点，广泛应用于录音分析领域。广泛应用于录音分析领域。广泛应用于录音分析领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于阿里云的录音上传识别与情感分析方法及系统

[0001]本专利技术涉及互联网云
，尤其是一种基于阿里云的录音上传识别与情感分析方法。

技术介绍

[0002]近十年以来，随着科学的进步，语音识别技术也获得迅速的发展。据专业人士预测，未来十到二十年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术就是让机器通过识别和理解，把语音信号转变为相应的文本或命令的高技术。当前主流聊天软件QQ、微信等语音识别仅限于实时聊天过程，且语音时长较短；而市场上针对长录音的录音分析技术中存在录音识别速度慢、精确度差、识别结果不全面、实用信息少等问题。

技术实现思路

[0003]有鉴于此，本专利技术实施例提供一种基于阿里云的录音上传识别与情感分析方法及系统。
[0004]本专利技术的第一方面提供一种基于阿里云的录音上传识别与情感分析方法，包括以下步骤：
[0005]上传待识别录音文件至服务器；
[0006]服务器对所述待识别录音文件进行辨别分类；
[0007]将待识别录音文件上传至阿里云，在阿里云上对所述待识别录音文件进行识别与文字转换；
[0008]服务器获取阿里云回传的第一JSON串，每个所述第一JSON串都各有对应一个词语或短句；
[0009]对回传的第一JSON串进行重组解析，拼装成句；
[0010]服务器对拼装得到的成句进行时间点切分、电话号码识别；
[0011]将成句上传至阿里云服务器进行...

【技术保护点】

【技术特征摘要】
1.一种基于阿里云的录音上传识别与情感分析方法，其特征在于，包括以下步骤：上传待识别录音文件至服务器；服务器对所述待识别录音文件进行辨别分类；将待识别录音文件上传至阿里云，在阿里云上对所述待识别录音文件进行识别与文字转换；服务器获取阿里云回传的第一JSON串，每个所述第一JSON串都各有对应一个词语或短句；对回传的第一JSON串进行重组解析，拼装成句；服务器对拼装得到的成句进行时间点切分、电话号码识别；将成句上传至阿里云服务器进行情感分析；服务器获取阿里云回传的第二JSON串，对回传的第二JSON串进行解析；服务器将解析数据与按时间点切分的句子逐句匹配；服务器根据解析数据生成情感分析热图。2.根据权利要求1所述的一种基于阿里云的录音上传识别与情感分析方法，其特征在于，所述服务器对所述待识别录音文件进行辨别分类，包括：根据待识别录音文件的格式、大小、时长对所述待识别录音文件进行辨别分类。3.根据权利要求1所述的一种基于阿里云的录音上传识别与情感分析方法，其特征在于，所述上传待识别录音文件至服务器，包括：将待识别录音文件以二进制流的形式通过http协议由本地上传至服务器。4.根据权利要求1所述的一种基于阿里云的录音上传识别与情感分析方法，其特征在于，所述对回传的第一JSON串进行重组解析，拼装成句，具体包括：获取阿里云回传第一JSON串中的taskID，所述taskID用于辨别每个音频文件间的区别；根据所述taskID获取各taskID所对应的第一JSON串，得到各第一JSON串对应的词语或短句；对所述第一JSON串进行轮询，并上传至阿里云；获取阿里云回传的轮询后每个词语或短句所对应的第三JSON串；使用FastJSON从所述第三JSON串中提取词语或短句；对第三JSON串中的关键信息进行提取并拼接成句，将成句保存到数据库中。5.根据权利要求3所述的一种基于阿里云的录音上传识别与情感分析方法，其特征在于，所述对第三JSON串中的关键信息进行提取并拼接成句，将成句保存到数据库中，具体包括以下步骤：根据关键字，使用正则表达式对每一条第三JSON串中的关键信息进行提取，所述关键字为在回传的第三JSON串中出现的中文字符及标点符号；使用正则表达式对回传的第三JSON串中的时间信息进行解析；根据所述时间信息对句子顺序进行排列组合，拼接...

【专利技术属性】
技术研发人员：吕文哲，陈炳标，柯志忠，许东武，
申请(专利权)人：广东万丈金数信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人