一种基于阿里云的录音上传识别与情感分析方法及系统技术方案

技术编号:32325795 阅读:18 留言:0更新日期:2022-02-16 18:32
本发明专利技术公开了一种基于阿里云的录音上传识别与情感分析方法及系统,包括以下步骤:人工上传需要识别的录音文件到服务器;服务器上传音频文件至阿里云进行录音的识别与文字的转换;将阿里云回传的JSON串进行重组与解析,拼装成句;对句子进行时间点切分、电话号码识别处理,并输出到网页;将这些句子上传至阿里云进行情感分析;将阿里云回传的情感分析JSON串进行解析;将解析完的数据与切分好的句子进行匹配;产生情感分析热图。本发明专利技术基于阿里云的智能语音交互以及自然语言处理,对识别后的结果进行了充分的利用;在编程上也采用异步方式避免阻塞。本发明专利技术具有高可用性、高准确率与高效率的优点,广泛应用于录音分析领域。广泛应用于录音分析领域。广泛应用于录音分析领域。

【技术实现步骤摘要】
一种基于阿里云的录音上传识别与情感分析方法及系统


[0001]本专利技术涉及互联网云
,尤其是一种基于阿里云的录音上传识别与情感分析方法。

技术介绍

[0002]近十年以来,随着科学的进步,语音识别技术也获得迅速的发展。据专业人士预测,未来十到二十年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术就是让机器通过识别和理解,把语音信号转变为相应的文本或命令的高技术。当前主流聊天软件QQ、微信等语音识别仅限于实时聊天过程,且语音时长较短;而市场上针对长录音的录音分析技术中存在录音识别速度慢、精确度差、识别结果不全面、实用信息少等问题。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供一种基于阿里云的录音上传识别与情感分析方法及系统。
[0004]本专利技术的第一方面提供一种基于阿里云的录音上传识别与情感分析方法,包括以下步骤:
[0005]上传待识别录音文件至服务器;
[0006]服务器对所述待识别录音文件进行辨别分类;
[0007]将待识别录音文件上传至阿里云,在阿里云上对所述待识别录音文件进行识别与文字转换;
[0008]服务器获取阿里云回传的第一JSON串,每个所述第一JSON串都各有对应一个词语或短句;
[0009]对回传的第一JSON串进行重组解析,拼装成句;
[0010]服务器对拼装得到的成句进行时间点切分、电话号码识别;
[0011]将成句上传至阿里云服务器进行情感分析;
[0012]服务器获取阿里云回传的第二JSON串,对回传的第二JSON串进行解析;
[0013]服务器将解析数据与按时间点切分的句子逐句匹配;
[0014]服务器根据解析数据生成情感分析热图。
[0015]进一步地,所述服务器对所述待识别录音文件进行辨别分类,包括:根据待识别录音文件的格式、大小、时长对所述待识别录音文件进行辨别分类。
[0016]进一步地,所述上传待识别录音文件至服务器,包括:
[0017]将待识别录音文件以二进制流的形式通过http协议由本地上传至服务器。
[0018]进一步地,所述对回传的第一JSON串进行重组解析,拼装成句,具体包括:
[0019]获取阿里云回传第一JSON串中的taskID,所述taskID用于辨别每个音频文件间的区别;
[0020]根据所述taskID获取各taskID所对应的第一JSON串,得到各第一JSON串对应的词语或短句;
[0021]对所述第一JSON串进行轮询,并上传至阿里云;
[0022]获取阿里云回传的轮询后每个词语或短句所对应的第三JSON串;
[0023]使用FastJSON从所述第三JSON串中提取词语或短句;
[0024]对第三JSON串中的关键信息进行提取并拼接成句,将成句保存到数据库中。
[0025]进一步地,所述对第三JSON串中的关键信息进行提取并拼接成句,将成句保存到数据库中,具体包括以下步骤:
[0026]根据关键字,使用正则表达式对每一条第三JSON串中的关键信息进行提取,所述关键字为在回传的第三JSON串中出现的中文字符及标点符号;
[0027]使用正则表达式对回传的第三JSON串中的时间信息进行解析;
[0028]根据所述时间信息对句子顺序进行排列组合,拼接成句。
[0029]进一步地,所述服务器对拼装得到的成句进行时间点切分、电话号码识别,具体包括:
[0030]从所述第一JSON串提取对应词语或短句的起始时间与结束时间;
[0031]将结束时间减去起始时间获得词语或短句的时长;
[0032]将所述时长与词语或短句进行匹配,并存入数据库中;
[0033]使用正则表达式解析文字识别结果中的数字,当数字长度为11位时,标记其为电话号码;
[0034]将所有的电话号码存入数据库中,使用视图对电话号码出现的次数进行统计;
[0035]将电话号码及次数输出至网页,并与对应的时间戳进行匹配。
[0036]进一步地,所述服务器根据解析数据生成情感分析热图,具体包括以下步骤:
[0037]获取阿里云的情感分析结果,所述情感分析结果包括情绪波动值;
[0038]通过累加的方式对情感分析结果进行统计;
[0039]以录音的时间节点为横坐标,情绪波动值为纵坐标建立直角坐标系;
[0040]将累加结果与所对应时间节点进行匹配,在坐标系中建立折线图;
[0041]生成情感分析热图,并将情感分析热图输出至网页端。
[0042]进一步地,将待识别录音文件上传至阿里云之前,还包括以下步骤:
[0043]提取待识别录音文件的文件类型、文件大小和文件时长存储至数据库中;
[0044]在数据库中根据待识别音频的文件类型、文件大小和文件时长匹配数据库中的录音文件,如在数据库中匹配到相同的录音文件,则直接将匹配录音文件的解析结果和情感分析热图输出至网页端。
[0045]进一步地,所述一种基于阿里云的录音上传识别与情感分析方法还包括:
[0046]采用多线程对待识别录音文件进行解析与情绪分析,对各步骤独立分配线程,采用异步的方式执行一种基于阿里云的录音上传识别与情感分析方法;
[0047]在各步骤之间添加同步锁,在先步骤未执行完毕时,不执行在后步骤。
[0048]本专利技术还公开了一种录音识别与情感分析系统,其特征在于,包括用户登陆注册模块、文件上传模块、录音识别模块、录音分析模块和情绪分析模块;
[0049]所述用户登陆注册模块用于对用户进行权限管理;
[0050]所述文件上传模块、录音识别模块、录音分析模块和情绪分析模块用于配合执行上述方法。
[0051]本专利技术具有如下有益效果:本专利技术对录音文件进行了解析,并按时间对句子进行切分;在本专利技术的适用场景如会议录音、电话客服录音之中,可实现快速定位录音时间节点,并浏览相关解析信息,藉此实现对录音中关键性问题的筛选和录音的有效监听等。本专利技术中针对录音中提及的电话号码信息进行了针对性提取,方便技术人员对电话号码进行快速记录和统计。本专利技术除了对录音文件进行识别解析外,还利用解析结果,生成情绪分析热图,方便技术人员判断录音对象的情绪走势,快速、直观地认识对话时的情绪波动。在本专利技术的整体实现上,本专利技术对数据库中已有解析结果的录音文件直接调用解析结果输出,形成类缓存的机制提高执行效率;本专利技术还通过分配多线程、添加同步锁的方式,进一步提高了可用性。
附图说明
[0052]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0053]图1是本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于阿里云的录音上传识别与情感分析方法,其特征在于,包括以下步骤:上传待识别录音文件至服务器;服务器对所述待识别录音文件进行辨别分类;将待识别录音文件上传至阿里云,在阿里云上对所述待识别录音文件进行识别与文字转换;服务器获取阿里云回传的第一JSON串,每个所述第一JSON串都各有对应一个词语或短句;对回传的第一JSON串进行重组解析,拼装成句;服务器对拼装得到的成句进行时间点切分、电话号码识别;将成句上传至阿里云服务器进行情感分析;服务器获取阿里云回传的第二JSON串,对回传的第二JSON串进行解析;服务器将解析数据与按时间点切分的句子逐句匹配;服务器根据解析数据生成情感分析热图。2.根据权利要求1所述的一种基于阿里云的录音上传识别与情感分析方法,其特征在于,所述服务器对所述待识别录音文件进行辨别分类,包括:根据待识别录音文件的格式、大小、时长对所述待识别录音文件进行辨别分类。3.根据权利要求1所述的一种基于阿里云的录音上传识别与情感分析方法,其特征在于,所述上传待识别录音文件至服务器,包括:将待识别录音文件以二进制流的形式通过http协议由本地上传至服务器。4.根据权利要求1所述的一种基于阿里云的录音上传识别与情感分析方法,其特征在于,所述对回传的第一JSON串进行重组解析,拼装成句,具体包括:获取阿里云回传第一JSON串中的taskID,所述taskID用于辨别每个音频文件间的区别;根据所述taskID获取各taskID所对应的第一JSON串,得到各第一JSON串对应的词语或短句;对所述第一JSON串进行轮询,并上传至阿里云;获取阿里云回传的轮询后每个词语或短句所对应的第三JSON串;使用FastJSON从所述第三JSON串中提取词语或短句;对第三JSON串中的关键信息进行提取并拼接成句,将成句保存到数据库中。5.根据权利要求3所述的一种基于阿里云的录音上传识别与情感分析方法,其特征在于,所述对第三JSON串中的关键信息进行提取并拼接成句,将成句保存到数据库中,具体包括以下步骤:根据关键字,使用正则表达式对每一条第三JSON串中的关键信息进行提取,所述关键字为在回传的第三JSON串中出现的中文字符及标点符号;使用正则表达式对回传的第三JSON串中的时间信息进行解析;根据所述时间信息对句子顺序进行排列组合,拼接...

【专利技术属性】
技术研发人员:吕文哲陈炳标柯志忠许东武
申请(专利权)人:广东万丈金数信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1