基于多方交流的语音数据文字转化方法技术

技术编号:28478816 阅读:24 留言:0更新日期:2021-05-15 21:48
本发明专利技术涉及数字信息传输技术领域,具体地说,涉及基于多方交流的语音数据文字转化方法。其包括识别多方设备端输入的预设密令步骤、对群聊内各个设备端交流的语音数据进行文字转化步骤、将语音数据以及其转化后的文字数据通过存储器进行存储步骤和将关键文字数据和关键标题进行整合步骤。本发明专利技术中通过关键标题和关键文字数据进行整合对多方交流的语音数据转化后的文字进行整合,并通过预选标记的方式将关键标题,进而解决现有技术中语音数据转换针对性不足的问题,而且整理后大大提高了后期人工筛选的效率。后期人工筛选的效率。后期人工筛选的效率。

【技术实现步骤摘要】
基于多方交流的语音数据文字转化方法


[0001]本专利技术涉及数字信息传输
,具体地说,涉及基于多方交流的语音数据文字转化方法。

技术介绍

[0002]目前,随着聊天工具的不断更新换代,已经由以前的文字聊天转换成了语音聊天,其中:聊天工具又称IM软件或者IM工具,指的是提供基于互联网络的客户端进行实时语音、文字传输的工具,从技术上讲,主要分为基于服务器的IM工具软件和基于P2P技术的IM工具软件,这种实时传讯与电子邮件最大的不同在于不用等候,不需要每隔两分钟就按一次“传送与接收”,只要两个人都同时在线,就能像多媒体电话一样,传送文字、档案、声音、影像给对方,只要有网络,无论对方在天涯海角,或是双方隔得多远都没有距离。
[0003]因此,很多的企业开会、学校授课都应用到了这种实时传讯的数字信息传输技术,也就是通过建立群聊的方式将多个设备端进行数据传输,但现有的视频群聊、还是语音群聊都只是对交流过程中所有的语音数据进行转化,这样的文字转化并没有足够的针对性,还需要后期整理的人员对不需要转化文字进行筛选。

技术实现思路

[0004]本专利技术的目的在于提供基于多方交流的语音数据文字转化方法,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供基于多方交流的语音数据文字转化方法,包括如下方法步骤:首先识别多方设备端输入的预设密令,其包括两种姿态:姿态一、预设密令正确,则对该设备端进行标记,并输出各个设备端的标记,根据设备端的标记构建群聊;姿态二、预设密令不正确,则继续弹出输入窗口;对群聊内各个设备端交流的语音数据进行文字转化;将语音数据以及其转化后的文字数据通过存储器进行存储;在存储器内提取出预选标记设备端输出的语音数据以及其转化后的文字数据,然后根据提取出的文字数据识别预选标记设备端的关键数据信息,以形成关键标题,而后提取出其余标记设备端在关键标题之后下一个关键标题出现之前输出的语音数据以及其转化后的文字数据,以形成关键文字数据;将关键文字数据和关键标题进行整合,具体的,先根据关键标题对关键文字数据进行筛选,筛选出价值文字数据,并将价值文字数据、语音数据以及设备端标记相互对应的补入在群聊的显示框内。
[0006]作为本技术方案的进一步改进,所述预选标记设备端的关键数据信息包括重点文
字信息、语气助词信息和关键词提取信息。
[0007]作为本技术方案的进一步改进,所述关键数据信息提取采用加权提取算法,其算法步骤如下:根据语音数据中的声音间隔和声音的语气进行标点符号断句,其中标点符号包括句号、问号和感叹号;利用加权因子对预选标记设备端文字数据的词频、词长、词性、位置和词典因子进行量化处理,量化后进行权重计算,得出各个因子总权值;利用降序排列的方式对权值相对应的词语进行排序,得出关键词列表,通过关键词列表获取关键数据信息。
[0008]作为本技术方案的进一步改进,所述因子总的权值计算公式如下:;其中,为词语在文字数据的因子总权值;为词频因子占比;为词频因子;为词长因子占比;为词长因子;为词性因子占比;为词性;为位置因子占比;为位置占比;为词典因子占比;为词典因子,且。
[0009]作为本技术方案的进一步改进,所述中文字转化具体步骤如下:首先对设备端输出的音频数据进行提取,然后利用高斯混合学习算法对音频数据进行训练;对提取源音频输出语音的谐波加噪声模型进行分解,并利用平均基频比对分解的模型进行修正,得出相应的修正谐波幅度和相位参数,然后对谐波幅度和相位参数的特征进行提取,得出线性频谱率参数,再利用高斯混合模型对线性频谱率参数进行映射,而后融合映射后的线性频谱率参数特征;利用修正谐波幅度和相位参数进行混合输出,然后提取源音频输出语音的文字数据。
[0010]作为本技术方案的进一步改进,所述高斯混合学习算法包括如下步骤:首先训练源音频输出语音和目标音频输出语音,并对相应的谐波加噪声模型进行分解;计算出两个输出语音的基频轨迹的平均基频比,同时对两个输出语音的谐波幅度和相位参数进行特征提取,得到相应的线性频谱率参数;将得到的线性频谱率参数进行动态时间规整,再利用变分贝叶斯估计算法得出高斯混合模型。
[0011]作为本技术方案的进一步改进,所述变分贝叶斯估计算法的计算公式如下:;其中:为对数边缘密度;为观测音频变量;为源音频输出语音的文字变量;为给定关于的后验概率;为的先验概率。
[0012]与现有技术相比,本专利技术的有益效果:该基于多方交流的语音数据文字转化方法,通过关键标题和关键文字数据进行整合对多方交流的语音数据转化后的文字进行整合,并通过预选标记的方式将关键标题,进
而解决现有技术中语音数据转换针对性不足的问题,而且整理后大大提高了后期人工筛选的效率。
附图说明
[0013]图1为本专利技术的整体流程图;图2为本专利技术的高斯混合学习算法训练步骤流程图;图3为本专利技术的高斯混合学习算法转化步骤流程图;图4为本专利技术的显示框示意图其一;图5为本专利技术的显示框示意图其二;图6为本专利技术的VB

GMM算法和GMM算法折线示意图。
具体实施方式
[0014]实施例1下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0015]请参阅图1所示,本专利技术提供技术方案:本专利技术提供基于多方交流的语音数据文字转化方法,包括如下方法步骤:对群聊内各个设备端交流的语音数据进行文字转化;将语音数据以及其转化后的文字数据通过存储器进行存储,然后将文字转化后的文字数据在显示框内显示,请参阅图4所示,通过显示的文字数据便于后期在整理会议记录或者学习笔记时进行记忆,解决了视频会议或者视频学习后无法对文字进行提取记忆的问题。
[0016]实施例2为了提高群聊的安全性,避免非群聊人员加入到群聊内,本实施例与实施例1不同的是,首先识别多方设备端输入的预设密令,其包括两种姿态:姿态一、预设密令正确,则对该设备端进行标记,并输出各个设备端的标记,根据设备端的标记构建群聊,从而通过标记的方式对群聊的人员进行区别划分,并通过添加特定标记的方式进行区分,例如:若群聊为企业群,这样标记的方式有“老板”和“员工”;若群聊为学习群,这样标记的方式有“老师”和学生,进而提高了群聊内成员的辨识度;姿态二、预设密令不正确,则继续弹出输入窗口,此时预设密令不正确的设备端无法加入群聊,大大提高了群聊的安全性,解决非群聊人员加入到群聊内的问题。
[0017]实施例3为了提高语音数据转换的针对性,本实施例与实施例2不同的是,在存储器内提取出预选标记设备端输出的语音数据以及其转化后的文字数据,然后根据提取出的文字数据识别预选标记设备端的关键数据信息,以形成关键标题,而后提取出其余标记设备端在关键标题之后下一个关键标题出现之前输出的语音数据以及其转化后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多方交流的语音数据文字转化方法,其特征在于,包括如下方法步骤:首先识别多方设备端输入的预设密令,其包括两种姿态:姿态一、预设密令正确,则对该设备端进行标记,并输出各个设备端的标记,根据设备端的标记构建群聊;姿态二、预设密令不正确,则继续弹出输入窗口;对群聊内各个设备端交流的语音数据进行文字转化;将语音数据以及其转化后的文字数据通过存储器进行存储;在存储器内提取出预选标记设备端输出的语音数据以及其转化后的文字数据,然后根据提取出的文字数据识别预选标记设备端的关键数据信息,以形成关键标题,而后提取出其余标记设备端在关键标题之后下一个关键标题出现之前输出的语音数据以及其转化后的文字数据,以形成关键文字数据;将关键文字数据和关键标题进行整合,具体的,先根据关键标题对关键文字数据进行筛选,筛选出价值文字数据,并将价值文字数据、语音数据以及设备端标记相互对应的补入在群聊的显示框内。2.根据权利要求1所述的基于多方交流的语音数据文字转化方法,其特征在于:所述预选标记设备端的关键数据信息包括重点文字信息、语气助词信息和关键词提取信息。3.根据权利要求1所述的基于多方交流的语音数据文字转化方法,其特征在于:所述关键数据信息提取采用加权提取算法,其算法步骤如下:根据语音数据中的声音间隔和声音的语气进行标点符号断句;利用加权因子对预选标记设备端文字数据的词频、词长、词性、位置和词典因子进行量化处理,量化后进行权重计算,得出各个因子总权值;利用降序排列的方式对权值相对应的词语进行排序,得出关键词列表,通过关键词列表获取关键数据信息。4.根据权利要求3所述的基于多方交流的...

【专利技术属性】
技术研发人员:江合文
申请(专利权)人:广东际洲科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1