基于多方交流的语音数据文字转化方法技术

技术编号：28478816 阅读：24 留言：0更新日期：2021-05-15 21:48

本发明专利技术涉及数字信息传输技术领域，具体地说，涉及基于多方交流的语音数据文字转化方法。其包括识别多方设备端输入的预设密令步骤、对群聊内各个设备端交流的语音数据进行文字转化步骤、将语音数据以及其转化后的文字数据通过存储器进行存储步骤和将关键文字数据和关键标题进行整合步骤。本发明专利技术中通过关键标题和关键文字数据进行整合对多方交流的语音数据转化后的文字进行整合，并通过预选标记的方式将关键标题，进而解决现有技术中语音数据转换针对性不足的问题，而且整理后大大提高了后期人工筛选的效率。后期人工筛选的效率。后期人工筛选的效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于多方交流的语音数据文字转化方法

[0001]本专利技术涉及数字信息传输
，具体地说，涉及基于多方交流的语音数据文字转化方法。

技术介绍

[0002]目前，随着聊天工具的不断更新换代，已经由以前的文字聊天转换成了语音聊天，其中：聊天工具又称IM软件或者IM工具，指的是提供基于互联网络的客户端进行实时语音、文字传输的工具，从技术上讲，主要分为基于服务器的IM工具软件和基于P2P技术的IM工具软件，这种实时传讯与电子邮件最大的不同在于不用等候，不需要每隔两分钟就按一次“传送与接收”，只要两个人都同时在线，就能像多媒体电话一样，传送文字、档案、声音、影像给对方，只要有网络，无论对方在天涯海角，或是双方隔得多远都没有距离。
[0003]因此，很多的企业开会、学校授课都应用到了这种实时传讯的数字信息传输技术，也就是通过建立群聊的方式将多个设备端进行数据传输，但现有的视频群聊、还是语音群聊都只是对交流过程中所有的语音数据进行转化，这样的文字转化并没有足够的针对性，还需要后期整理的人员对不需要转化文字进行筛选。

技术实现思路

[0004]本专利技术的目的在于提供基于多方交流的语音数据文字转化方法，以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的，本专利技术提供基于多方交流的语音数据文字转化方法，包括如下方法步骤：首先识别多方设备端输入的预设密令，其包括两种姿态：姿态一、预设密令正确，则对该设备端进行标记，并输出各个设备端的标记，根据设备端的标记构建群聊；姿态二、预设密令不正确，则...

【技术保护点】

【技术特征摘要】
1.基于多方交流的语音数据文字转化方法，其特征在于，包括如下方法步骤：首先识别多方设备端输入的预设密令，其包括两种姿态：姿态一、预设密令正确，则对该设备端进行标记，并输出各个设备端的标记，根据设备端的标记构建群聊；姿态二、预设密令不正确，则继续弹出输入窗口；对群聊内各个设备端交流的语音数据进行文字转化；将语音数据以及其转化后的文字数据通过存储器进行存储；在存储器内提取出预选标记设备端输出的语音数据以及其转化后的文字数据，然后根据提取出的文字数据识别预选标记设备端的关键数据信息，以形成关键标题，而后提取出其余标记设备端在关键标题之后下一个关键标题出现之前输出的语音数据以及其转化后的文字数据，以形成关键文字数据；将关键文字数据和关键标题进行整合，具体的，先根据关键标题对关键文字数据进行筛选，筛选出价值文字数据，并将价值文字数据、语音数据以及设备端标记相互对应的补入在群聊的显示框内。2.根据权利要求1所述的基于多方交流的语音数据文字转化方法，其特征在于：所述预选标记设备端的关键数据信息包括重点文字信息、语气助词信息和关键词提取信息。3.根据权利要求1所述的基于多方交流的语音数据文字转化方法，其特征在于：所述关键数据信息提取采用加权提取算法，其算法步骤如下：根据语音数据中的声音间隔和声音的语气进行标点符号断句；利用加权因子对预选标记设备端文字数据的词频、词长、词性、位置和词典因子进行量化处理，量化后进行权重计算，得出各个因子总权值；利用降序排列的方式对权值相对应的词语进行排序，得出关键词列表，通过关键词列表获取关键数据信息。4.根据权利要求3所述的基于多方交流的...

【专利技术属性】
技术研发人员：江合文，
申请(专利权)人：广东际洲科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人