数据处理方法、装置及存储介质制造方法及图纸

技术编号:39294045 阅读:10 留言:0更新日期:2023-11-07 11:01
本申请提供一种数据处理方法、装置及存储介质,涉及计算机技术领域,能够高效且准确地对语音数据进行处理。该方法包括:获取线上会议的语音数据;根据多个预设声纹特征对所述语音数据进行识别处理,得到与多个语音对象一一对应的多个文本数据;根据多个预设字词在所述多个文本数据中进行匹配,确定所述多个文本数据内的多个目标字词,以及与所述多个目标字词一一对应的多个目标时刻;按照预设模板和所述多个目标时刻的先后顺序,对所述多个目标字词和各所述语音对象对应的所述文本数据进行结构化处理,得到与所述语音数据对应的处理结果。本申请用于对语音数据进行处理。本申请用于对语音数据进行处理。本申请用于对语音数据进行处理。

【技术实现步骤摘要】
数据处理方法、装置及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置及存储介质。

技术介绍

[0002]随着网络技术的发展和智能视频终端的普及,更多企业和个人选择通过网络召开线上会议。一般来说,在每次进行会议时都需要对会议做记录,以便后续对会议重点内容进行回顾。
[0003]目前,主要通过人工记录的方式整理会议记录。但是,这种依赖于人工的方式容易出现漏记等问题,效率较低且错误率较高。

技术实现思路

[0004]本申请提供一种数据处理方法、装置及存储介质,能够高效且准确地对语音数据进行处理。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,本申请提供一种数据处理方法,该方法包括:获取线上会议的语音数据;根据多个预设声纹特征对语音数据进行识别处理,得到与多个语音对象一一对应的多个文本数据;根据多个预设字词在多个文本数据中进行匹配,确定多个文本数据内的多个目标字词,以及与多个目标字词一一对应的多个目标时刻;按照预设模板和多个目标时刻的先后顺序,对多个目标字词和各语音对象对应的文本数据进行结构化处理,得到与语音数据对应的处理结果。
[0007]一种可能的方式中,在按照预设模板和多个目标时刻的先后顺序,对多个目标字词和各语音对象对应的文本数据进行结构化处理,得到与语音数据对应的处理结果之后,方法还包括:对处理结果和语音数据进行加密处理,得到加密后数据;获取各语音对象对应的数据接收地址,并向各语音对象对应的数据接收地址发送加密后数据;数据接收地址包括邮箱地址。
[0008]一种可能的方式中,获取线上会议的语音数据,包括:对线上会议的音频数据和/或视频数据进行提取处理,得到语音数据。
[0009]一种可能的方式中,根据多个预设字词在多个文本数据中进行匹配,确定多个文本数据内的多个目标字词,以及与多个目标字词一一对应的多个目标时刻,包括:将多个文本数据中与预设字词匹配的字词确定为目标字词,并将目标字词对应的时刻确定为目标时刻,得到多个目标字词和多个目标时刻。
[0010]第二方面,本申请提供一种数据处理装置,该装置包括:获取单元、处理单元和确定单元;获取单元,用于获取线上会议的语音数据;处理单元,用于根据多个预设声纹特征对语音数据进行识别处理,得到与多个语音对象一一对应的多个文本数据;确定单元,用于根据多个预设字词在多个文本数据中进行匹配,确定多个文本数据内的多个目标字词,以及与多个目标字词一一对应的多个目标时刻;处理单元,还用于按照预设模板和多个目标
时刻的先后顺序,对多个目标字词和各语音对象对应的文本数据进行结构化处理,得到与语音数据对应的处理结果。
[0011]一种可能的方式中,该装置还包括:发送单元;处理单元,还用于对处理结果和语音数据进行加密处理,得到加密后数据;获取单元,还用于获取各语音对象对应的数据接收地址;发送单元,用于向各语音对象对应的数据接收地址发送加密后数据;数据接收地址包括邮箱地址。
[0012]一种可能的方式中,获取单元,具体用于:对线上会议的音频数据和/或视频数据进行提取处理,得到语音数据。
[0013]一种可能的方式中,确定单元,具体用于:将多个文本数据中与预设字词匹配的字词确定为目标字词,并将目标字词对应的时刻确定为目标时刻,得到多个目标字词和多个目标时刻。
[0014]第三方面,本申请提供了一种数据处理装置,该装置包括:处理器和通信接口;通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的数据处理方法。
[0015]第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端上运行时,使得终端执行如第一方面和第一方面的任一种可能的实现方式中描述的数据处理方法。
[0016]第五方面,本申请实施例提供一种包含指令的计算机程序产品,当计算机程序产品在数据处理装置上运行时,使得数据处理装置执行如第一方面和第一方面的任一种可能的实现方式中所描述的数据处理方法。
[0017]第六方面,本申请实施例提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的数据处理方法。
[0018]具体的,本申请实施例中提供的芯片还包括存储器,用于存储计算机程序或指令。
[0019]基于上述技术方案,本申请提供的数据处理方法,可以获取线上会议的语音数据,以便于根据多个预设声纹特征对语音数据进行识别处理,得到与多个语音对象一一对应的多个文本数据,以进一步根据多个预设字词在多个文本数据中进行匹配,确定多个文本数据内的多个目标字词,以及与多个目标字词一一对应的多个目标时刻,从而能够按照预设模板和多个目标时刻的先后顺序,对多个目标字词和各语音对象对应的文本数据进行结构化处理,得到语音数据对应的处理结果。
[0020]相比于采用人工记录会议纪要的方式,本申请中的数据处理装置可以获取线上会议的语音数据,然后经过处理得到与多个语音对象一一对应的多个文本数据,在对文字数据进行处理后得到处理结果,并且可以根据多个预设字词,识别到多个文本数据中包括的多个目标字词和多个目标时刻,从而能够准确地对数据进行处理。基于此,本申请能够避免依赖于人工容易导致的错误率高且效率较低等问题,实现了对于会议内容的记录。因此,本申请能够高效且准确地对语音数据进行处理。
附图说明
[0021]图1为本申请实施例提供的一种数据处理系统的结构示意图;
[0022]图2为本申请实施例提供的一种数据处理装置的硬件结构示意图;
[0023]图3为本申请实施例提供的一种数据处理方法的流程示意图;
[0024]图4为本申请实施例提供的一种预设模板的示意图;
[0025]图5为本申请实施例提供的另一种数据处理方法的流程示意图;
[0026]图6为本申请实施例提供的一种数据处理流程的示意图;
[0027]图7为本申请实施例提供的一种数据处理装置的结构示意图。
具体实施方式
[0028]下面结合附图对本申请实施例提供的数据处理方法、装置及存储介质进行详细地描述。
[0029]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
[0030]本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
[0031]此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取线上会议的语音数据;根据多个预设声纹特征对所述语音数据进行识别处理,得到与多个语音对象一一对应的多个文本数据;根据多个预设字词在所述多个文本数据中进行匹配,确定所述多个文本数据内的多个目标字词,以及与所述多个目标字词一一对应的多个目标时刻;按照预设模板和所述多个目标时刻的先后顺序,对所述多个目标字词和各所述语音对象对应的所述文本数据进行结构化处理,得到与所述语音数据对应的处理结果。2.根据权利要求1所述数据处理方法,其特征在于,在所述按照预设模板和所述多个目标时刻的先后顺序,对所述多个目标字词和各所述语音对象对应的所述文本数据进行结构化处理,得到与所述语音数据对应的处理结果之后,所述方法还包括:对所述处理结果和所述语音数据进行加密处理,得到加密后数据;获取各所述语音对象对应的数据接收地址,并向各所述语音对象对应的数据接收地址发送所述加密后数据;所述数据接收地址包括邮箱地址。3.根据权利要求2所述数据处理方法,其特征在于,所述获取线上会议的语音数据,包括:对所述线上会议的音频数据和/或视频数据进行提取处理,得到所述语音数据。4.根据权利要求3所述数据处理方法,其特征在于,所述根据多个预设字词在所述多个文本数据中进行匹配,确定所述多个文本数据内的多个目标字词,以及与所述多个目标字词一一对应的多个目标时刻,包括:将所述多个文本数据中与所述预设字词匹配的字词确定为所述目标字词,并将所述目标字词对应的时刻确定为所述目标时刻,得到所述多个目标字词和所述多个目标时刻。5.一种数据处理装置,其特征在于,所述装置包括:获取单元、处理单元和确定单元;所述获取单元,用于获取线上会议的语音数据;所述处理单元,用于根据多个预设声纹特征对所述获取单元获取...

【专利技术属性】
技术研发人员:张迎王文剑魏丰硕李晓
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1