一种信息处理方法及终端设备技术

技术编号:36101636 阅读:12 留言:0更新日期:2022-12-28 14:00
本申请公开了一种信息处理方法及终端设备,用以在用户录音的同时通过声纹识别对录音中出现的人物角色进行区分,并进行语音识别转变以文字对话形式显示。本申请提供的信息处理方法包括:基于实时收录的录音,确定当前录音片段,并对当前录音片段进行声纹特征采集和语音转文字识别;将当前录音片段对应的声纹特征与已采集的声纹特征进行对比,根据对比结果,将当前录音片段对应的文字输出显示。将当前录音片段对应的文字输出显示。将当前录音片段对应的文字输出显示。

【技术实现步骤摘要】
一种信息处理方法及终端设备


[0001]本申请涉及信息
,尤其涉及一种信息处理方法及终端设备。

技术介绍

[0002]用户使用录音功能的场景下,往往不只有一个角色。会议、访谈等才是录音功能的主要使用场景,这些场景往往存在多个任务角色。
[0003]普通录音设备只能将接收到的声音录制成一个录音文件。如果用户需要整理录音记录的话,很难区分录音角色,以及各角色发言的时间点,只能从头到尾反复听录音文件。

技术实现思路

[0004]本申请实施例提供了一种信息处理方法及终端设备,用以在用户录音的同时通过声纹识别对录音中出现的人物角色进行区分,并进行语音识别转变以文字对话形式显示。
[0005]本申请实施例提供的一种信息处理方法包括:
[0006]基于实时收录的录音,确定当前录音片段,并对当前录音片段进行声纹特征采集和语音转文字识别;
[0007]将当前录音片段对应的声纹特征与已采集的声纹特征进行对比,根据对比结果,将当前录音片段对应的文字输出显示。
[0008]通过该方法基于实时收录的录音,确定当前录音片段,并对当前录音片段进行声纹特征采集和语音转文字识别;将当前录音片段对应的声纹特征与已采集的声纹特征进行对比,根据对比结果,将当前录音片段对应的文字输出显示,从而实现了在用户录音的同时通过声纹识别对录音中出现的人物角色进行区分,并进行语音识别转变以文字对话形式显示。
[0009]可选地,根据对比结果,将当前录音片段对应的文字输出显示,具体包括:
[0010]若当前录音片段对应的声纹特征与已采集的声纹特征相同,则将当前录音片段对应的声纹特征标记为此相同声纹特征的标记;若当前录音片段对应的声纹特征与已采集的声纹特征不同,则将当前录音片段对应的声纹特征设置新的标记;
[0011]若当前录音片段对应的声纹特征与上一录音片段的声纹特征相同,则将当前录音片段对应的文字合并显示在上一录音片段对应的文字输出显示的会话框中;若当前录音片段对应的声纹特征与上一录音片段的声纹特征不同,则将当前录音片段对应的文字单独显示在新的会话框中,并且同时显示当前录音片段对应的声纹特征的标记。
[0012]可选地,基于实时收录的录音,确定当前录音片段,具体包括:
[0013]将实时收录的录音进行断句,每个自然句作为一个录音片段。
[0014]可选地,该方法还包括:
[0015]通过提供给用户的应用主界面,接收录音列表按键指令,并输出录音列表界面给用户,其中,对于包含角色及文字识别的录音文件,所述录音列表界面显示预设符号标记。
[0016]可选地,该方法还包括:
[0017]通过所述录音列表界面接收用户对包含角色及文字识别的录音文件的选中指令,并输出录音播放界面,所述录音播放界面至少包括下列信息之一或组合:
[0018]声纹特征的标记、会话框列表、每个会话框对应录音的时间点、时长。
[0019]可选地,该方法还包括:
[0020]通过所述录音播放界面,接收用户对任一会话框的选中指令,并展示角色设置与编辑界面,该角色设置与编辑界面上包括可供用户编辑的该会话框中的文字内容。
[0021]可选地,所述角色设置与编辑界面还包括:功能菜单,所述功能菜单至少包括下列功能按键之一或组合:
[0022]修改角色、角色命名、设置头像、播放。
[0023]可选地,该方法还包括:
[0024]所述录音播放界面还包括导出文本按键,当用户点击该导出文本按键时,输出展示预设格式的文件界面,该文件界面至少包括所述录音文件的下列内容之一或组合:
[0025]录音文件的名称、录制时间、会话文本。
[0026]可选地,该方法还包括:
[0027]所述文件界面还包括确认保存按键,当用户点击该确认保存按键时,生成预设格式的文件。
[0028]本申请另一实施例提供了一种终端设备,其包括存储器和处理器,其中,所述存储器用于存储程序指令,所述处理器用于调用所述存储器中存储的程序指令,按照获得的程序执行上述任一种方法。
[0029]本申请另一实施例提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行上述任一种方法。
附图说明
[0030]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031]图1为本申请实施例提供的角色区分与显示的手机界面示意图;
[0032]图2为本申请实施例提供的将声纹特征“A”识别显示出的文字显示在第一会话框的示意图;
[0033]图3为本申请实施例提供的将声纹特征“B”识别显示出的文字显示在第二会话框的示意图;
[0034]图4为本申请实施例提供的录音播放的操作界面示意图;
[0035]图5为本申请实施例提供的角色设置与编辑的操作界面示意图;
[0036]图6为本申请实施例提供的编辑文本的操作界面示意图;
[0037]图7为本申请实施例提供的修改角色的操作界面示意图;
[0038]图8为本申请实施例提供的角色命名的操作界面示意图;
[0039]图9为本申请实施例提供的设置头像的操作界面示意图;
[0040]图10为本申请实施例提供的单独播放会话框的操作界面示意图;
功能开关(图1中手机屏幕显示的“文”字按钮),并点击“开始”(图1中手机屏幕显示的“文”字按钮旁边的灰色按钮,当然在实际显示是,可以是红色或其他颜色,具体样式本申请实施例不进行限制)录音后,手机开始进行角色区分,如图1中最右侧的手机屏幕显示内容的示例,其中的“A”,“B”,“C”分别表示不同角色,即不同人物,若结束录音,可以点击图1中最右侧的手机屏幕右下角的按钮。另外,图1最右侧界面左下角的带有小红旗标记的按键,其功能是,在录音播放过程中,和/或实时录音过程中,用户可以点击该按键,进行重点时间点的标记,那么在录音播放界面(图4最右侧界面),录音播放的时间轴上,会显示该小红旗标记,从而帮助用户快速定位录音的重要时刻。
[0054]角色区分步骤,具体如下:
[0055]1、将实时收录的录音进行断句,每个自然句作为一个录音片段,并依次标记为片段1、片段2、片段3、片段4......
[0056]2、片段1采集完成后,对片段1进行声纹特征采集和语音转文字识别。将采集到的声纹特征标记为“A”,那么“A”即代表本申请实施例所述的一个角色。将识别显示出的文字标记显示第一会话框中。如图2所示,将角色“A”的语音转成的文字“你好”显示在第一会话框中。
[0057]3、片段2采集完成后,对片段2进行声纹特征采集和语音转文字识别。将采集到的声纹特征与已采集的“A”的声纹特征进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,该方法包括:基于实时收录的录音,确定当前录音片段,并对当前录音片段进行声纹特征采集和语音转文字识别;将当前录音片段对应的声纹特征与已采集的声纹特征进行对比,根据对比结果,将当前录音片段对应的文字输出显示。2.根据权利要求1所述的方法,其特征在于,根据对比结果,将当前录音片段对应的文字输出显示,具体包括:若当前录音片段对应的声纹特征与已采集的声纹特征相同,则将当前录音片段对应的声纹特征标记为此相同声纹特征的标记;若当前录音片段对应的声纹特征与已采集的声纹特征不同,则将当前录音片段对应的声纹特征设置新的标记;若当前录音片段对应的声纹特征与上一录音片段的声纹特征相同,则将当前录音片段对应的文字合并显示在上一录音片段对应的文字输出显示的会话框中;若当前录音片段对应的声纹特征与上一录音片段的声纹特征不同,则将当前录音片段对应的文字单独显示在新的会话框中,并且同时显示当前录音片段对应的声纹特征的标记。3.根据权利要求1所述的方法,其特征在于,该方法还包括:通过提供给用户的应用主界面,接收录音列表按键指令,并输出录音列表界面给用户,其中,对于包含角色及文字识别的录音文件,所述录音列表界面显示预设符号标记。4.根据权利要求3所述的方法,其特征在于,该方法还包括:通过所述录音列表界面接收用户对包含角色及文字识别的录音文件的选中指令,并输出录音播放...

【专利技术属性】
技术研发人员:赵子龙王倩
申请(专利权)人:青岛海信移动通信技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1