数据处理方法及电子设备技术

技术编号:39186753 阅读:6 留言:0更新日期:2023-10-27 08:34
本申请实施例提供了一种数据处理方法及电子设备,涉及终端设备技术领域,该方法包括:在录音过程中,对实时录制的音频进行文本转换,可提升文本转换效率,以及在录音转文本的过程中获取关于时间戳与字符数量的原始记录数据,以用于定点播放音频,可提升音频和文本的定点播放的准确度。的定点播放的准确度。的定点播放的准确度。

【技术实现步骤摘要】
数据处理方法及电子设备


[0001]本申请实施例涉及终端设备
,尤其涉及一种数据处理方法及电子设备。

技术介绍

[0002]在一些场景中,例如听课、会议、采访等场景,用户常常需要使用电子设备来对现场语音进行录音,并在录音结束后将录音转换为文本。在录音结束后,用户对转换的文本具有修改需求,用户可通过操作电子设备重放录音来指导用户修改文本。
[0003]目前,电子设备只可以在录音结束后,对录音转换为文本,使得录音转文本的效率较低。且通过重放录音来修正文本时,电子设备容易存在定位不准确的问题。

技术实现思路

[0004]为了解决上述技术问题,本申请提供一种数据处理方法及电子设备。在该方法中,可录音过程中进行文本转换,可提升文本转换效率,以及在录音转文本的过程中获取关于时间戳与字符数量的原始记录数据,以用于定点播放音频,可提升音频和文本的定点播放的准确度。
[0005]第一方面,本申请实施例提供一种数据处理方法,该方法可应用于电子设备。该方法包括:响应于接收到的第一用户操作,在将音频数据转换为文本数据的过程中,获取第一信息;其中,所述音频数据为实时采集的音频数据,所述第一信息包括第一音频片段的第一时间戳与第一文本片段的第一字符数量的第一映射关系,其中,所述第一文本片段为所述第一音频片段的第一文本转换结果,所述音频数据包括至少一个所述第一音频片段,所述文本数据包括至少一个所述第一文本片段,所述第一时间戳为用于标识所述第一音频片段的起始时间点或结束时间点的时间戳;响应于接收到的第二用户操作,基于所述第一信息,将所述音频数据的播放进度更新至第二音频片段的第一起始时间点,以及将第二文本片段以预设显示方式显示;其中,所述第二文本片段为所述第二音频片段的第二文本转换结果;所述第二音频片段包括至少一个所述第一音频片段,所述第二文本片段包括至少一个所述第一文本片段。
[0006]示例性的,所述第一信息中的第一映射关系涉及的文本片段是对应的音频片段的最终文本转换结果(简称最终结果),例如第一文本转换结果指代第一音频片段的最终文本转换结果,同理,第二文本转换结果指代第二音频片段的最终文本转换结果。
[0007]示例性的,第二用户操作可以是对录制后的音频数据进行播放进度调整的操作,以实现反向定点播放,或,对该音频数据转换后的文本数据的操作以实现正向定点播放。
[0008]示例性的,第二用户操作的形式还可以是实现上述正向定点播放或反向定点播放的语音输入,本申请对此不做限制。
[0009]这样,本实施例可在实时采集音频的过程中,对实时采集的音频转换为文本,并在音频转文本的过程中,获取到第一信息(又称原始记录数据),其中,原始记录数据中可包括音频片段的时间戳与文本片段的字符数量的映射关系,其中,该文本片段即为电子设备对
该该音频片段进行文本转换时的最终结果。这样,原始记录数据中的时间戳和字符数量均较为准确,那么利用原始记录数据,来对已录制完成的音频进行定点播放时,可较为准确的定位到需要播放的第二音频片段,以及在对音频数据已转换后的文本数据中,能够较为准确的定位到该第二音频片段的最终文本转换结果,能够准确的定位音频和文本。并且,录音转文本可在电子设备侧完成,可提升对录音转文本的效率。
[0010]根据第一方面,所述第一文本片段中的最后一个字符为预设标点符号,其中,所述预设标点符号为语义表示断句的标点符号。
[0011]示例性的,预设标点符号可包括但不限于:逗号、句号、感叹号、问号、分号、顿号等。
[0012]本实施例中,在对该音频数据转换成文本后的最终文本数据中可包括至少一个第一文本片段,每个第一文本片段中的最后一个字符为该预设标点符号,以此来实现对音频的文本转换,以及便于利用预设标点符号,来确定对应的至少一个第一音频片段的第一时间戳,可提升原始记录数据中第一时间戳的准确度。
[0013]根据第一方面,或者以上第一方面的任意一种实现方式,所述在将音频数据转换为文本数据的过程中,获取第一信息,包括:在将所述音频数据转换为所述文本数据的过程中,检测到所述音频数据的第三文本转换结果的类型为中间结果,基于所述第三文本转换结果中的所述预设标点符号,获取第二时间戳;基于所述第二时间戳,记录或更新与所述中间结果对应的,排列次序与时间戳的第一对应关系;其中,所述第二时间戳用于标识所述第三文本转换结果的生成时间,所述排列次序用于表示所述中间结果中所述预设标点符号的排列次序;在将所述音频数据转换为所述文本数据的过程中,检测到所述音频数据的第四文本转换结果的类型为最终结果,基于第二对应关系和所述第四文本转换结果,获取所述第一映射关系;其中,所述第二对应关系为与最近一次检测到的中间结果,对应的所述第一对应关系。
[0014]示例性的,在音频转文本的过程中,可对待转换的音频片段转换为临时结果(即中间结果),并且临时结果可迭代更新,在临时结果语义完整时,则将最近一次转换得到的临时结果作为最终结果(即最终文本转换结果)。
[0015]示例性的,在所述音频数据的第四文本转换结果的类型为最终结果时,则该第四文本转换结果与最近一次检测到的第三文本转换结果相同,即最终结果的文本内容与最近一次检测到的临时结果的文本内容相同。
[0016]示例性的,电子设备所使用的音频转文本算法的精度可为单个字符,即每次临时结果中增加或减少一个字符(单个字、单个词或符号等),就会输出一次更新后的临时结果。示例性的,临时结果的生成时间与临时结果的输出时间可以相同,那么可基于临时结果中的预设标点符号,来获取第二时间戳(例如当前音频采集时长,示例性的为当前录音时长)。在音频数据的文本转换结果的类型为最终结果时,则电子设备可基于最近一次检查到的临时结果对应的排列次序与时间戳的对应关系,来生成原始记录数据中的至少一个第一映射关系。在录音结束时,则可生成针对录制的音频数据以及对该音频数据转换的文本数据(包括至少一个最终结果)的原始记录数据。该实施例可提升原始记录数据中各第一映射关系的准确性。
[0017]根据第一方面,或者以上第一方面的任意一种实现方式,所述基于所述第三文本
转换结果中的所述预设标点符号,获取第二时间戳,包括:检测到所述第三文本转换结果包括所述预设标点符号,且所述第三文本转换结果为首个中间结果,获取所述第二时间戳;或,检测到所述第三文本转换结果中所述预设标点符号的第一数量,大于上一次的第三文本转换结果中所述预设标点符号的第二数量,获取所述第二时间戳;或,检测到所述第一数量小于所述第二数量,获取所述第二时间戳。
[0018]示例性的,在实时录音转文本的过程中,可依次生成一组至少一个临时结果(即中间结果),以及与该至少一个临时结果对应的最终结果。在生成本次最终结果之后,可继续生成下一组至少一个临时结果,以及与该下一组至少一个临时结果对应的下一个最终结果,那么依次得到的最终结果即为音频数据的最终文本转换结果。那么在每生成一组至少一个临时结果时,对于生成的首个临时结果,且该首个临时结果包括预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:响应于接收到的第一用户操作,在将音频数据转换为文本数据的过程中,获取第一信息;其中,所述音频数据为实时采集的音频数据,所述第一信息包括第一音频片段的第一时间戳与第一文本片段的第一字符数量的第一映射关系,其中,所述第一文本片段为所述第一音频片段的第一文本转换结果,所述音频数据包括至少一个所述第一音频片段,所述文本数据包括至少一个所述第一文本片段,所述第一时间戳为用于标识所述第一音频片段的起始时间点或结束时间点的时间戳;响应于接收到的第二用户操作,基于所述第一信息,将所述音频数据的播放进度更新至第二音频片段的第一起始时间点,以及将第二文本片段以预设显示方式显示;其中,所述第二文本片段为所述第二音频片段的第二文本转换结果;所述第二音频片段包括至少一个所述第一音频片段,所述第二文本片段包括至少一个所述第一文本片段。2.根据权利要求1所述的方法,其特征在于,所述第一文本片段中的最后一个字符为预设标点符号,其中,所述预设标点符号为语义表示断句的标点符号。3.根据权利要求2所述的方法,其特征在于,所述在将音频数据转换为文本数据的过程中,获取第一信息,包括:在将所述音频数据转换为所述文本数据的过程中,检测到所述音频数据的第三文本转换结果的类型为中间结果,基于所述第三文本转换结果中的所述预设标点符号,获取第二时间戳;基于所述第二时间戳,记录或更新与所述中间结果对应的,排列次序与时间戳的第一对应关系;其中,所述第二时间戳用于标识所述第三文本转换结果的生成时间,所述排列次序用于表示所述中间结果中所述预设标点符号的排列次序;在将所述音频数据转换为所述文本数据的过程中,检测到所述音频数据的第四文本转换结果的类型为最终结果,基于第二对应关系和所述第四文本转换结果,获取所述第一映射关系;其中,所述第二对应关系为与最近一次检测到的中间结果,对应的所述第一对应关系。4.根据权利要求3所述的方法,其特征在于,所述基于所述第三文本转换结果中的所述预设标点符号,获取第二时间戳,包括:检测到所述第三文本转换结果包括所述预设标点符号,且所述第三文本转换结果为首个中间结果,获取所述第二时间戳;或,检测到所述第三文本转换结果中所述预设标点符号的第一数量,大于上一次的第三文本转换结果中所述预设标点符号的第二数量,获取所述第二时间戳;或,检测到所述第一数量小于所述第二数量,获取所述第二时间戳。5.根据权利要求3或4所述的方法,其特征在于,所述基于所述第二时间戳,记录或更新与所述中间结果对应的,排列次序与时间戳的第一对应关系,包括:在与所述中间结果对应的所述第一对应关系中,记录或增加一条最后一个排列次序与所述第二时间戳的对应关系;或,
在与所述中间结果对应的所述第一对应关系中,将最后一个排列次序与时间戳的对应关系删除,以更新所述第一对应关系,并将更新后的所述第一对应关系中,与当前最后一个排列次序对应的时间戳更新为所述第二时间戳。6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述基于第二对应关系和所述第四文本转换结果,获取所述第一映射关系,包括:基于所述第二对应关系中的排列次序,确定所述第四文本转换结果中所述至少一个第一文本片段各自的所述第一字符数量;基于所述第二对应关系中相互对应的排列次序与时间戳,确定与所述第四文本转换结果对应的音频数据中,所述至少一个第一音频片段各自的所述第一时间戳;基于所述第二对应关系中的排列次序,获取所述第一时间戳与所述第一字符数量的第一映射关系,其中,排列次序相同的所述第一时间戳与所述第一字符数量相互映射。7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述响应于接收到的第二用户操作,基于所述第一信息,将所述音频数据的播放进度更新至第二音频片段的第一起始时间点,以及将第二文本片段以预设显示方式显示,包括:响应于接收到的所述第二用户操作,确定所述第一信息中的至少一个第一映射关系;基于所述至少一个第一映射关系和所述音频数据,确定至少一个第三音频片段,其中,所述至少一个第三音频片段中所述第一时间戳最早的第三音频片段为所述第二音频片段;基于所述至少一个第一映射关系和所述文本数据,确定至少一个第三文本片段,所述第二文本片段包括所述至少一个第三文本片段;基于...

【专利技术属性】
技术研发人员:丁小龙徐亮卞苏成李英浩
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1