数据处理方法及电子设备技术

技术编号：39186753 阅读：6 留言：0更新日期：2023-10-27 08:34

本申请实施例提供了一种数据处理方法及电子设备，涉及终端设备技术领域，该方法包括：在录音过程中，对实时录制的音频进行文本转换，可提升文本转换效率，以及在录音转文本的过程中获取关于时间戳与字符数量的原始记录数据，以用于定点播放音频，可提升音频和文本的定点播放的准确度。的定点播放的准确度。的定点播放的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法及电子设备

[0001]本申请实施例涉及终端设备
，尤其涉及一种数据处理方法及电子设备。

技术介绍

[0002]在一些场景中，例如听课、会议、采访等场景，用户常常需要使用电子设备来对现场语音进行录音，并在录音结束后将录音转换为文本。在录音结束后，用户对转换的文本具有修改需求，用户可通过操作电子设备重放录音来指导用户修改文本。
[0003]目前，电子设备只可以在录音结束后，对录音转换为文本，使得录音转文本的效率较低。且通过重放录音来修正文本时，电子设备容易存在定位不准确的问题。

技术实现思路

[0004]为了解决上述技术问题，本申请提供一种数据处理方法及电子设备。在该方法中，可录音过程中进行文本转换，可提升文本转换效率，以及在录音转文本的过程中获取关于时间戳与字符数量的原始记录数据，以用于定点播放音频，可提升音频和文本的定点播放的准确度。
[0005]第一方面，本申请实施例提供一种数据处理方法，该方法可应用于电子设备。该方法包括：响应于接收到的第一用户操作，在将音频数据转换为文本数据的过程中，获取第一信息；其中，所述音频数据为实时采集的音频数据，所述第一信息包括第一音频片段的第一时间戳与第一文本片段的第一字符数量的第一映射关系，其中，所述第一文本片段为所述第一音频片段的第一文本转换结果，所述音频数据包括至少一个所述第一音频片段，所述文本数据包括至少一个所述第一文本片段，所述第一时间戳为用于标识所述第一音频片段的起始时间点或结束时间点的时间戳；响应于接收到的第二用户操作，...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：响应于接收到的第一用户操作，在将音频数据转换为文本数据的过程中，获取第一信息；其中，所述音频数据为实时采集的音频数据，所述第一信息包括第一音频片段的第一时间戳与第一文本片段的第一字符数量的第一映射关系，其中，所述第一文本片段为所述第一音频片段的第一文本转换结果，所述音频数据包括至少一个所述第一音频片段，所述文本数据包括至少一个所述第一文本片段，所述第一时间戳为用于标识所述第一音频片段的起始时间点或结束时间点的时间戳；响应于接收到的第二用户操作，基于所述第一信息，将所述音频数据的播放进度更新至第二音频片段的第一起始时间点，以及将第二文本片段以预设显示方式显示；其中，所述第二文本片段为所述第二音频片段的第二文本转换结果；所述第二音频片段包括至少一个所述第一音频片段，所述第二文本片段包括至少一个所述第一文本片段。2.根据权利要求1所述的方法，其特征在于，所述第一文本片段中的最后一个字符为预设标点符号，其中，所述预设标点符号为语义表示断句的标点符号。3.根据权利要求2所述的方法，其特征在于，所述在将音频数据转换为文本数据的过程中，获取第一信息，包括：在将所述音频数据转换为所述文本数据的过程中，检测到所述音频数据的第三文本转换结果的类型为中间结果，基于所述第三文本转换结果中的所述预设标点符号，获取第二时间戳；基于所述第二时间戳，记录或更新与所述中间结果对应的，排列次序与时间戳的第一对应关系；其中，所述第二时间戳用于标识所述第三文本转换结果的生成时间，所述排列次序用于表示所述中间结果中所述预设标点符号的排列次序；在将所述音频数据转换为所述文本数据的过程中，检测到所述音频数据的第四文本转换结果的类型为最终结果，基于第二对应关系和所述第四文本转换结果，获取所述第一映射关系；其中，所述第二对应关系为与最近一次检测到的中间结果，对应的所述第一对应关系。4.根据权利要求3所述的方法，其特征在于，所述基于所述第三文本转换结果中的所述预设标点符号，获取第二时间戳，包括：检测到所述第三文本转换结果包括所述预设标点符号，且所述第三文本转换结果为首个中间结果，获取所述第二时间戳；或，检测到所述第三文本转换结果中所述预设标点符号的第一数量，大于上一次的第三文本转换结果中所述预设标点符号的第二数量，获取所述第二时间戳；或，检测到所述第一数量小于所述第二数量，获取所述第二时间戳。5.根据权利要求3或4所述的方法，其特征在于，所述基于所述第二时间戳，记录或更新与所述中间结果对应的，排列次序与时间戳的第一对应关系，包括：在与所述中间结果对应的所述第一对应关系中，记录或增加一条最后一个排列次序与所述第二时间戳的对应关系；或，
在与所述中间结果对应的所述第一对应关系中，将最后一个排列次序与时间戳的对应关系删除，以更新所述第一对应关系，并将更新后的所述第一对应关系中，与当前最后一个排列次序对应的时间戳更新为所述第二时间戳。6.根据权利要求1至5中任意一项所述的方法，其特征在于，所述基于第二对应关系和所述第四文本转换结果，获取所述第一映射关系，包括：基于所述第二对应关系中的排列次序，确定所述第四文本转换结果中所述至少一个第一文本片段各自的所述第一字符数量；基于所述第二对应关系中相互对应的排列次序与时间戳，确定与所述第四文本转换结果对应的音频数据中，所述至少一个第一音频片段各自的所述第一时间戳；基于所述第二对应关系中的排列次序，获取所述第一时间戳与所述第一字符数量的第一映射关系，其中，排列次序相同的所述第一时间戳与所述第一字符数量相互映射。7.根据权利要求1至6中任意一项所述的方法，其特征在于，所述响应于接收到的第二用户操作，基于所述第一信息，将所述音频数据的播放进度更新至第二音频片段的第一起始时间点，以及将第二文本片段以预设显示方式显示，包括：响应于接收到的所述第二用户操作，确定所述第一信息中的至少一个第一映射关系；基于所述至少一个第一映射关系和所述音频数据，确定至少一个第三音频片段，其中，所述至少一个第三音频片段中所述第一时间戳最早的第三音频片段为所述第二音频片段；基于所述至少一个第一映射关系和所述文本数据，确定至少一个第三文本片段，所述第二文本片段包括所述至少一个第三文本片段；基于...

【专利技术属性】
技术研发人员：丁小龙，徐亮，卞苏成，李英浩，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人