音频数据的文本显示方法和装置制造方法及图纸

技术编号：33837230 阅读：27 留言：0更新日期：2022-06-16 11:55

本发明专利技术提供了一种音频数据的文本显示方法和装置，该方法包括：如果获取到音频数据，对音频数据进行语音识别，得到文本数据；对文本数据进行预处理，得到多个文本片段；针对每个文本片段，按照预设文本长度和预设时间间隔，对当前文本片段进行文本分割，得到当前文本片段对应的至少一个子文本；对每个文本片段对应的子文本进行排序，并显示排序结果。该方式中，按照预设文本长度和预设时间间隔分割通话记录对应的文本数据，使得展示的每个子文本内容不会太密集，文本的展示形式更美观，结果更易读，同时该方式可帮助用户快速了解录音内容，通过生成并展示录音文本，联动播放文本对应录音，避免了听录音效率低，看文本易丢失信息的问题。问题。问题。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据的文本显示方法和装置

[0001]本专利技术涉及计算机信息
，尤其是涉及一种音频数据的文本显示方法和装置。

技术介绍

[0002]当用户需要了解通话内容时，看文本比听录音的效率要高很多，但是文本表达的信息可能与录音存在一定偏差。因而，相关技术中提供了一种展示通话录音内容的方法，该方法对通话录音进行自动语音识别，得到带角色和时间戳信息的文本，并将角色一次发话作为一个气泡，但得到的角色定位结果比较粗糙，如一次发话过程有较长的停顿，那么播放时停顿会以静音形式消耗时间；其次，角色一次发话内容较多时，一个气泡中内容会比较密集，阅读体验较差，比如出现看串行问题。

技术实现思路

[0003]本专利技术的目的在于提供一种音频数据的文本显示方法和装置，以解决听录音效率低，看文本丢失信息的问题。
[0004]第一方面，本专利技术提供一种音频数据的文本显示方法，该方法包括：如果获取到音频数据，对音频数据进行语音识别，得到文本数据；对文本数据进行预处理，得到多个文本片段；针对每个文本片段，按照预设文本长度和预设...

【技术保护点】

【技术特征摘要】
1.一种音频数据的文本显示方法，其特征在于，所述方法包括：如果获取到音频数据，对所述音频数据进行语音识别，得到文本数据；对所述文本数据进行预处理，得到多个文本片段；针对每个所述文本片段，按照预设文本长度和预设时间间隔，对当前文本片段进行文本分割，得到所述当前文本片段对应的至少一个子文本；对每个所述文本片段对应的子文本进行排序，并显示排序结果。2.根据权利要求1所述的方法，其特征在于，所述按照预设文本长度和预设时间间隔，对当前文本片段进行文本分割，得到所述当前文本片段对应的至少一个子文本的步骤，包括：根据所述当前文本片段所包含字符的长度和所述预设文本长度，确定所述当前文本片段分割后的子文本所包含的目标字符数量；基于所述当前文本片段对应的时间区间和所述预设时间间隔，确定所述当前文本片段分割后的子本文的目标时间长度；根据所述目标字符数量和所述目标时间长度，对所述当前文本片段进行分割，以将所述当前文本片段分割为至少一个子文本。3.根据权利要求2所述的方法，其特征在于，所述根据所述当前文本片段所包含字符的长度和所述预设文本长度，确定所述当前文本片段分割后的子文本所包含的目标字符数量的步骤，包括：对所述当前文本片段所包含字符的长度与所述预设文本长度相除的结果进行向上取整，得到第一数值；将所述第一数值确定为所述当前文本片段被分割为子文本的分割数量；将所述当前文本片段所包含字符的长度与所述第一数值相除的结果，确定为所述目标字符数量；所述基于所述当前文本片段对应的时间区间和所述预设时间间隔，确定所述当前文本片段分割后的子本文的目标时间长度的步骤，包括：对所述当前文本片段对应的时间区间与所述预设时间间隔相除的结果进行向上取整，得到第二数值；将所述第二数值确定为所述当前文本片段被分割为子文本的分割数量；将所述当前文本片段对应的时间区间与所述第二数值相除的结果，确定为所述目标时间长度。4.根据权利要求2所述的方法，其特征在于，每个所述文本片段所包含的字符均对应有时间戳；所述根据所述目标字符数量和所述目标时间长度，对所述当前文本片段进行分割，以将所述当前文本片段分割为至少一个子文本的步骤，包括：从所述当前文本片段中取出第一个字符；根据从所述当前文本片段中取出的字符，构建当前子文本；基于所述第一个字符对应的时间戳，确定所述当前子文本对应的字符长度和持续时长；如果所述字符长度小于所述目标字符数量且所述持续时长小于所述目标时间长度，从所述当前文本片段中取出所述第一个字符的下一个字符，将所述第一个字...

【专利技术属性】
技术研发人员：王建辉，杜新凯，吕超，史祎凡，崔术丰，吴岩，李根，
申请(专利权)人：阳光保险集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人