一种智能展示语音转文字方法、系统及介质技术方案

技术编号:38005030 阅读:8 留言:0更新日期:2023-06-30 10:20
本发明专利技术公开了一种智能展示语音转文字方法、系统及介质,所述方法包括以下步骤:在捕获到音视频文件时,将所述音视频文件转换成文本;根据预先约定的标点符号分割每句文本,得到分割后的语句文本信息;查找预先建立的字典表;若所述字典表里查找到与所述分割后的语句文本信息相对应的历史数据,则从所述字典表中获取对应的先前合并好的文本段落;对所述文本段落进行渲染;根据敏感词、禁用词或者搜索词对渲染后的文本段落内容中的单字符进行处理;将处理后的单字符与所述文本段落同步在页面展示。通过本发明专利技术,用户可以快速找出违规地方所在,还可以快速跳转到对应的进度来进行人工审核,确认问题是否存在,极大的减少了用户合规处理的工作量。规处理的工作量。规处理的工作量。

【技术实现步骤摘要】
一种智能展示语音转文字方法、系统及介质


[0001]本专利技术涉及语音处理
,特别涉及一种智能展示语音转文字方法、系统及介质。

技术介绍

[0002]目前,市面上大部分都是提供媒体流数据的画面监控服务,用户如果需要判断音视频中的话术是否存在问题,需要自己逐帧逐秒播放来进行确认,在长时间的音视频中无疑是浪费人力的,效率也十分低下。
[0003]现在可借用市面上比较成熟的厂商,例如讯飞、腾讯云等来返回媒体流中语音相关的文本,但暂时没有提供定制的语句组合段落,敏感词和禁用词高亮、搜索等功能,用户在寻找不合法词汇以及定位到对应的播放点仍存在比较多的困难。

技术实现思路

[0004]本专利技术的主要目的提出一种智能展示语音转文字方法、系统及介质,旨在实现音视频播放进度和渲染的语句同步,同时根据特定的敏感词和禁用词的词库高亮度展示词汇,给用户比较直观的感受,以及通过搜索功能快速找出违规地方所在,快速跳转到对应的进度来进行人工审核,确认问题是否存在,极大的减少用户合规处理的工作量,提升工作效率。
[0005]为实现上述目的,本专利技术提供了一种智能展示语音转文字方法,所述方法包括以下步骤:
[0006]在捕获到音视频文件时,将所述音视频文件转换成文本;
[0007]根据预先约定的标点符号分割每句文本,得到分割后的语句文本信息;
[0008]查找预先建立的字典表;
[0009]若所述字典表里查找到与所述分割后的语句文本信息相对应的历史数据,则从所述字典表中获取对应的先前合并好的文本段落;
[0010]对所述文本段落进行渲染;
[0011]根据敏感词、禁用词或者搜索词对渲染后的文本段落内容中的单字符进行处理;
[0012]将处理后的单字符与所述文本段落同步在页面展示。
[0013]本专利技术进一步的技术方案是,所述查找预先建立的字典表的步骤之后还包括:
[0014]若所述字典表里没有查找到与所述分割后的语句文本信息相对应的历史数据,则获取文本增幅数量;
[0015]根据语句文本增幅数量采用对应的策略将所述分割后的语句文本信息进行段落合并。
[0016]本专利技术进一步的技术方案是,所述根据语句文本增幅数量采用对应的策略将所述分割后的语句文本信息进行段落合并的步骤包括:
[0017]将所述语句文本增幅数量与预设阈值相比对;
[0018]若所述语句文本增幅数量大于或等于所述预设阈值,则每隔一段预设时间处理预设数量的语句文本来合并段落;
[0019]若所述语句文本增幅数量大于或等于所述预设阈值,则直接合并段落。
[0020]本专利技术进一步的技术方案是,所述预设阈值为100句,所述预设时长为200ms。
[0021]本专利技术进一步的技术方案是,所述根据敏感词、禁用词或者搜索词对渲染后的文本段落内容中的单字符进行处理的步骤包括:
[0022]根据敏感词、禁用词或者搜索词的变化,给段落的每个字符设置对应的类型集合,并进行存储。
[0023]为实现上述目的,本专利技术还提出一种智能展示语音转文字系统,所述系统包括存储器、处理器以及存储在所述处理器上的智能展示语音转文字程序,所述智能展示语音转文字程序被所述处理器运行时执行以下步骤:
[0024]在捕获到音视频文件时,将所述音视频文件转换成文本;
[0025]根据预先约定的标点符号分割每句文本,得到分割后的语句文本信息;
[0026]查找预先建立的字典表;
[0027]若所述字典表里查找到与所述分割后的语句文本信息相对应的历史数据,则从所述字典表中获取对应的先前合并好的文本段落;
[0028]对所述文本段落进行渲染;
[0029]根据敏感词、禁用词或者搜索词对渲染后的文本段落内容中的单字符进行处理;
[0030]将处理后的单字符与所述文本段落同步在页面展示。
[0031]本专利技术进一步的技术方案是,所述智能展示语音转文字程序被所述处理器运行时还执行以下步骤:
[0032]若所述字典表里没有查找到与所述分割后的语句文本信息相对应的历史数据,则获取文本增幅数量;
[0033]根据语句文本增幅数量采用对应的策略将所述分割后的语句文本信息进行段落合并。
[0034]本专利技术进一步的技术方案是,所述智能展示语音转文字程序被所述处理器运行时还执行以下步骤:
[0035]将所述语句文本增幅数量与预设阈值相比对;
[0036]若所述语句文本增幅数量大于或等于所述预设阈值,则每隔一段预设时间处理预设数量的语句文本来合并段落;
[0037]若所述语句文本增幅数量大于或等于所述预设阈值,则直接合并段落。
[0038]本专利技术进一步的技术方案是,所述预设阈值为100句,所述预设时长为200ms。
[0039]为实现上述目的,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质存储有智能展示语音转文字程序,所述智能展示语音转文字程序被处理器运行时执行如上所述的方法的步骤。
[0040]本专利技术智能展示语音转文字方法、系统及介质的有益效果是:本专利技术通过上述技术方案,在捕获到音视频文件时,将所述音视频文件转换成文本;根据预先约定的标点符号分割每句文本,得到分割后的语句文本信息;查找预先建立的字典表;若所述字典表里查找到与所述分割后的语句文本信息相对应的历史数据,则从所述字典表中获取对应的先前合
并好的文本段落;对所述文本段落进行渲染;根据敏感词、禁用词或者搜索词对渲染后的文本段落内容中的单字符进行处理;将处理后的单字符与所述文本段落同步在页面展示,用户进行媒体流的合规处理时,可以先从语音转文字渲染而成的文本中入手,通过聪明的段落分割,高亮的敏感词和禁用词,还有搜索功能来快速找出违规地方所在,还可以快速跳转到对应的进度来进行人工审核,确认问题是否存在,极大的减少了用户合规处理的工作量。
附图说明
[0041]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0042]图1是本专利技术智能展示语音转文字方法较佳实施例的流程示意图;
[0043]图2是后端逐句返回根据媒体流转换的文本的展示效果图;
[0044]图3是页面渲染效果图;
[0045]图4是本专利技术智能展示语音转文字方法的整体流程示意图。
[0046]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0047]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能展示语音转文字方法,其特征在于,所述方法包括以下步骤:在捕获到音视频文件时,将所述音视频文件转换成文本;根据预先约定的标点符号分割每句文本,得到分割后的语句文本信息;查找预先建立的字典表;若所述字典表里查找到与所述分割后的语句文本信息相对应的历史数据,则从所述字典表中获取对应的先前合并好的文本段落;对所述文本段落进行渲染;根据敏感词、禁用词或者搜索词对渲染后的文本段落内容中的单字符进行处理;将处理后的单字符与所述文本段落同步在页面展示。2.根据权利要求1所述的智能展示语音转文字方法,其特征在于,所述查找预先建立的字典表的步骤之后还包括:若所述字典表里没有查找到与所述分割后的语句文本信息相对应的历史数据,则获取文本增幅数量;根据语句文本增幅数量采用对应的策略将所述分割后的语句文本信息进行段落合并。3.根据权利要求2所述的智能展示语音转文字方法,其特征在于,所述根据语句文本增幅数量采用对应的策略将所述分割后的语句文本信息进行段落合并的步骤包括:将所述语句文本增幅数量与预设阈值相比对;若所述语句文本增幅数量大于或等于所述预设阈值,则每隔一段预设时间处理预设数量的语句文本来合并段落;若所述语句文本增幅数量大于或等于所述预设阈值,则直接合并段落。4.根据权利要求3所述的智能展示语音转文字方法,其特征在于,所述预设阈值为100句,所述预设时长为200ms。5.根据权利要求1所述的智能展示语音转文字方法,其特征在于,所述根据敏感词、禁用词或者搜索词对渲染后的文本段落内容中的单字符进行处理的步骤包括:根据敏感词、禁用词或者搜索词的变化,给段落的每个字符设置对应的类型集合,并进行存储。6.一种智能展示语音转文字系统,其特征在...

【专利技术属性】
技术研发人员:詹梓彦刘兆武
申请(专利权)人:深圳匠人网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1