一种语音识别文本编辑处理方法技术

技术编号：45917714 阅读：10 留言：0更新日期：2025-07-25 17:47

本发明专利技术提供一种语音识别文本编辑处理方法，创新性地设计了一个用户界面，将人工编辑区域和自动文本生成区域清晰分离开来。用户在人工编辑区域可自由修改文本，且不会影响自动文本生成区域的光标位置，保障两个区域独立运作，提高工作效率和准确性。为解决人工修改过程中因自动文本生成导致的光标位置混乱问题，本发明专利技术引入了光标锁定机制。用户在人工编辑区域操作时，通过触发按钮或快捷键启用锁定，暂停编辑区的自动文本生成。完成修改确认后解除锁定，恢复编辑区自动文本生成。此机制确保人工修改期间光标位置稳定，避免自动生成的干扰造成操作失误。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音文本编辑领域，更具体地，涉及一种语音识别文本编辑处理方法。

技术介绍

1、在当今数字化时代，语音识别与文本编辑的结合应用不断普及。但在实际运用中，仍存在不少问题。语音识别生成文本时，因技术限制，自动生成的文本常存在错误,当用户对错误信息进行人工修正时，往往会导致光标位置发生变化。这一现象严重影响了语音识别的连续性和准确性。在传统的文本处理流程中，语音识别通常是一个独立且先行的步骤。即，语音识别系统首先完成全部语音的转换，然后用户才能开始查看并修复转换后的文本。这种流程中，用户需要等待语音识别完成，这可能导致时间上的浪费，特别是在语音识别结果需要较多修复的情况下。

2、现有技术在应对此类问题时，表现出明显的不足。一方面，缺乏对编辑区域和生成区域的有效划分，导致人工编辑和自动生成相互干扰。另一方面，没有专门的光标锁定机制，使得在人工修改过程中，自动文本生成仍在进行，从而造成光标位置的混乱。此外，对于文本合并和冲突检测的处理不够完善，容易出现重复、不一致等问题，影响了最终文本的质量，增加了用户的工作量和工作难度，...

【技术保护点】

1.一种语音识别文本编辑处理方法，其特征在于，包括：

2.根据权利要求1所述的语音识别文本编辑处理方法，其特征在于，所述步骤2，对输入的语音信号进行识别，将识别生成的第一文本信息展示于所述自动文本生成区域，将所述第一文本信息同步复制于所述人工编辑区域，生成第二文本信息，包括：

3.根据权利要求2所述的语音识别文本编辑处理方法，其特征在于，所述对用户界面图像进行高斯平滑，包括：

4.根据权利要求2所述的语音识别文本编辑处理方法，其特征在于，所述计算高斯平滑后的用户界面图像中每一个像素点的梯度幅值和梯度方向，包括：

5.根据权利要求2或4所述的...

【技术特征摘要】

1.一种语音识别文本编辑处理方法，其特征在于，包括：

3.根据权利要求2所述的语音识别文本编辑处理方法，其特征在于，所述对用户界面图像进行高斯平滑，包括：

4.根据权利要求2所述的语音识别文本编辑处理方法，其特征在于，所述计算高斯平滑后的用户界面图像中每一个像素点的梯度幅值和梯度方向，包括：

5.根据权利要求2或4所述的语音识别文本编辑处理方法，其特征在于，所述根据每一个像素点的梯度幅值和梯度方向，采用非极大值抑检测出初步边缘像素点，包括：

6.根据权利要求1所述的语音识别文本编辑处理方法，其特征在于，所述步骤2中，对输入的语音信号进行识别，包括：

7.根据权利要求1...

【专利技术属性】
技术研发人员：程欣，唐钊，胡龙华，车恒，黄健，童庆，李聪颖，刘朝阳，陈永山，胡方磊，
申请(专利权)人：中船凌久高科武汉有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人