一种语音识别文本插入笔录文档的方法、装置及系统制造方法及图纸

技术编号：19139927 阅读：33 留言：0更新日期：2018-10-13 08:38

本申请实施方式公开了一种语音识别文本插入笔录文档的方法、装置及系统，其中，语音识别文本插入笔录文档的方法包括:接收目标音频子流的当前文本识别信息；其中，当前文本信息包括文本识别内容、文本识别状态标识、角色标识和文本长度；根据当前文本识别信息的文本识别状态标识和角色标识将对应的文本识别内容插入笔录文档的相应位置。本技术方案在多角色同时发言场景下，语音识别服务器交叉返回不同角色的实时识别文本，插入的文本识别信息中的文本识别内容不管是否被确认，均正确、有序、分角色插入笔录文档，并不是只有将文本识别内容在确认状态下才插入笔录文档，提高识别文本插入文档速度的同时动态插入效果更加明显，大大增加用户体验感。

Method, device and system for inserting transcripts into speech recognition text

The embodiment of the present application discloses a method, apparatus and system for inserting speech recognition text into a written document, wherein the method for inserting speech recognition text into a written document includes: receiving the current text recognition information of the target audio substream, wherein the current text information includes text recognition content, text recognition status identification, and so on. Role identification and text length; insert the corresponding text identification content into the corresponding position of the recorded document according to the text recognition status identification and role identification of the current text recognition information. In the multi-role simultaneous speech scenario, the speech recognition server cross-returns the real-time recognition text of different roles, and the text recognition content in the inserted text recognition information is inserted correctly, orderly and role-by-role into the transcript document, regardless of whether it is confirmed or not. It is not only the text recognition content in the confirmation state. The next step is to insert a transcript document, which improves the speed of text insertion and the effect of dynamic insertion is more obvious, greatly increasing the user experience.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别文本插入笔录文档的方法、装置及系统
本申请涉及语音识别
，特别涉及一种语音识别文本插入笔录文档的方法、装置及系统。
技术介绍
随着语音识别技术的发展，在各行各业中语音识别技术得到越来越广泛应用。例如：在法庭庭审或会议过程中，如果可以将语音识别技术应用在庭审或会议当中，将声音转换为文字同时将文字实时分角色插入笔录文档，这样将大大减轻庭审或会议记录人员的工作量，并且避免出现漏记错记的问题甚至完全替代记录人员的工作节省人力。在语音识别过程中，识别服务器获得当前某个角色发言的音频流，通过对该音频流的重复多次切片并结合上下文的语境、语义进行分析，逐次生成针对当前音频流的识别文本。如果文本识别信息中的文本识别内容不能被确认，则识别服务器会反复对当前音频流进行识别处理，直至当前音频流的文本识别信息中的文本识别内容被确认，文本识别内容才被插入至笔录文档中。在识别过程中，如果发言者的语速过快且发言停顿时间较短均会导致识别服务器自动断句计算出现误差(将发言者的两句发言对应的音频流视为一句进行处理)，由于识别服务器针对当前音频流进行比对分析次数增加进而获取最终确认状态识别文本时间增加，最终导致用户体验感差。
技术实现思路
本申请实施方式的目的是提供一种语音识别文本插入笔录文档的方法、装置及系统，解决现有的插入笔录文档体验感差的技术问题。为实现上述目的，本申请实施方式提供一种语音识别文本插入笔录文档的方法，包括:接收目标音频子流的当前文本识别信息；其中，所述当前文本信息包括文本识别内容、文本识别状态标识、角色标识和文本长度；根据当前文本识别信息的文本识别状态标识和角...

【技术保护点】
1.一种语音识别文本插入笔录文档的方法，其特征在于，包括:接收目标音频子流的当前文本识别信息；其中，所述当前文本信息包括文本识别内容、文本识别状态标识、角色标识和文本长度；根据当前文本识别信息的文本识别状态标识和角色标识将对应的文本识别内容插入笔录文档的相应位置。

【技术特征摘要】
1.一种语音识别文本插入笔录文档的方法，其特征在于，包括:接收目标音频子流的当前文本识别信息；其中，所述当前文本信息包括文本识别内容、文本识别状态标识、角色标识和文本长度；根据当前文本识别信息的文本识别状态标识和角色标识将对应的文本识别内容插入笔录文档的相应位置。2.如权利要求1所述的方法，其特征在于，所述根据当前文本识别信息的文本识别状态标识和角色标识将对应的文本识别内容插入笔录文档的相应位置的步骤包括：获取第一角色的第一文本识别信息，通过定位函数获取第一文本识别信息中的文本识别内容的插入位置，将所述第一角色的第一文本识别信息中的文本识别内容插入相应位置，设置第一角色为换行角色；获取第二角色的第一文本识别信息，以当前换行角色对应的书签为基准获取第二角色的第一文本识别信息中的文本识别内容的插入位置，将所述第二角色的第一文本识别信息中的文本识别内容插入相应位置，更新换行角色，以第二角色为换行角色；获取第一角色的第二文本识别信息，如果第一文本识别信息中的文本识别状态标识为非确认标识，通过第一角色的上一文本识别信息中的文本识别内容插入时使用的书签为基准，获取第一角色的第二文本识别信息中的文本识别内容的插入位置，将所述第一角色的第二文本识别信息中的文本识别内容插入相应位置，无需更新换行角色，第二角色为换行角色；如果第一文本识别信息中的文本识别状态标识为确认标识，以当前换行角色对应的书签为基准获得第一角色的第二文本识别信息中文本识别内容的插入位置，将所述第一角色的第二文本识别信息中的文本识别内容插入相应位置，更新换行角色，以第一角色为换行角色；获取第二角色的第二文本识别信息，如果当前换行角色为第一角色，且第二角色的第一文本识别信息中的文本识别状态标识为确认标识，则以第一角色的第二文本识别信息中的文本识别内容插入时使用的书签为基准，获取第二角色的第二文本识别信息中的文本识别内容的插入位置，将所述第二角色的第二文本识别信息中的文本识别内容插入相应位置，更新换行角色；如果当前换行角色为第一角色，且第二角色的第一文本识别信息中的文本识别状态标识为非确认标识，或当前换行角色为第二角色，以第二角色的第一文本识别信息中的文本识别内容插入时使用的书签为基准，获得第二角色的第二文本识别信息中的文本识别内容的插入位置，将所述第二角色的第二文本识别信息中的文本识别内容插入相应的位置，无需更新换行角色；获取其他角色的第一文本识别信息，以当前换行角色标识对应的书签为基准，获取其他角色的第一文本识别信息中的文本识别内容的插入位置，将所述其他角色的第一文本识别信息中的文本识别内容插入相应的位置，更新换行角色，以其他角色为换行角色。3.如权利要求2所述的方法，其特征在于，将每个角色的文本识别信息中的文本识别内容插入相应位置的步骤包括：对于每个角色，所述当前文本识别信息中的文本识别状态标识为非确认标识，且上一文本识别信息中的文本识别标识为非确定标识，则根据上一文本识别信息中的文本长度和文本识别内容、当前文本识别信息中的文本长度和文本识别内容将当前文本识别信息的文本识别内容插入笔录文档的相应位置；对于每个角色，所述当前文本识别信息中的文本识别状态标识为非确认标识，且上一文本识别信息中的文本识别标识为确认标识，则将当前文本识别信息的文本识别内容插入笔录文档的相应位置；对于每个角色，所述当前文本识别信息中的文本识别状态标识为确认标识，且上一文本识别信息中的文本识别标识为非确认标识，则根据上一文本识别信息中的文本长度和文本识别内容、当前文本识别信息中的文本长度和文本识别内容将当前文本信息的文本识别内容插入笔录文档的相应位置；对于每个角色，所述当前文本识别信息中的文本识别状态标识为确认标识，且上一文本识别信息中的文本识别标识为确认标识，则将当前文本识别信息的文本识别内容插入笔录文档的相应位置。4.如权利要求3所述的方法，其特征在于，根据上一文本识别信息中的文本长度和文本识别内容、当前文本识别信息中的文本长度和文本识别内容将当前文本识别信息的文本识别内容插入笔录文档的相应位置的步骤包括：将当前文本识别信息的文本识别内容中从起始位置开始至与上一文本识别信息中的文本长度相同的位置的内容与上一文本识别信息中的文本识别内容进行比较，如果比较结果相同，则将当前文本识别信息的文本识别内容中除去从起始位置开始至与上一文本识别信息中的文本长度相同的位置的内容，把剩余内容插入笔录文档中上一文本识别信息的文本识别内容的后面；如果比较结果不相同，删除上一文本识别信息的文本识别内容，将当前文本识别信息的文本识别内容插入至笔录文档的上一文本识别信息的文本识别内容的位置。5.如权利要求2所述的方法，其特征在于，所述根据当前文本识别信息的文本识别状态标识和角色标识将对...

【专利技术属性】
技术研发人员：卢闪明，张亚鹏，李行，单衍景，
申请(专利权)人：北京华夏电通科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人