一种语音识别后的视频片名纠错方法及系统技术方案

技术编号：27475957 阅读：16 留言：0更新日期：2021-03-02 17:44

本发明专利技术公开了一种语音识别后的视频片名纠错方法，包括：对语音识别后的文本进行预处理；提取预处理后的文本中包含的视频片名；基于相似度算法，返回视频片名库中与提取的视频片名最相似的视频片名；使用语音识别后的文本和用户历史信息作为语言模型的输入，得到纠错后的视频片名；根据语言模型得到纠错后的视频片名以及相似度算法返回的最相似的视频片名，得到最终的纠错片名。同时，本发明专利技术还公开了一种语音识别后的视频片名纠错系统，通过该方法和系统，避免了分词错误、纠错范围受限、以及端到端的方法受限的技术问题，并利用了特定用户的观看习性，提升了语音识别视频片名的准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别后的视频片名纠错方法及系统

[0001]本专利技术涉及自然语言处理和深度学习
，尤其涉及一种语音识别后的视频片名纠错方法及系统。

技术介绍

[0002]在人机交互过程中，相对其它方式，语音交互更符合人们的日常习惯。因此，随着深度学习的普及以及语音识别技术的发展，语音交互已广泛的应用于智能家居、工业生产、医疗和自动驾驶等各个领域。尤其是近年来智能电视的飞速更新换代，语音交互作为一种重要的智能交互方式已广泛的应用与各电视品牌的智能电视中。人们通过说一句话就能直接看到想看的电视剧或电影，而无需像传统方式一样手动多次按电视遥控器才能看到电视剧或电影。然而在实际的与电视语音交互过程中，由于方言的存在或者普通话不标准导致了语音识别的错误，尤其是视频片名的识别错误，严重降低了人们的使用体验感。因此对语音识别后的视频片名进行纠错意义重大。
[0003]目前大多数的语音识别后的文本纠错基于以下两类方法：第一类纠错方法是基于规则的方法，即先找出错误的地方，然后再纠错。错误检测部分先通过结巴等中文分词器分词，形成疑似错误位置候选集；错误纠正部分，遍历所有的疑似错误位置，使用预先构建的可能正确的词替换错误位置的词，然后通过语言模型计算句子困惑度，对所有候选集结果比较并排序，得到最优纠正词。这类方法纠错正确率受限于分词的正确性、预先构建的词库质量和语言模型的质量。第二类纠错方法则是基于端到端的方法，这类方法采用RNN等模型对文本直接进行纠错，避免人工提取特征，减少人工工作量。这类方法的纠错正确率则受限于训练语料的规模...

【技术保护点】

【技术特征摘要】
1.一种语音识别后的视频片名纠错方法，其特征在于，包括：步骤A、对语音识别后的文本进行预处理；步骤B、提取预处理后的文本中包含的视频片名；步骤C、基于相似度算法，返回视频片名库中与提取的视频片名最相似的视频片名；步骤D、使用语音识别后的文本和用户历史信息作为语言模型的输入，得到纠错后的视频片名；步骤E、根据语言模型得到纠错后的视频片名以及相似度算法返回的最相似的视频片名，得到最终的纠错片名。2.根据权利要求1所述的视频片名纠错方法，其特征在于，所述步骤A的方法，包括：去掉语音识别后的文本中会对视频片名提取或纠错造成影响的文字；转换语音识别后的文本中部分文字的格式，实现格式统一。3.根据权利要求1所述的视频片名纠错方法，其特征在于，所述步骤B的方法，包括：基于规则方法利用编写的正则表达式直接提取视频片名；基于实体识别方法利用数据训练模型提取视频片名。4.根据权利要求3所述的视频片名纠错方法，其特征在于，所述数据训练模型为CRF、LSTM+CRF或BERT模型。5.根据权利要求1所述的视频片名纠错方法，其特征在于，所述步骤C的方法，包括：基于拼音、文字以及深度学习模型的向量进行相似度计算的方法，得到对应的视频片名，以及相似度值，并采用决策算法得到最终的最相似的视频片名。6.根...

【专利技术属性】
技术研发人员：周兴发，方凡，饶璐，谭斌，杨兰，孙锐，展华益，
申请(专利权)人：四川长虹电器股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人