语音识别方法及相关产品技术

技术编号：24173650 阅读：19 留言：0更新日期：2020-05-16 03:49

本发明专利技术实施例公开一种语音识别方法及相关产品，本发明专利技术实施例中，通过获取预设场景中的多台终端发送的文本内容以及文本时间信息；依据文本内容和文本时间信息确定预设场景的共享文本；依据共享文本得到预设场景的定制语言模型，采用定制语言模型执行预设场景的语音识别。因此，本发明专利技术实施例的技术方案，可以利用预设场景中的终端获取预设场景的文本内容和文本时间信息以确定预设场景的共享文本，进而根据共享文本得到定制语言模型，由于定制语言模型与预设场景的相关性更高，利用定制语言模型执行预设场景的语音识别，可以有效提高语音识别的准确度。

Speech recognition methods and related products

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法及相关产品
本专利技术涉及语音识别
，尤其涉及一种语音识别方法及相关产品。
技术介绍
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。现有技术中，对于会议、演讲、采访或者授课等场景，在进行现场语音识别之前，需要预先获知该场景的相关文本资料或者关键词等，以进行语音识别模型的更新，再利用更新后的语音识别模型进行语音识别，可以提升相应场景的领域识别效果。但是，由于该方案需要提前获知相关场景的资料，人为干预性较强，导致使用场景受限；而且，当使用场景中发生突发或临时性的主题变更等，原来的语音识别模型无法继续起到优化识别效果的作用，致使语音识别准确度低下，影响用户的整体体验。
技术实现思路
本专利技术实施例提供了一种语音识别方法及相关产品，可以提高语音识别的准确度。第一方面，本专利技术实施例提供了一种语音识别方法，包括：获取预设场景中的多台终端发送的文本内容以及文本时间信息；依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本；依据所述共享文本得到所述预设场景的定制语言模型，采用定制语言模型执行所述预设场景的语音识别。第二方面，本专利技术实施例提供了一种语音识别装置，包括：获取单元，用于获取预设场景中的多台终端发送的文本内容以及文本时间信息；依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本；识别单元，用于依据所述共享文本得到所述预设场景的定制语言模型，采用定制语言模型执行所述预...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n获取预设场景中的多台终端发送的文本内容以及文本时间信息；依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本；/n依据所述共享文本得到所述预设场景的定制语言模型，采用定制语言模型执行所述预设场景的语音识别。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
获取预设场景中的多台终端发送的文本内容以及文本时间信息；依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本；
依据所述共享文本得到所述预设场景的定制语言模型，采用定制语言模型执行所述预设场景的语音识别。

2.根据权利要求1所述的方法，其特征在于，所述依据所述共享文本得到所述预设场景的定制语言模型，采用定制语言模型执行所述预设场景的语音识别具体包括：
对所述共享文本进行分词分类处理得到关键词，依据所述关键词对热词列表进行更新得到新的热词列表；
通过定制语言模型和所述新的热词列表执行语音识别。

3.根据权利要求2所述的方法，其特征在于，所述依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本具体包括：
采集并识别预设场景的语音得到语音识别结果，所述语音识别结果包括句子文本和句子时间信息；
根据所述文本时间信息和所述句子时间信息进行匹配，如与所述句子时间信息匹配，将所述文本时间信息对应的所述文本内容确定为所述共享文本。

4.根据权利要求3所述的方法，其特征在于，所述对所述共享文本进行分词分类处理得到关键词，依据所述关键词对热词列表进行更新得到新的热词列表具体包括：
对所述共享文本进行分词、分类处理，以获取短语集合或句子集合；
根据短语的词频和词频阈值确定所述关键词，所述词频为所述短语在所述短语集合或所述句子集合中出现的次数。

5.根据权利要求4所述的方法，其特征在于，在根据短语的词频和词频阈值确定所述关键词之前还包括：
根据所述热词列表对所述短语集合进行过滤。

6.根据权利要求3至5任一项所述的方法，其特征在于，所述...

【专利技术属性】
技术研发人员：万根顺，高建清，王智国，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人