语音识别方法及相关产品技术

技术编号:24173650 阅读:19 留言:0更新日期:2020-05-16 03:49
本发明专利技术实施例公开一种语音识别方法及相关产品,本发明专利技术实施例中,通过获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据文本内容和文本时间信息确定预设场景的共享文本;依据共享文本得到预设场景的定制语言模型,采用定制语言模型执行预设场景的语音识别。因此,本发明专利技术实施例的技术方案,可以利用预设场景中的终端获取预设场景的文本内容和文本时间信息以确定预设场景的共享文本,进而根据共享文本得到定制语言模型,由于定制语言模型与预设场景的相关性更高,利用定制语言模型执行预设场景的语音识别,可以有效提高语音识别的准确度。

Speech recognition methods and related products

【技术实现步骤摘要】
语音识别方法及相关产品
本专利技术涉及语音识别
,尤其涉及一种语音识别方法及相关产品。
技术介绍
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。现有技术中,对于会议、演讲、采访或者授课等场景,在进行现场语音识别之前,需要预先获知该场景的相关文本资料或者关键词等,以进行语音识别模型的更新,再利用更新后的语音识别模型进行语音识别,可以提升相应场景的领域识别效果。但是,由于该方案需要提前获知相关场景的资料,人为干预性较强,导致使用场景受限;而且,当使用场景中发生突发或临时性的主题变更等,原来的语音识别模型无法继续起到优化识别效果的作用,致使语音识别准确度低下,影响用户的整体体验。
技术实现思路
本专利技术实施例提供了一种语音识别方法及相关产品,可以提高语音识别的准确度。第一方面,本专利技术实施例提供了一种语音识别方法,包括:获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本;依据所述共享文本得到所述预设场景的定制语言模型,采用定制语言模型执行所述预设场景的语音识别。第二方面,本专利技术实施例提供了一种语音识别装置,包括:获取单元,用于获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本;识别单元,用于依据所述共享文本得到所述预设场景的定制语言模型,采用定制语言模型执行所述预设场景的语音识别。第三方面,本专利技术实施例提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如本申请实施例第一方面中所描述的部分或全部步骤。第四方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。本专利技术实施例中,通过获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据文本内容和文本时间信息确定预设场景的共享文本;依据共享文本得到预设场景的定制语言模型,采用定制语言模型执行预设场景的语音识别。因此,本专利技术实施例的技术方案,可以利用预设场景中的终端获取预设场景的文本内容和文本时间信息以确定预设场景的共享文本,进而根据共享文本得到定制语言模型,由于定制语言模型与预设场景的相关性更高,利用定制语言模型执行预设场景的语音识别,可以有效提高语音识别的准确度。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的语音识别方法的流程示意图;图2是本专利技术实施例一提供的步骤S102的流程示意图;图3是本专利技术实施例二提供的步骤S101的流程示意图;图4是本专利技术实施例二提供的共享文本的获取时间示意图;图5是本专利技术实施例二提供的共享文本获取时间段的示意图;图6是本专利技术实施例三提供的步骤S201的流程示意图;图7是本专利技术实施例三提供的共享文本集合示意图;图8是本专利技术实施例四提供的文本内容过滤的流程示意图;图9是本专利技术实施例五提供的语音识别装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。应当理解,本申请的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。在本专利技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本专利技术所描述的实施例可以与其它实施例相结合。本文中的预设场景指语音识别场景,语音识别场景为将语音数据转换为文字数据的场景,例如,演讲、培训、会议、采访、授课等场景。而终端指用户智能终端,包括手机、平板电脑、笔记本电脑、录音笔、智能办公本等终端设备,其具有联网通信能力,还可以具有记录能力,记录能力是指拍摄、文本编辑等功能。实施例一参阅图1,图1提供了一种语音识别方法,该方法在电子设备上运行,该电子设备可以为通用的计算机、服务器等设备,当然在实际应用中,也可以为数据处理中心、云平台等,本申请并不限制上述电子设备的具体实现方式。如图1所示,该方法包括如下步骤:步骤S101、获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据文本内容和文本时间信息确定预设场景的共享文本;具体地,多台终端的使用者位于同一预设场景中,例如多个使用者参加同一个会议。文本时间信息为上述文本内容的产生时间。步骤S101的具体实现方式可以参见实施例二的描述,这里不再赘述。步骤S102、依据共享文本得到预设场景的定制语言模型,采用定制语言模型执行预设场景的语音识别。上述步骤S102的具体实现方式可以参见实施例四的描述,这里不再赘述。进一步地,参阅图2,图2是本专利技术实施例一提供的步骤S102的流程示意图,步骤S102包括:步骤S201、对共享文本进行分词分类处理得到关键词,依据关键词对热词列表进行更新得到新的热词列表;步骤S202、通过定制语言模型和新的热词列表执行语音识别。具体地,步骤S201、步骤S202的具体实现方式可以参见实施例三的描述,这里不再赘述。本专利技术实施例中,通过获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据文本内容和文本时间信息确定预设场景的共享文本;依据共享文本得到预设场景的定制语言模型和关键词,依据关键词对预设场景的热词列表进行更新得到新的热词列表,采用定制语言模型和新的热词列表执行预设场景的语音识别。因此,本专利技术实施例的技术方案,可以利用预设场景中的终端获取预设场景的文本内容和文本时间信息以确定预设场景的共享文本,进而根据共享文本得到定制语言模型,以及更新热词列表,由于新得到的热词列表、定制语言模型与预设场景的相关性更高,利用定制语言模型和新的热词列表执行预设场景的语音识别,可以有效提高语音识别的准确度。实施例二基于实施例一提出实施例二,上述文本内容指用户在终端上产生的与预设本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本;/n依据所述共享文本得到所述预设场景的定制语言模型,采用定制语言模型执行所述预设场景的语音识别。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取预设场景中的多台终端发送的文本内容以及文本时间信息;依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本;
依据所述共享文本得到所述预设场景的定制语言模型,采用定制语言模型执行所述预设场景的语音识别。


2.根据权利要求1所述的方法,其特征在于,所述依据所述共享文本得到所述预设场景的定制语言模型,采用定制语言模型执行所述预设场景的语音识别具体包括:
对所述共享文本进行分词分类处理得到关键词,依据所述关键词对热词列表进行更新得到新的热词列表;
通过定制语言模型和所述新的热词列表执行语音识别。


3.根据权利要求2所述的方法,其特征在于,所述依据所述文本内容和所述文本时间信息确定所述预设场景的共享文本具体包括:
采集并识别预设场景的语音得到语音识别结果,所述语音识别结果包括句子文本和句子时间信息;
根据所述文本时间信息和所述句子时间信息进行匹配,如与所述句子时间信息匹配,将所述文本时间信息对应的所述文本内容确定为所述共享文本。


4.根据权利要求3所述的方法,其特征在于,所述对所述共享文本进行分词分类处理得到关键词,依据所述关键词对热词列表进行更新得到新的热词列表具体包括:
对所述共享文本进行分词、分类处理,以获取短语集合或句子集合;
根据短语的词频和词频阈值确定所述关键词,所述词频为所述短语在所述短语集合或所述句子集合中出现的次数。


5.根据权利要求4所述的方法,其特征在于,在根据短语的词频和词频阈值确定所述关键词之前还包括:
根据所述热词列表对所述短语集合进行过滤。


6.根据权利要求3至5任一项所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:万根顺高建清王智国
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1