语音识别方法和装置制造方法及图纸

技术编号:14478292 阅读:59 留言:0更新日期:2017-01-25 10:59
本发明专利技术公开了一种语音识别方法和装置。其中,该方法包括:根据终端显示屏上所显示的内容确定当前场景;根据当前场景调整第一词语集合中第一子集中每个词语的权重,其中,第一子集的场景属性所指示的场景与当前场景一致;在调整权重后的第一词语集合中查找与接收到的语音信号相关联的第二子集,其中,第二子集包括至少一个词语;按照第二子集中每个词语的权重从第二子集中选择权重最大的词语作为目标词语;将目标词语作为识别语音信号的识别结果。本发明专利技术解决了现有技术中语音识别的准确度低的技术问题。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,具体而言,涉及一种语音识别方法和装置
技术介绍
现有技术中语音识别方法通过记录文字对应的发音以及一些常用的词语的权重,在捕获到要解析的语音时,与文字的发音进行对应,然后再根据一些词语的权重进行组合。例如当用户说“你好”时,可以识别出是“ni”和“hao”两个发音,可以匹配到“你好”、“拟好”、“妮号”等多个词语,“你好”认为是最常用的词语,相对于其他同音的词语,权重较高。根据词语权重,解析到用户说的是“你好”。现有技术中语音识别方法的准确度低,例如:用户需要搜索电影《陆垚知马俐》,用户发出语音信号“luyaozhimali”,现有技术根据权重,解析出发音“luyaozhimali”对应的文字为“路遥知马力”,这就出现了错误。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种语音识别方法和装置,以至少解决现有技术中语音识别的准确度低的技术问题。根据本专利技术实施例的一个方面,提供了一种语音识别方法,包括:根据终端显示屏上所显示的内容确定当前场景;根据所述当前场景调整第一词语集合中第一子集中每个词语的权重,其中,所述第一子集的场景属性所指示的场景与所述当前场景一致;在调整权重后的所述第一词语集合中查找与接收到的语音信号相关联的第二子集,其中,所述第二子集包括至少一个词语;按照所述第二子集中每个词语的权重从所述第二子集中选择权重最大的词语作为目标词语;将所述目标词语作为识别所述语音信号的识别结果根据本专利技术实施例的另一方面,还提供了一种语音识别装置,包括:第一确定单元,用于根据终端显示屏上所显示的内容确定当前场景;调整单元,用于根据所述当前场景调整第一词语集合中第一子集中每个词语的权重,其中,所述第一子集的场景属性所指示的场景与所述当前场景一致;第一查找单元,用于在调整权重后的所述第一词语集合中查找与接收到的语音信号相关联的第二子集,其中,所述第二子集包括至少一个词语;选择单元,用于按照所述第二子集中每个词语的权重从所述第二子集中选择权重最大的词语作为目标词语;第二确定单元,用于将所述目标词语作为识别所述语音信号的识别结果。在本专利技术实施例中,根据终端显示屏上所显示的内容确定当前场景,当前场景为用户关注或者感兴趣的场景,将场景属性与当前场景一致的第一子集中的每个词语的权重进行调整,以突出其重要程度,在调整权重后的第一词语集合中查找与接收到的语音信号相关联的第二子集,从第二子集中选择权重最大的词语作为目标词语,将目标词语作为识别语音信号的识别结果,从而得到最匹配当前场景的文字,达到了提高语音识别的准确度的技术效果,进而解决了现有技术中语音识别的准确度低的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的硬件环境示意图;图2是根据本专利技术实施例的一种语音识别方法的流程图;图3是根据本专利技术实施例的另一种语音识别方法的示意图;图4是根据本专利技术实施例的语音识别装置的示意图;图5是根据本专利技术实施例的服务器的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。技术术语解释:语音识别:自动将语音转换成文字,这里的语音特指人类或者其他动物之间用来交流时发出的声音。词语权重:权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。词语权重是指一个词语相对于其他的词语的重要程度。根据本专利技术实施例,提供了一种语音识别方法的实施例。可选地,在本实施例中,上述语音识别方法可以应用于如图1所示的由服务器102、终端104所构成的硬件环境中。如图1所示,服务器102通过网络与终端104进行连接,上述网络包括但不限于:广域网、城域网或局域网。用户发出语音信号,终端104接收语音信号,并且将语音信号发送给语音解析模块。语音解析模块位于服务器102中。终端104具有显示屏。终端104获取终端104显示屏上所显示的内容,显示屏上所显示的内容可以包括至少以下之一:终端104运行的应用程序、终端104显示屏显示的文字、终端104显示屏显示的图片、通话记录、聊天内容和终端104显示屏显示的网页等,终端104将终端104显示屏上所显示的内容发送给用户场景解析模块。用户场景解析模块中存储了显示屏上显示的内容与场景之间的对应关系,从对应关系中查找显示屏当前显示的内容对应的场景,即当前场景。用户场景解析模块将当前场景信息发送给语音解析模块。语音解析模块存储着以下内容:1.文字发音,2.词语列表,3.场景列表,4.词语和场景的对应关系。语音解析模块接收用户场景解析模块发送的当前场景信息,获取对应于当前场景的词语列表,将对应于当前场景的词语列表中的词语的权重提高,解析语音信息,根据语音信息的文字读音以及词语权重进行匹配。用户场景解析模块既可以位于终端104中,也可以位于服务器102中。根据本专利技术实施例,提供了一种语音识别方法,图2是根据本专利技术实施例的一种语音识别方法的流程图。如图2所示,该方法包括以下步骤:步骤S202,根据终端显示屏上所显示的内容确定当前场景。步骤S204,根据当前场景调整第一词语集合中第一子集中每个词语的权重,其中,第一子集的场景属性所指示的场景与当前场景一致。步骤S206,在调整权重后的第一词语集合中查找与接收到的语音信号相关联的第二子集,其中,第二子集包括至少一个词语。步骤S208,按照第二子集中每个词语的权重从第二子集中选择权重最大的词语作为目标词语。步骤S210,将目标词语作为识别语音信号的识别结果。终端可以是手机、电脑、平板电脑等。终端显示屏上所显示的内容可以是终端运行的应用程序、终端显示屏显示的文字、终端显示屏显示的图片、通话记录、聊天内容和终端显示屏显示的网页等。终端显示屏上所显示的内容能够表明用户发出语音信号的同时或最近一段时间内,对终端进行什么操作或者与其他用户交流什么,根据用户对终端进行的操作和最近一段时间与其他用户交流的内容能够判断出用户感兴趣的方面,从而判断出当前场景是什么。第一子集中每个词语的场景属性与当前场景一致,因此,应该将第一子集中的词语的重要程度调高,可以通过调整第一子集中词语的权重的方式突出第一子集中的词语的本文档来自技高网
...
语音识别方法和装置

【技术保护点】
一种语音识别方法,其特征在于,包括:根据终端显示屏上所显示的内容确定当前场景;根据所述当前场景调整第一词语集合中第一子集中每个词语的权重,其中,所述第一子集的场景属性所指示的场景与所述当前场景一致;在调整权重后的所述第一词语集合中查找与接收到的语音信号相关联的第二子集,其中,所述第二子集包括至少一个词语;按照所述第二子集中每个词语的权重从所述第二子集中选择权重最大的词语作为目标词语;将所述目标词语作为识别所述语音信号的识别结果。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:根据终端显示屏上所显示的内容确定当前场景;根据所述当前场景调整第一词语集合中第一子集中每个词语的权重,其中,所述第一子集的场景属性所指示的场景与所述当前场景一致;在调整权重后的所述第一词语集合中查找与接收到的语音信号相关联的第二子集,其中,所述第二子集包括至少一个词语;按照所述第二子集中每个词语的权重从所述第二子集中选择权重最大的词语作为目标词语;将所述目标词语作为识别所述语音信号的识别结果。2.根据权利要求1所述的方法,其特征在于,根据所述当前场景调整第一词语集合中第一子集中每个词语的权重包括:将所述第一子集中每个词语的权重乘以预设比例系数,得到调整后的权重,其中,所述预设比例系数大于1。3.根据权利要求1所述的方法,其特征在于,在根据所述当前场景调整第一词语集合中第一子集中每个词语的权重之前,所述方法还包括:获取所述第一词语集合中每个词语的场景属性;从所述第一词语集合中查找场景属性所指示的场景为所述当前场景的词语;将查找到的词语的集合作为所述第一子集。4.根据权利要求1所述的方法,其特征在于,根据终端显示屏上所显示的内容确定当前场景包括:获取预设时间段内终端显示屏上显示的内容,其中,所述预设时间段为第一时刻与当前时刻之间的预设时长,所述第一时刻早于所述当前时刻;根据场景与显示内容的关联关系查找与所述预设时间段内所述终端显示屏上显示的内容相关联的场景;将查找到的场景作为所述当前场景。5.根据权利要求4所述的方法,其特征在于,根据场景与显示内容的关联关系查找与所述预设时间段内所述终端显示屏上显示的内容相关联的场景包括:根据所述场景与显示内容的关联关系查找与所述终端显示屏上显示的元素相关联的场景,其中,所述终端显示屏上显示的元素包括以下至少之一:终端运行的应用程序、终端显示屏显示的文字、终端显示屏显示的图片、通话记录、聊天内容和终端显示屏显示的网页。6.根据权利要求1所述的方法,其特征在于,在调整权重后的所述第一词语集合中查找与接收到的语音信号相关联的第二子集包括:获取语音信号序列的读音,其中,所述语音信号序列包括一个或者多个所述语音信号;按照所述语音信号序列的读音对所述语音信号序列进行分词,得到N个所述语音信号;在调整权重后的所述第一词语集合中查找与第i个语音信号对应的词语,其中,i依次取1至N;将所述第i个语音信号对应的词语的集合作为所述第i个语音信号关联的第二子集。7.一种语音识别装置,其特征在于,包括:第一确定单元,用于根...

【专利技术属性】
技术研发人员:樊林
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1