用于获取信息的方法及装置制造方法及图纸

技术编号:20489463 阅读:26 留言:0更新日期:2019-03-02 21:10
本申请实施例公开了用于获取信息的方法及装置。该方法的一具体实施方式包括:对待识别语音信号进行识别,得到对应上述待识别语音信号的初始识别文字信息;从上述初始识别文字信息中筛选出单字得到单字集合;对于上述单字集合中的单字,查询上述待识别语音信号中对应该单字的语音信号片段,通过该语音信号片段判断该单字是否为噪音;删除上述初始识别文字信息中的被判断为噪音的单字,得到对应上述待识别语音信号的文字信息。该实施方式能够删除对噪音识别得到的单字,提高了获取文字信息的准确性。

Methods and devices for obtaining information

The embodiment of this application discloses a method and device for obtaining information. One specific implementation of the method includes: recognizing the speech signal to obtain the initial recognition character information corresponding to the speech signal to be recognized; selecting the words from the initial recognition character information to get the word set; querying the speech signal segments of the speech signal to be recognized for the words in the above-mentioned word set, and passing through the words. Audio signal segment judges whether the word is noisy or not; deletes the words judged as noisy in the initial recognition text information, and obtains the text information corresponding to the speech signal to be recognized. The implementation method can delete the words obtained from noise recognition and improve the accuracy of acquiring text information.

【技术实现步骤摘要】
用于获取信息的方法及装置
本申请实施例涉及语音识别
,具体涉及用于获取信息的方法及装置。
技术介绍
语音识别技术能够将语音信号转换为文字信息,进而对文字信息进行处理,以实现对应的数据处理。用户可以通过语音信号对带有语音识别功能的智能设备实现远距离操控。尤其对于不易手动输入信息或无法手动输入信息的场合,语音识别技术极大地提高了信息交流的便捷性。
技术实现思路
本申请实施例提出了用于获取信息的方法及装置。第一方面,本申请实施例提供了一种用于获取信息的方法,该方法包括:对待识别语音信号进行识别,得到对应上述待识别语音信号的初始识别文字信息;从上述初始识别文字信息中筛选出单字得到单字集合;对于上述单字集合中的单字,查询上述待识别语音信号中对应该单字的语音信号片段,通过该语音信号片段判断该单字是否为噪音;删除上述初始识别文字信息中的被判断为噪音的单字,得到对应上述待识别语音信号的文字信息。在一些实施例中,上述初始识别文字信息包括字和标点符号,以及,上述从上述初始识别文字信息中筛选出单字得到单字集合,包括:将上述初始识别文字信息中的、只与标点符号相邻的字确定为单字,得到单字集合。在一些实施例中,上述从上述初始识别文字信息中筛选出单字得到单字集合,包括:为上述初始识别文字信息中的每一个字设置编号,上述编号用于表征字在初始识别文字信息中的先后顺序。在一些实施例中,上述查询上述待识别语音信号中对应该单字的语音信号片段,包括:获取上述待识别语音信号的波形图;计算上述波形图的极值得到极值序列;查询该单字的编号,将上述极值序列中的与该编号对应的极值设置为目标极值。在一些实施例中,上述待识别语音信号包括时间信息,以及,上述查询上述待识别语音信号中对应该单字的语音信号片段,包括:查询上述目标极值对应的目标时间信息;将上述待识别语音信号中的、上述目标时间信息对应时刻的前第一设定时间对应的第一时刻和后第二设定时间对应的第二时刻之间的语音信号设置为对应该单字的语音信号片段。在一些实施例中,上述通过该语音信号片段判断该单字是否为噪音,包括:对该语音信号片段进行数字化处理,得到至少一个波形片段,并获取上述至少一个波形片段中波形片段幅值的最大值和最小值;响应于上述最大值和最小值之间的差值小于设定阈值,判断该单字为噪音。第二方面,本申请实施例提供了一种用于获取信息的装置,该装置包括:初始识别文字信息获取单元,被配置成对待识别语音信号进行识别,得到对应上述待识别语音信号的初始识别文字信息;单字集合获取单元,被配置成从上述初始识别文字信息中筛选出单字得到单字集合;噪音判断单元,对于上述单字集合中的单字,被配置成查询上述待识别语音信号中对应该单字的语音信号片段,通过该语音信号片段判断该单字是否为噪音;文字信息获取单元,被配置成删除上述初始识别文字信息中的被判断为噪音的单字,得到对应上述待识别语音信号的文字信息。在一些实施例中,上述初始识别文字信息包括字和标点符号,以及,上述单字集合获取单元包括:单字集合获取子单元,被配置成将上述初始识别文字信息中的、只与标点符号相邻的字确定为单字,得到单字集合。在一些实施例中,上述单字集合获取单元包括:编号设置子单元,被配置成为上述初始识别文字信息中的每一个字设置编号,上述编号用于表征字在初始识别文字信息中的先后顺序。在一些实施例中,上述噪音判断单元包括:波形图获取子单元,被配置成获取上述待识别语音信号的波形图;极值序列计算子单元,被配置成计算上述波形图的极值得到极值序列;目标极值获取子单元,被配置成查询该单字的编号,将上述极值序列中的与该编号对应的极值设置为目标极值。在一些实施例中,上述待识别语音信号包括时间信息,以及,上述噪音判断单元包括:目标时间信息查询子单元,被配置成查询上述目标极值对应的目标时间信息;语音信号片段获取子单元,被配置成将上述待识别语音信号中的、上述目标时间信息对应时刻的前第一设定时间对应的第一时刻和后第二设定时间对应的第二时刻之间的语音信号设置为对应该单字的语音信号片段。在一些实施例中,上述噪音判断单元包括:波形片段获取子单元,被配置成对该语音信号片段进行数字化处理,得到至少一个波形片段,并获取上述至少一个波形片段中波形片段幅值的最大值和最小值;噪音判断子单元,响应于上述最大值和最小值之间的差值小于设定阈值,被配置成判断该单字为噪音。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于获取信息的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面的用于获取信息的方法。本申请实施例提供的用于获取信息的方法及装置,首先对待识别语音信号进行识别,得到对应上述待识别语音信号的初始识别文字信息;然后从上述初始识别文字信息中筛选出单字得到单字集合;之后查询上述待识别语音信号中对应该单字的语音信号片段,通过该语音信号片段判断该单字是否为噪音;最后删除上述初始识别文字信息中的被判断为噪音的单字,得到对应上述待识别语音信号的文字信息。本技术方案能够删除对噪音识别得到的单字,提高了获取文字信息的准确性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于获取信息的方法的一个实施例的流程图;图3是根据本申请的用于获取信息的方法的一个应用场景的示意图;图4是根据本申请的用于获取信息的方法的又一个实施例的流程图;图5是根据本申请的用于获取信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请实施例的用于获取信息的方法或用于获取信息的装置的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种音频客户端应用,例如音频采集应用、音频过滤应用、音频识别应用、音频播放应用、音频发送工具等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持语音信号处理的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、1本文档来自技高网...

【技术保护点】
1.一种用于获取信息的方法,包括:对待识别语音信号进行识别,得到对应所述待识别语音信号的初始识别文字信息;从所述初始识别文字信息中筛选出单字得到单字集合;对于所述单字集合中的单字,查询所述待识别语音信号中对应该单字的语音信号片段,通过该语音信号片段判断该单字是否为噪音;删除所述初始识别文字信息中的被判断为噪音的单字,得到对应所述待识别语音信号的文字信息。

【技术特征摘要】
1.一种用于获取信息的方法,包括:对待识别语音信号进行识别,得到对应所述待识别语音信号的初始识别文字信息;从所述初始识别文字信息中筛选出单字得到单字集合;对于所述单字集合中的单字,查询所述待识别语音信号中对应该单字的语音信号片段,通过该语音信号片段判断该单字是否为噪音;删除所述初始识别文字信息中的被判断为噪音的单字,得到对应所述待识别语音信号的文字信息。2.根据权利要求1所述的方法,其中,所述初始识别文字信息包括字和标点符号,以及所述从所述初始识别文字信息中筛选出单字得到单字集合,包括:将所述初始识别文字信息中的、只与标点符号相邻的字确定为单字,得到单字集合。3.根据权利要求1所述的方法,其中,所述从所述初始识别文字信息中筛选出单字得到单字集合,包括:为所述初始识别文字信息中的每一个字设置编号,所述编号用于表征字在初始识别文字信息中的先后顺序。4.根据权利要求3所述的方法,其中,所述查询所述待识别语音信号中对应该单字的语音信号片段,包括:获取所述待识别语音信号的波形图;计算所述波形图的极值得到极值序列;查询该单字的编号,将所述极值序列中的与该编号对应的极值设置为目标极值。5.根据权利要求4所述的方法,其中,所述待识别语音信号包括时间信息,以及所述查询所述待识别语音信号中对应该单字的语音信号片段,包括:查询所述目标极值对应的目标时间信息;将所述待识别语音信号中的、所述目标时间信息对应时刻的前第一设定时间对应的第一时刻和后第二设定时间对应的第二时刻之间的语音信号设置为对应该单字的语音信号片段。6.根据权利要求1至5中任意一项所述的方法,其中,所述通过该语音信号片段判断该单字是否为噪音,包括:对该语音信号片段进行数字化处理,得到至少一个波形片段,并获取所述至少一个波形片段中波形片段幅值的最大值和最小值;响应于所述最大值和最小值之间的差值小于设定阈值,判断该单字为噪音。7.一种用于获取信息的装置,包括:初始识别文字信息获取单元,被配置成对待识别语音信号进行识别,得到对应所述待识别语音信号的初始识别文字信息;单字集合获取单元,被配置成从所述初始识别文字信息中筛选出单字得到单字集合;噪音判断单元,对于所述单字集合中的单字...

【专利技术属性】
技术研发人员:王知践钱胜
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1