一种声纹识别方法和设备技术

技术编号:26344832 阅读:10 留言:0更新日期:2020-11-13 21:02
本发明专利技术提出了一种声纹识别确认的方法和设备,包括:当获取到待识别确认的语音时,将所述语音转化为文本格式后提取身份信息;在预设数据库中获取与所述身份信息对应的声纹特征,并将所述声纹特征设置为第一声纹特征;所述第一声纹特征为对应所述身份信息的口述者口述预设确认文本时得到的声纹特征;将所述第一声纹特征与第二声纹特征进行比对;所述第二声纹特征为从所述语音得到的声纹特征;若比对结果为特征一致,则基于所述身份信息执行预设确认流程。本方案通过身份信息和语音识别进行身份筛查,缩小声纹特征对比范围,解决了声纹识别技术在多样本场景下辨认准确率低的问题,提高了声纹辨认准确性。

【技术实现步骤摘要】
一种声纹识别方法和设备
本专利技术涉及声纹识别
,特别涉及一种声纹识别方法和设备。
技术介绍
目前,在外科手术进行过程中,例如医生、麻醉师、护士三方需要在手术麻醉核查单中对患者信息、手术项目等逐项进行核查,并最终在核查单上三方签字确认。针对该确认过程,现有一些软件系统尝试将声纹识别技术应用于手术麻醉核查环节,先期由医生、麻醉师、护士录音,对声纹特征提取和存储,在签字环节由三方口述确认签字,声纹识别系统对三方进行辨认,给出身份。但是目前的方式也存在一些问题:其中,以签字的方式来进行核查的方式,无法对例如医生、麻醉师、护士三方身份进行校验,不能保证签字的有效性,操作流程存在漏洞。此外,外科手术医生、麻醉师、护士的数量比较多,流动性大,声纹识别技术在样本数较大的情况下,辨认准确性会急剧下降,导致无法在实际场景中应用。例如4个样本的时候声纹准确率可以达到95%,但8个样本的时候准确率则掉到了70%以下。由此,现在需要一种更好的方法来解决该技术问题。
技术实现思路
针对现有技术中的缺陷,本专利技术提出了一种声纹识别确认的方法和设备,通过身份信息和语音识别进行身份筛查,缩小声纹特征对比范围,解决了声纹识别技术在多样本场景下辨认准确率低的问题,提高了声纹辨认准确性。具体的,本专利技术提出了以下具体的实施例:本专利技术实施例提出了一种声纹识别确认的方法,包括:当获取到待识别确认的语音时,将所述语音转化为文本格式后提取身份信息;在预设数据库中获取与所述身份信息对应的声纹特征,并将所述声纹特征设置为第一声纹特征;所述第一声纹特征为对应所述身份信息的口述者口述预设确认文本时得到的声纹特征;将所述第一声纹特征与第二声纹特征进行比对;所述第二声纹特征为从所述语音得到的声纹特征;若比对结果为特征一致,则基于所述身份信息执行预设确认流程。在一个具体的实施例中,还包括:针对每一个用户,获取所述用户对应的预设确认文本;所述预设确认文本中包含有身份信息与确认信息;获取所述用户口述所述预设确认文本得到的声纹特征,并形成所述用户的所述声纹特征与所述身份信息两者间的对应关系;将所述对应关系存储在预设数据库中。在一个具体的实施例中,预设数据库中存储的所述声纹特征是所述用户多次重复口述所述预设确认文本得到的。在一个具体的实施例中,还包括:对存储在预设数据库中的所述身份信息进行语音识别优化,以提高所述身份信息的识别准确率。在一个具体的实施例中,各所述用户对应的所述确认信息相同。在一个具体的实施例中,所述“当获取到待识别确认的语音时,将所述语音转化为文本格式后提取身份信息”,包括:当获取到待识别确认的语音时,基于语音识别将所述语音转换为识别文本;对所述识别文本进行分词处理,以从所述识别文本中提取身份信息。在一个具体的实施例中,所述“将所述第一声纹特征与第二声纹特征进行比对”,包括:判断所述第一声纹特征与第二声纹特征在预设阈值范围内是否相同;若判断结果为相同,则比对结果为特征一致;若判断结果为不相同,则比对结果为特征不一致。在一个具体的实施例中,还包括:若比对结果为特征不一致,则执行预设的提示及预警流程。在一个具体的实施例中,所述身份信息包括:姓名和职称。本专利技术实施例还提出了一种声纹识别确认的设备,包括处理器,所述处理器用于执行上述的步骤。以此,本专利技术实施例提出了一种声纹识别确认的方法和设备,其相较于现有技术,具有以下优点:本方案通过身份信息和语音识别进行身份筛查,缩小声纹特征对比范围,解决了声纹识别技术在多样本场景下辨认准确率低的问题,提高了声纹辨认准确性,经过测试,本方案可保证在高样本数量的情况下准确率在97%以上。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术实施例提出的一种声纹识别确认方法的流程示意图;图2为本专利技术实施例提出的一种具体应用场景下的声纹识别确认方法的流程示意图;图3为本专利技术实施例提出的一种声纹识别确认方法中预设确认文本的示意图;图4为本专利技术实施例提出的一种声纹识别确认设备的结构框架示意图。具体实施方式在下文中,将更全面地描述本公开的各种实施例。本公开可具有各种实施例,并且可在其中做出调整和改变。然而,应理解:不存在将本公开的各种实施例限于在此公开的特定实施例的意图,而是应将本公开理解为涵盖落入本公开的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。在本公开的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本公开的各种实施例。如在此所使用,单数形式意在也包括复数形式,除非上下文清楚地另有指示。除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本公开的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关
中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本公开的各种实施例中被清楚地限定。实施例1本专利技术实施例提出了一种声纹识别确认的方法,如图1所示,包括以下步骤:步骤101、当获取到待识别确认的语音时,将所述语音转化为文本格式后提取身份信息;具体的,在实际情况下,待识别确认的语音为用户口述预设确认文本时的语音,具体的预设确认文本中包含有该用户的身份信息以及确认信息,具体的身份信息可以包括姓名以及职称等,或者姓名与职位,或者对应每一用户的唯一代码等等,具体的身份信息只要能唯一确定所对应的用户即可。此外,步骤101中的所述“当获取到待识别确认的语音时,将所述语音转化为文本格式后提取身份信息”,包括:当获取到待识别确认的语音时,基于语音识别将所述语音转换为识别文本;对所述识别文本进行分词处理,以从所述识别文本中提取身份信息。具体的,身份信息的提取是基于语音识别转换为文本后从文本中提取到的。步骤102、在预设数据库中获取与所述身份信息对应的声纹特征,并将所述声纹特征设置为第一声纹特征;所述第一声纹特征为对应所述身份信息的口述者口述预设确认文本时得到的声纹特征;具体的,事先在预设数据库中存储有各用户的所述声纹特征与所述身份信息两者间的对应关系,以此在需要识别的时候可以直接调用。而所述身份信息可以包括:姓名和职称。步骤103、将所述第一声纹特征与第二声纹特征进行比对;所述第二声纹特征为从所述语音得到的声纹特征;具体的,步骤103中所述“将所述第一声纹特征与第二声纹特征进行比对”,包括:判断本文档来自技高网
...

【技术保护点】
1.一种声纹识别确认的方法,其特征在于,包括:/n当获取到待识别确认的语音时,将所述语音转化为文本格式后提取身份信息;/n在预设数据库中获取与所述身份信息对应的声纹特征,并将所述声纹特征设置为第一声纹特征;所述第一声纹特征为对应所述身份信息的口述者口述预设确认文本时得到的声纹特征;/n将所述第一声纹特征与第二声纹特征进行比对;所述第二声纹特征为从所述语音得到的声纹特征;/n若比对结果为特征一致,则基于所述身份信息执行预设确认流程。/n

【技术特征摘要】
1.一种声纹识别确认的方法,其特征在于,包括:
当获取到待识别确认的语音时,将所述语音转化为文本格式后提取身份信息;
在预设数据库中获取与所述身份信息对应的声纹特征,并将所述声纹特征设置为第一声纹特征;所述第一声纹特征为对应所述身份信息的口述者口述预设确认文本时得到的声纹特征;
将所述第一声纹特征与第二声纹特征进行比对;所述第二声纹特征为从所述语音得到的声纹特征;
若比对结果为特征一致,则基于所述身份信息执行预设确认流程。


2.如权利要求1所述的方法,其特征在于,还包括:
针对每一个用户,获取所述用户对应的预设确认文本;所述预设确认文本中包含有身份信息与确认信息;
获取所述用户口述所述预设确认文本得到的声纹特征,并形成所述用户的所述声纹特征与所述身份信息两者间的对应关系;
将所述对应关系存储在预设数据库中。


3.如权利要求2所述的方法,其特征在于,预设数据库中存储的所述声纹特征是所述用户多次重复口述所述预设确认文本得到的。


4.如权利要求2所述的方法,其特征在于,还包括:
对存储在预设数据库中的所述身份信息进行语音识别优化,以...

【专利技术属性】
技术研发人员:赵东阳
申请(专利权)人:云知声智能科技股份有限公司厦门云知芯智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1