System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据库生成方法、数据库生成装置以及记录介质制造方法及图纸_技高网

数据库生成方法、数据库生成装置以及记录介质制造方法及图纸

技术编号:41199583 阅读:9 留言:0更新日期:2024-05-07 22:26
本发明专利技术提供数据库生成方法、数据库生成装置及记录介质。数据库生成方法,计算机生成用于进行讲话人识别的数据库,其中,获取表示多个未确定的讲话人的语音的语音信息;获取多个登录讲话人中的每一个登录讲话人的识别信息及所述语音信息;计算所述多个登录讲话人的语音信息与所述多个未确定的讲话人的所述语音信息的特征量的相似度;对于所述多个登录讲话人中的每一个登录讲话人,提取所述相似度满足规定的第一条件的未确定的讲话人的所述语音信息;对于所述多个登录讲话人中的每一个登录讲话人,通过将登录讲话人的所述识别信息与针对每个所述登录讲话人提取的所述语音信息相互对应,对所述未确定的讲话人的所述语音信息进行分组来生成数据库。

【技术实现步骤摘要】

本专利技术涉及一种利用语音信号识别讲话人是否为本人的技术。


技术介绍

1、近年来,获取未知的对象讲话人的语音信号并基于所获取的语音信号来识别对象讲话人是否为本人的技术已为公知。例如,在日本专利公开公报特开2017-223848号公报中公开了一种技术,获取对象讲话人的语音信号并计算被称为i-vector的特征量,进一步计算所计算出的特征量与存储在大规模数据库中的未确定的讲话人以及登录讲话人的各自的语音信息之间的相似度,在计算出的相似度中,计算对象讲话人声称是本人的登录讲话人的语音信息的相似度的顺序,如果其顺序在规定顺序以内,就判断为是本人。

2、然而,在日本专利公开公报特开2017-223848号公报公开的技术,为了提高识别是否为本人的识别精度,需要增大登录在大规模语音数据库中的未确定的讲话人的语音信息的数量,其结果,存在计算量增大的问题,需要进一步改善。


技术实现思路

1、本专利技术的目的在于提供一种可以不用增大计算量就能提高识别是否为本人的识别精度的讲话人识别方法、讲话人识别装置以及记录了讲话人识别程序的记录介质、数据库生成方法、数据库生成装置以及记录了数据库生成程序的记录介质。

2、本专利技术的一方面涉及的一种数据库生成方法,是计算机生成用于进行讲话人识别的数据库的数据库生成方法,其中,获取表示多个未确定的讲话人的语音的语音信息;获取多个登录讲话人中的每一个登录讲话人的识别信息以及所述语音信息;计算所述多个登录讲话人的语音信息与所述多个未确定的讲话人的所述语音信息的特征量的相似度;对于所述多个登录讲话人中的每一个登录讲话人,提取所述相似度满足规定的第一条件的未确定的讲话人的所述语音信息;对于所述多个登录讲话人中的每一个登录讲话人,通过将登录讲话人的所述识别信息与针对每个所述登录讲话人提取的所述语音信息相互对应,对所述未确定的讲话人的所述语音信息进行分组来生成数据库。

本文档来自技高网...

【技术保护点】

1.一种数据库生成方法,是计算机生成用于进行讲话人识别的数据库的数据库生成方法,其特征在于,

2.根据权利要求1所述的数据库生成方法,其特征在于,

3.根据权利要求1所述的数据库生成方法,其特征在于,

4.一种数据库生成装置,是生成用于进行讲话人识别的数据库的数据库生成装置,其特征在于,包括:

5.一种记录介质,是非暂时性的计算机可读取的记录介质,其特征在于,

【技术特征摘要】

1.一种数据库生成方法,是计算机生成用于进行讲话人识别的数据库的数据库生成方法,其特征在于,

2.根据权利要求1所述的数据库生成方法,其特征在于,

3.根据权利要求1所述的数据库生成...

【专利技术属性】
技术研发人员:土井美沙贵
申请(专利权)人:松下电器美国知识产权公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1