语音识别方法、装置、电子设备与计算机可读介质制造方法及图纸

技术编号：39069534 阅读：11 留言：0更新日期：2023-10-12 20:01

本公开的实施例公开了语音识别方法、装置、电子设备与计算机可读介质。该方法的一具体实施方式包括：从预设的问答题信息集中随机选择出预设数目个问答题信息，执行如下处理步骤：响应于确定用户信息包括的地址信息与目标用户对应的地址不一致，从语音识别模型组中选择出对应设置用户的目标语音识别模型；将预设数目个问答题信息中每个问答题信息包括的语音输入至目标语音识别模型中，以生成语音识别文本；将语音识别文本组中的每个语音识别文本转换为目标格式的语音音频；将预设数目个问答题信息中每个问答题信息与问答题信息对应的语音音频组合为目标问答题信息。该实施方式提升了用户的听感，增加了用户粘性。增加了用户粘性。增加了用户粘性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备与计算机可读介质

[0001]本公开的实施例涉及计算机
，具体涉及语音识别方法、电子设备与计算机可读介质。

技术介绍

[0002]问答匹配交友玩法是一种独特的应用社交玩法，用户可以从题库中选择感兴趣的问题，设置答案；其他用户通过回答问题进行匹配，答对一定数量个问题就能和对方匹配成功解锁聊天。目前，用户在设置问题以及答案时，通常采用的方式为：随机从题库中选择问题与答案，再通过系统配置语音或者用户自己配置语音。
[0003]然而，采用上述方式通常会存在如下技术问题：第一，系统配置的语音，语音较为僵硬，造成其他用户的听感较差；第二，设置问题时，未考虑用户设置的历史问题的类型，导致新设置的各个问题之间关联性较低，容易浪费用户的答题时间；第三，未对用户配置的语音进行敏感词检测，当用户配置的语音具有敏感信息时，不利于应用的迭代，容易被封禁。
[0004]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解，并因此，其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0006]本公开的一些实施例提出了语音识别方法、装置、电子设备与计算机可读介质，来解决以上
技术介绍
部分提到的技术问题中的一项或多项。r/>[0007]第一方面，本公开的一些实施例提供了一种语音识别方法，该方法包括：响应于确定目标用户初始认证通过，从预设的问答题信息集中随机选择出预设数目个问答题信息，执行如下处理步骤：确定预设的问答题库对应的设置用户的用户信息；确定上述用户信息包括的地址信息与上述目标用户对应的地址是否一致；响应于确定上述用户信息包括的地址信息与上述目标用户对应的地址不一致，从预先训练的语音识别模型组中选择出对应上述设置用户的语音识别模型作为目标语音识别模型；将上述预设数目个问答题信息中每个问答题信息包括的语音输入至上述目标语音识别模型中，以生成语音识别文本，得到语音识别文本组；将上述语音识别文本组中的每个语音识别文本转换为目标格式的语音音频，得到语音音频组；将上述预设数目个问答题信息中每个问答题信息与上述问答题信息对应的语音音频组合为目标问答题信息，得到目标问答题信息组；将上述目标问答题信息组发送至上述目标用户的用户终端。
[0008]第二方面，本公开的一些实施例提供了一种语音识别装置，该装置包括：语音识别
单元，被配置成响应于确定目标用户初始认证通过，从预设的问答题信息集中随机选择出预设数目个问答题信息，执行如下处理步骤：确定预设的问答题库对应的设置用户的用户信息；确定上述用户信息包括的地址信息与上述目标用户对应的地址是否一致；响应于确定上述用户信息包括的地址信息与上述目标用户对应的地址不一致，从预先训练的语音识别模型组中选择出对应上述设置用户的语音识别模型作为目标语音识别模型；将上述预设数目个问答题信息中每个问答题信息包括的语音输入至上述目标语音识别模型中，以生成语音识别文本，得到语音识别文本组；将上述语音识别文本组中的每个语音识别文本转换为目标格式的语音音频，得到语音音频组；将上述预设数目个问答题信息中每个问答题信息与上述问答题信息对应的语音音频组合为目标问答题信息，得到目标问答题信息组；发送单元，被配置成将上述目标问答题信息组发送至上述目标用户的用户终端。
[0009]第三方面，本公开的一些实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0010]第四方面，本公开的一些实施例提供了一种计算机可读介质，其上存储有计算机程序，其中，程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0011]本公开的上述各个实施例具有如下有益效果：通过本公开的一些实施例的语音识别方法，提升了用户的听感，增加了用户粘性。具体来说，造成其他用户的听感较差的原因在于：系统配置的语音，语音较为僵硬。基于此，本公开的一些实施例的语音识别方法，响应于确定目标用户初始认证通过，从预设的问答题信息集中随机选择出预设数目个问答题信息，执行如下处理步骤：首先，确定预设的问答题库对应的设置用户的用户信息；确定上述用户信息包括的地址信息与上述目标用户对应的地址是否一致。由此，便于确定设置用户与目标用户是否属于同一区域的用户。从而，便于确定目标用户是否可以听懂设置用户录制的音频。其次，响应于确定上述用户信息包括的地址信息与上述目标用户对应的地址不一致，从预先训练的语音识别模型组中选择出对应上述设置用户的语音识别模型作为目标语音识别模型。由此，当目标用户与设置用户不属于同一区域时，便于根据目标语音识别模型识别设置用户录制的音频的信息。接着，将上述预设数目个问答题信息中每个问答题信息包括的语音输入至上述目标语音识别模型中，以生成语音识别文本，得到语音识别文本组。由此，可以识别出每个问答题信息包括的语音对应的文本。之后，将上述语音识别文本组中的每个语音识别文本转换为目标格式的语音音频，得到语音音频组。由此，可以将目标用户听不懂的音频转换为标准音频，便于用户理解音频的含义。然后，将上述预设数目个问答题信息中每个问答题信息与上述问答题信息对应的语音音频组合为目标问答题信息，得到目标问答题信息组。由此，可以在问答题信息中设置标准音频与设置用户自身的声音，既方便了目标用户了解音频含义，又便于目标用户了解设置用户的声音信息。最后，将上述目标问答题信息组发送至上述目标用户的用户终端。由此，通过标准音频与设置用户自身的语音的双播放模式，提升了用户的听感，增加了用户粘性。
附图说明
[0012]结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理
解附图是示意性的，元件和元素不一定按照比例绘制。
[0013]图1是根据本公开的语音识别方法的一些实施例的流程图；图2是根据本公开的语音识别装置的一些实施例的流程图；图3是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0014]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例。相反，提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。
[0015]另外还需要说明的是，为了便于描述，附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。
[0016]需要注意，本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，包括：响应于确定目标用户初始认证通过，从预设的问答题信息集中随机选择出预设数目个问答题信息，执行如下处理步骤：确定预设的问答题库对应的设置用户的用户信息；确定所述用户信息包括的地址信息与所述目标用户对应的地址是否一致；响应于确定所述用户信息包括的地址信息与所述目标用户对应的地址不一致，从预先训练的语音识别模型组中选择出对应所述设置用户的语音识别模型作为目标语音识别模型；将所述预设数目个问答题信息中每个问答题信息包括的语音输入至所述目标语音识别模型中，以生成语音识别文本，得到语音识别文本组；将所述语音识别文本组中的每个语音识别文本转换为目标格式的语音音频，得到语音音频组；将所述预设数目个问答题信息中每个问答题信息与所述问答题信息对应的语音音频组合为目标问答题信息，得到目标问答题信息组；将所述目标问答题信息组发送至所述目标用户的用户终端。2.根据权利要求1所述的方法，其中，在所述从预设的问答题信息集中随机选择出预设数目个问答题信息之前，所述方法还包括：获取针对设置用户的历史问题答复信息序列集；对于所述历史问题答复信息序列集中的每个历史问题答复信息序列，执行如下处理步骤：对所述历史问题答复信息序列中的每个历史问题答复信息进行向量转换，以生成对话向量，得到对话向量序列；确定针对目标对话问题的问题属性组；将所述对话向量序列输入至预先训练的问题属性注意力机制模型，以生成针对所述历史问题答复信息序列的、且与所述问题属性组对应的候选问答题信息；根据所生成的各个候选问答题信息，构建问答题信息集。3.根据权利要求1所述的方法，其中，在所述从预先训练的语音识别模型组中选择出对应所述设置用户的语音识别模型作为目标语音识别模型之前，所述方法还包括：获取对应所述设置用户的用户音频数据样本集；从所述用户音频数据样本集中选择出用户音频数据样本；将所述用户音频数据样本包括的用户音频数据输入至初始语音识别模型中，得到用户音频数据样本识别结果；确定所述用户音频数据样本识别结果与所述用户音频数据样本对应的样本标签之间的损失值；响应于确定所...

【专利技术属性】
技术研发人员：刘子正，蒋斌，廖福燕，王瑜，
申请(专利权)人：深圳有咖互动科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人