语音交互方法、服务器及计算机可读存储介质技术

技术编号：40319044 阅读：14 留言：0更新日期：2024-02-07 21:02

本申请公开一种语音交互方法，所述方法包括：获取初始训练数据，根据第一预设模型确定初始训练数据中样本的多个标签推理结果，根据样本的多个标签推理结果确定初始训练数据中参考样本，在候选训练数据中选取与参考样本语义相近的目标样本，确定目标训练数据，利用目标训练数据训练第二预设模型以得到语音交互模型，根据语音交互模型完成语音交互。如此，本申请选取选训练数据中目标样本以确定目标训练数据，根据目标训练数据训练语音交互模型，训练时长得到保障。本申请根据样本推理结果确定参考样本，选取与参考样本语义相近的目标样本，目标样本的选取考虑到模型推理情况，可信度和有效性得到保障，语音交互模型的预测精度得到保障。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音交互，特别涉及一种语音交互方法、服务器及计算机可读存储介质。

技术介绍

1、为满足用户的语音交互，车辆或与车辆联网的服务器中可搭载有训练完成的语音交互模型，以使得车辆可通过语音交互模型完成与用户的交互。然而，在语音交互模型的训练过程中，训练数据过多则会导致训练时间过长，训练数据过少则可能导致模型预测精度不佳。

技术实现思路

1、本申请提供了一种语音交互方法、服务器及计算机可读存储介质。

2、本申请实施方式提供一种语音交互方法，包括：

3、获取初始训练数据，所述初始训练数据包括多个样本；

4、根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果；

5、根据所述多个标签推理结果，确定所述初始训练数据中的参考样本；

6、在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据；

7、利用所述目标训练数据训练第二预设模型，得到语音交互模型，以根据所述语音交互模型完成所述语音交互。

8、本申请实施方式提供的语音交互方法中，服务器可获取由多个样本构成的初始训练数据，根据第一预设模型，确定初始训练数据中每个样本的多个标签推理结果，根据每个样本的多个标签推理结果，确定初始训练数据中的参考样本，在候选训练数据中选取与参考样本语义相近的目标样本，以确定目标训练数据，利用目标训练数据对第二预设模型进行训练，以根据完成训练的第二预设模型得到语音交互模型，进而能根据语音交互模型完成语音交互。

9、如此，在本申请实施方式中，服务器可根据选取数据量较大的候选训练数据中与参考样本语义相近的目标样本，以确定数据量较小的目标训练数据，及根据目标训练数据训练第二预设模型，以得到能用于语义交互的语音交互模型，使得语音交互模型的训练时长可得到保障。本申请实施方式的服务器可根据初始训练数据中各个样本的标签推理结果，确定初始训练数据中的参考样本，及选取候选训练数据中与参考样本语义相近的目标样本，使得目标样本的选取能考虑到第一预设模型的多次推理情况，目标样本的可信度和有效性在一定程度上得到保障，也因此，通过包括有目标样本的目标训练数据训练得到的语音交互模型的预测精度在一定程度上得到保障。

10、在本申请某些实施方式中，所述根据所述多个标签推理结果，确定所述初始训练数据中的参考样本，包括：

11、根据所述初始训练数据中，所述多个标签推理结果中存在预设数量的错误标签推理结果的样本，确定所述参考样本，所述错误标签推理结果包括与所述样本的标签存在差异的标签推理结果。

12、如此，本申请实施方式的服务器可在根据初始训练数据中，多个标签推理结果中存在预设数量的错误标签推理结果的样本，完成参考样本的确定，使得参考样本的推理难度可在一定程度上保障，进而，根据参考样本选取的目标样本的推理难度亦能保障，利用目标训练数据训练得到的语音交互模型的预测精度亦可得到保障。

13、在本申请某些实施方式中，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

14、根据所述候选训练数据中，与所述参考样本的相似度满足预设条件的所述目标样本，确定所述目标训练数据。

15、如此，本申请实施方式可根据候选训练数据中，与参考样本的相似度满足预设条件的样本来确定目标样本，由此在一定程度上保障有目标样本与参考样本的相似性，通过目标样本训练第二预设模型而产生的训练效果也能在一定程度上得到保障。

16、在本申请某些实施方式中，所述候选训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

17、在所述图谱数据包括所述参考样本的情况下，选取所述候选训练数据内与所述参考样本语义相近的目标样本，以确定目标训练数据。

18、如此，本申请实施方式在候选训练数据由图谱数据确定，而图谱数据不包括初始训练数据中的参考样本的情况下，直接选取候选训练数据中与参考样本语义相近的目标样本以确定目标训练数据，进而，使得由目标训练数据训练得到语音交互模型能学习到语义相近的不同目标样本的区分方式，语音交互模型的可靠性和预测精度均能在一定程度上得到保障。

19、在本申请某些实施方式中，所述初始训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

20、在所述图谱数据未包括所述参考样本的情况下，根据所述候选训练数据中，与所述参考样本语义相近且与所述参考样本对应的业务功能相匹配的目标样本，确定所述目标训练数据。

21、如此，本申请实施方式可选取候选训练数据中与参考样本语义相近，且与参考样本对应的业务功能相匹配的样本以作为目标样本，进而在通过由目标样本构成的目标训练数据执行第二预设模型的训练时，第二预设模型能学习到语义相似且业务功能匹配的样本的标签推理知识或标签推理能力，从而使第二预设模型的泛化能力在一定程度上提升。

22、在本申请某些实施方式中，所述第一预设模型包括多个，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

23、利用多个所述第一预设模型分别推理所述初始训练数据中样本，确定多个所述标签推理结果。

24、如此，本申请实施方式可根据多个第一预设模型对同一个样本进行推理，以得到由多个第一预设模型得到的多个标签推理结果，使得后续的参考样本可以由不同第一预设模型所对应的标签推理结果来确定，在一定程度上保障有参考样本的合理确定。

25、在本申请某些实施方式中，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

26、利用所述第一预设模型对所述初始训练数据中样本进行多次推理，确定多个所述标签推理结果。

27、如此，本申请实施方式的服务器可根据利用一个第一预设模型对初始训练数据中样本进行多次推理，从而得到一个样本的多个标签推理结果，进而能在一定程度上降低服务器调用第一预设模型所需的负荷。

28、在本申请某些实施方式中，所述方法还包括：

29、抽取原始训练数据中的样本以确定所述候选训练数据。

30、如此，本申请实施方式可通过抽取原始训练数据中的样本，以完成候选训练数据的确定，从而能避免直接对原始训练数据进行目标样本采样的情况出现，也使得候选训练数据的获取效率能在一定程度上得到保障。

31、在本申请某些实施方式中，所述抽取原始训练数据中的样本以确定所述候选训练数据，包括：

32、根据预先确定的业务功能与样本的对应关系，根据所述业务功能抽取所述原始训练数据中的样本以确定所述候选训练数据。

33、如此，本申请实施方式使得服务器可根据业务功能与样本的对应，抽取原始训练数据中各个业务功能的样本以构建候选训练数据，在一定程度上保障候选本文档来自技高网...

【技术保护点】

1.一种语音交互方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述多个标签推理结果，确定所述初始训练数据中的参考样本，包括：

3.根据权利要求1所述的方法，其特征在于，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述候选训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述初始训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

6.根据权利要求1所述的方法，其特征在于，所述第一预设模型包括多个，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

8.根据权利要求1所述的方

9.根据权利要求8所述的方法，其特征在于，所述抽取原始训练数据中的样本以确定所述候选训练数据，包括：

10.根据权利要求8所述的方法，其特征在于，所述方法还包括：

11.一种服务器，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现权利要求1-10任一项所述的方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现权利要求1-10任意一项所述的方法。

...

【技术特征摘要】

1.一种语音交互方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述多个标签推理结果，确定所述初始训练数据中的参考样本，包括：

3.根据权利要求1所述的方法，其特征在于，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

6.根据权利要求1所述的方法，其特征在于，所述第一预设模型包括多个，所述根据第一预设模型，确定所述...

【专利技术属性】
技术研发人员：王毅，
申请(专利权)人：广州小鹏汽车科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人