信息的识别方法、系统、计算设备及存储介质技术方案

技术编号：28420103 阅读：38 留言：0更新日期：2021-05-11 18:27

本申请实施例提供一种信息的识别方法、系统、计算设备及存储介质，在本申请实施例中，接收通信语音请求，在通信语音请求的来源不属于预置来源的情况下，获取通信语音对应的语音文本；根据语音文本，获取语音文本对应的语音对话文本；根据语音对话文本，识别语音对话文本所属类别。从而实现通过不明通信语音直接自动识别不明通信语音的种类，进一步可以根据该种类，能够帮助用户对不明语音信息进行分类，特别是对于不良信息而言，帮助用户能够避免不良信息的骚扰，同时在识别过程中用户无感知，提高用户体验，还可以帮助用户提供所需的不明语音信息的类别。

全部详细技术资料下载

【技术实现步骤摘要】
信息的识别方法、系统、计算设备及存储介质
本申请涉及计算机
，尤其涉及一种信息的识别方法、系统、计算设备及存储介质。
技术介绍
随着信息技术的发展，通信网络可以实现信息之间的交互，从而方便人们的生活，例如，用户可以通过通信网络进行语音通信、线上购物、线上娱乐以及线上理财、缴费等等，相应的，作为信息的接收载体也成为用户生活中不可或缺的一部分，例如，手机、电脑等等。基于此，信息的接收载体会接收到大量不明信息，特别是语音信息，从而给用户带来许多不良的体验，更甚的还会给用户带来经济损失。
技术实现思路
本申请提供一种信息的识别方法、系统、计算设备及存储介质，用以较为自动地识别不明信息的类别，提高用户体验。本申请实施例提供一种信息的识别方法，包括：接收通信语音请求，在所述通信语音请求的来源不属于预置来源的情况下，获取通信语音对应的语音文本；根据所述语音文本，获取语音文本对应的语音对话文本；根据所述语音对话文本，识别所述语音对话文本所属类别。本申请实施例提供一种声纹库的建立方法，包括：建立非正常...

【技术保护点】
1.一种信息的识别方法，其特征在于，包括：/n接收通信语音请求，在所述通信语音请求的来源不属于预置来源的情况下，获取通信语音对应的语音文本；/n根据所述语音文本，获取语音文本对应的语音对话文本；/n根据所述语音对话文本，识别所述语音对话文本所属类别。/n

【技术特征摘要】
1.一种信息的识别方法，其特征在于，包括：
接收通信语音请求，在所述通信语音请求的来源不属于预置来源的情况下，获取通信语音对应的语音文本；
根据所述语音文本，获取语音文本对应的语音对话文本；
根据所述语音对话文本，识别所述语音对话文本所属类别。

2.根据权利要求1所述的方法，其特征在于：所述方法还包括：
获取所述通信语音请求的来源，将所述来源与用户预置正常来源集合进行匹配；
在匹配成功的情况下，将通信语音提供给用户。

3.根据权利要求1所述的方法，其特征在于：所述方法还包括：
获取所述通信语音请求的来源，将所述来源与预置非正常来源集合进行匹配；
在匹配成功的情况下，将是否接受通信语音的提示信息提供给用户。

4.根据权利要求1所述的方法，其特征在于：所述方法还包括：
获取所述通信语音请求的来源，将所述来源与预置非正常来源集合进行匹配；
在匹配到其中非法来源的情况下，拒绝所述通信语音请求。

5.根据权利要求1所述的方法，其特征在于：所述方法还包括：
在所述通信语音请求的来源不属于预置来源的情况下，获取所述通信语音的声纹；
在所述声纹不属于非正常声纹库的情况下，执行所述获取通信语音对应的语音文本的步骤。

6.根据权利要求1所述的方法，其特征在于：所述方法还包括：
建立非正常声纹库，所述非正常声纹库是根据非正常声纹得到的。

7.根据权利要求5或6所述的方法，其特征在于：所述方法还包括：
当所述类别为非正常类别，将所述声纹作为非正常声纹更新至所述非正常声纹库。

8.根据权利要求5所述的方法，其特征在于：所述方法还包括：
将所述声纹与所述非正常声纹库中的多个声纹进行匹配，当匹配成功，则确定所述声纹为非正常声纹。

9.根据权利要求8所述的方法，其特征在于：所述方法还包括：
当匹配到的声纹属于非正常声纹中的非法声纹，则确定对应通信语音为非法通信语音，并终止接收所述通信语音。

10.根据权利要求1所述的方法，其特征在于：所述方法还包括：
接收上报的声纹以及上报类别，当上报类别为非正常类别，则将上报的声纹作为所述非正常声纹更新至所述非正常声纹库。

11.根据权利要求7所述的方法，其特征在于：在更新所述非正常声纹库前，所述方法还包括：
当确定所述声纹不存在于所述非正常声纹库中，则将所述声纹作为非正常声纹更新至所述非正常声纹库。

12.根据权利要求1所述的方法，其特征在于：所述方法还包括：
当所述类别为非正常类别，确定所述通信语音为非正常通信语音。

13.根据权利要求8所述的方法，其特征在于：所述方法还包括：
当所述类别为非正常类别中的非法类别，确定所述通信语音为非正常通信语音中的非法通信语音以及所述声纹为非正常声纹中的非法声纹，并终止接收所述通信语音。

14.根据权利要求1所述的方法，其特征在于，所述获取语音文本对应的语音对话文本，包括：
将所述获取到的语音文本直接作为所述语音对话文本。

15.根据权利要求1所述的方法，其特征在于，所述获取语音文本对应的语音对话文本，包括：
确定所述语音文本对应的交互文本；
将所述获取到的语音文本以及对应的交互文本作为一组对话文本，并将至少一组对话文本作为所述语音对话文本；
当语音对话文本存在多组，针对任一两组对话文本，根据前一组对话文本获取后一组对话文本。

16.根据权利要求15所述的方法，其特征在于，所述根据前一组对话文本获取后一组对话文本，包括：
根据前一组对话文本中所述交互文本，获取所述后一组对话文本中所述语音文本；
在获取到所述语音文本后，执行所述确定所述语音文本对应的交互文本的步骤。

17.根据权利要求16所述的方法，其特征在于，所述获取所述后一组对话文本中所述语音文本，包括：
通过通信语音发送所述交互文本，并接收对应的通信语音，以获取到所述语音文本。

18.根据权利要求15所述的方法，其特征在于，所述确定所述语音文本对应的交互文本，包括：
确定所述语音文本的语义；
根据所述语义，从对话集合中确定与所述语音文本对应的交互文本。

19.根据权利要求1所述的方法，其特征在于，所述识别所述语音对话文本所属类别，包括：
确定所述语音对话文本的语义，根据所述语义确定所述语音对话文本对应的类别。

20.根据权利要求1所述的方法，其特征在于，所述方法还包括：
当所述类别为用户所需类别，则根据用户所需类别的内容，获取与所述内容匹配的语音对话文本，所述用户所需类别可属于非正常类别。

21.根据权利要求1所述的方法，其特征在于，所述方法还包括：
当所述类别为其它类别，确定所述声纹为其它类别声纹。

22.根据权利要求21所述的方法，其特征在于，所述方法还包括：
将所述其它类别声纹设置到对应类别声纹库。

23.根据权利要求1所述的方法，其特征在于，所述方法还包括：
根据所述类别，确定所述通信语音请求的来源的类别。

24.根据权利要求23所述的方法，其特征在于，所述方法还包括：
将所述通信语音请求的来源设置到对应来源类别集合中。

25.根据权利要求1所述的方法，其特征在于，所述方法还包括：
向用户提供所述类别以及所述通信语音请求的来源。

26.根据权利要求25所述的方法，其特征在于，所述方法还包括：
向用户提供所述语音对话文本。

27.根据权利要求25或26所述的方法，其特征在于，所述方法还包括：
接收所述类别的调整信息；
根据调整信息调整所述类别；
将调整后类别以及对应的语音对话文本作为用于优化模型的样本；
其中，所述模型用于确定所述语音对话文本的语义，根据所述语义确定所述语音对话文本对应的类别。

28.根据权利要求1所述的方法，其特征在于，在获取语音文本对应的语音对话文本后，所述方法还包括：
向用户提供所述语音对话文本的查看地址。

29.根据权利要求1所述的方法，其特征在于，所述方法还包括：
记录所述语音对话文本所属对话语音；
向用户提供所述语音对话文本所属对话语音的收听地址。

30.根据权利要求1所述的方法，其特征在于，所述方法还包括：
在所述通信语音请求的来源不属于预置来源的情况下，接受所述通信语音请求，并屏蔽接收用户语音以及屏蔽向用户提供通信语音。

31.根据权利要求1所述的方法，其特征在于，所述方法还包括：
在所述通信语音请求的来源属于预置来源的情况下，向用户提供所述所述通信语音请求的来源。

32.一种信息的识别方法，其特征在于，包括：
接受转发的通信语音请求，并获取语音信息对应的语音文本；
根据所述语音文本，获取语音文本对应的语音对话文本；根据所述语音对话文本，识别所述语音对话文本所属类别。

33.根据权利要32所述的方法，其特征在于，所述获取语音文本对应的语音对话文本，包括：
将所述获取到的语音文本直接作为所述语音对话文本。

34.根据权利要求32所述的方法，其特征在于，所述获取语音文本对应的语音对话文本，包括：
确定所述语音文本对应的交互文本；
将所述获取到的语音文本以及对应的交互文本作为一组对话文本，并将至少一组对话文本作为所述语音对话文本；
当语音对话文本存在多组，针对任一两组对话文本，根据前一组对话文本获取后一组对话文本。

35.根据权利要求34所述的方法，其特征在于，所述根据前一组对话文本获取后一组对话文本，包括：
根据前一组对话文本中所述交互文本，获取所述后一组对话文本中所述语音文本；
在获取到所述语音文本后，执行所述确定所述语音文本对应的交互文本的步骤。

36.根据权利要求35所述的方法，其特征在于，所述获取所述后一组对话文本中所述语音文本，包括：
通过通信语音发送所述交互文本，并接收对应的通信语音，以获取到所述语音文本。

37.根据权利要求34所述的方法，其特征在于，所述确定所述语音文本对应的交互文本，包括：
确定所述语音文本的语义；
根据所述语义，从对话集合中确定与所述语音文本对应的交互文本。

38.根据权利要求32所述的方法，其特征在于，所述识别所述语音对话文本所属类别，包括：
确定所述语音对话文本的语义，根据所述语义确定所述语音对话文本对应的类别。

39.根据权利要求32所述的方法，其特征在于，所述方法还包括：
接收上报的通信语音请求的来源以及上报类别，根据所述上报类型，将所述通信语音请求的来源存储至对应来源类别集合中。

40.根据权利要求39所述的方法，其特征在于，所述方法还包括：
针对任一上报类别，根据所述来源的上报次数，将所述上报的通信语音请求的来源存储至对应来源类别集合中。

41.根据权利要求40所述的方法，其特征在于，所述方法还包括：
针对任一上报类别，根据所述来源的上报次数以及上报用户数量，将所述上报的通信语音请求的来源存储至对应来源类别集合中。

42.根据权利要求39-41任一项所述的方法，其特征在于，所述方法还包括：
将更新后的来源类别集合下发至对应的设备，以进行更新。

43.一种声纹库的建立方法，其特征在于，包括：
建立非正常声纹库，所述非正常声纹库是根据非正常声纹得到的。<...

【专利技术属性】
技术研发人员：孙尧，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人