一种badcase挖掘方法及电子设备技术

技术编号：26304156 阅读：36 留言：0更新日期：2020-11-10 19:59

本申请公开了一种badcase挖掘方法及电子设备，用以提高badcase挖掘的效率。该方法包括：从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息；将所述特征信息输入至所述badcase挖掘模型得到所述用户日志数据所属的类别；所述类别为以下类别中的一个：非badcase数据类别和至少一个badcase数据类别；所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出不符合用户预期；所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出符合用户预期。

全部详细技术资料下载

【技术实现步骤摘要】
一种badcase挖掘方法及电子设备
本申请涉及计算机
更具体的讲，涉及一种badcase挖掘方法及电子设备。
技术介绍
在智能设备与用户交互的过程中，通常需要对用户输入的信息进行语音识别、语义解析等处理，而由于用于语义解析的语义引擎的性能尚不完善等原因，可能出现智能设备的输出结果不符合用户心理预期的问题，即出现坏例(badcase)。通过对出现的badcase进行分析可以发现语义引擎存在的缺陷，进而可以针对性地改进语义引擎，提升语义引擎的性能。目前主要通过人工分析用户日志的方式，发现智能设备与用户交互过程中出现的badcase。但人工分析耗时耗力，且往往只能从海量的用户日志中抽取部分作为样本进行分析，实际分析的用户日志较少，不足以为提升语义引擎的性能提供辅助。
技术实现思路
本申请实施例提供一种badcase挖掘方法及电子设备，用以提高badcase挖掘的效率。第一方面，提供一种电子设备，包括：存储器和处理器；所述存储器，用于存储预先训练的坏例badcase挖掘模型；所述处理器被配置用于：从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息；将所述特征信息输入所述badcase挖掘模型得到所述用户日志数据所属的类别；所述类别为以下类别中的一个：非badcase数据类别和至少一个badcase数据类别；所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果不符合用户预期，所述非badcase数据类别用...

【技术保护点】
1.一种电子设备，其特征在于，包括：存储器和处理器；/n所述存储器，用于存储预先训练的坏例badcase挖掘模型；/n所述处理器被配置用于：/n从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息；/n将所述特征信息输入所述badcase挖掘模型得到所述用户日志数据所属的类别；所述类别为以下类别中的一个：非badcase数据类别和至少一个badcase数据类别；所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果不符合用户预期，所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果符合用户预期。/n

【技术特征摘要】
1.一种电子设备，其特征在于，包括：存储器和处理器；
所述存储器，用于存储预先训练的坏例badcase挖掘模型；
所述处理器被配置用于：
从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息；
将所述特征信息输入所述badcase挖掘模型得到所述用户日志数据所属的类别；所述类别为以下类别中的一个：非badcase数据类别和至少一个badcase数据类别；所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果不符合用户预期，所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果符合用户预期。

2.根据权利要求1所述的电子设备，其特征在于，所述badcase挖掘模型通过以下步骤训练：
获取训练样本，所述训练样本包括已标注类别的用户日志数据；
利用所述训练样本训练所述badcase挖掘模型。

3.根据权利要求1所述的电子设备，其特征在于，所述至少一个badcase数据类别包括以下至少一个：
用于指示未能正确解析用户输入的语音意图的第一类别；
用于指示未能正确定位用户输入的语音的业务领域的第二类别；
用于指示未能正确将用户输入的语音识别为文本的第三类别；
用于指示未能纠正用户输入的语音中的错误信息的第四类别。

4.根据权利要求1所述的电子设备，其特征在于，所述badcase挖掘模型为支持向量机模型、基于树型结构的机器学习模型、神经网络模型和深度神经网络模型中的一种。

5.根据权利要求1所述的电子设备，其特征在于，所述用户日志包括以下至少一种信息：
智能设备与用户进行语音交互过程中用户输入的每一语音对应的语音识别结果、所述语音对应的语义解析结果、智能设备响应所述语音的输出结果、所述输出结果...

【专利技术属性】
技术研发人员：邵星阳，杨善松，刘永霞，
申请(专利权)人：海信视像科技股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人