一种badcase挖掘方法及电子设备技术

技术编号:26304156 阅读:36 留言:0更新日期:2020-11-10 19:59
本申请公开了一种badcase挖掘方法及电子设备,用以提高badcase挖掘的效率。该方法包括:从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息;将所述特征信息输入至所述badcase挖掘模型得到所述用户日志数据所属的类别;所述类别为以下类别中的一个:非badcase数据类别和至少一个badcase数据类别;所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出不符合用户预期;所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出符合用户预期。

【技术实现步骤摘要】
一种badcase挖掘方法及电子设备
本申请涉及计算机
更具体的讲,涉及一种badcase挖掘方法及电子设备。
技术介绍
在智能设备与用户交互的过程中,通常需要对用户输入的信息进行语音识别、语义解析等处理,而由于用于语义解析的语义引擎的性能尚不完善等原因,可能出现智能设备的输出结果不符合用户心理预期的问题,即出现坏例(badcase)。通过对出现的badcase进行分析可以发现语义引擎存在的缺陷,进而可以针对性地改进语义引擎,提升语义引擎的性能。目前主要通过人工分析用户日志的方式,发现智能设备与用户交互过程中出现的badcase。但人工分析耗时耗力,且往往只能从海量的用户日志中抽取部分作为样本进行分析,实际分析的用户日志较少,不足以为提升语义引擎的性能提供辅助。
技术实现思路
本申请实施例提供一种badcase挖掘方法及电子设备,用以提高badcase挖掘的效率。第一方面,提供一种电子设备,包括:存储器和处理器;所述存储器,用于存储预先训练的坏例badcase挖掘模型;所述处理器被配置用于:从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息;将所述特征信息输入所述badcase挖掘模型得到所述用户日志数据所属的类别;所述类别为以下类别中的一个:非badcase数据类别和至少一个badcase数据类别;所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果不符合用户预期,所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果符合用户预期。第二方面,提供一种badcase挖掘方法,包括:从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息;将所述特征信息输入预先训练的badcase挖掘模型得到所述用户日志数据所属的类别;所述类别为以下类别中的一个:非badcase数据类别和至少一个badcase数据类别;所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果不符合用户预期,所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果符合用户预期。上述实施例中,电子设备将用户日志数据输入预先训练的badcase挖掘模型中,区分出属于badcase数据类别的用户日志数据,由此实现了badcase的自动化挖掘,提高了badcase挖掘的效率,可快速地从大量用户日志数据中挖掘出badcase数据,得到的挖掘结果能够较好地为提升用于解析语义的语义引擎的性能提供辅助。附图说明为了更清楚地说明本申请实施例或相关技术中的实施方式,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1中示例性示出了根据一些实施例的显示设备与控制装置之间操作场景的示意图;图2中示例性示出了根据一些实施例的显示设备200的硬件配置框图;图3中示例性示出了根据一些实施例的控制设备100的硬件配置框图;图4中示例性示出了根据一些实施例的显示设备200中软件配置示意图;图5中示例性示出了根据一些实施例的显示设备200中应用程序的图标控件界面显示示意图;图6中示例性示出了本申请实施例提供的badcase挖掘模型训练流程图;图7中示例性示出了本申请实施例提供的badcase挖掘模型训练示意图;图8中示例性示出了本申请实施例提供的badcase挖掘方法流程图。具体实施方式为使本申请的目的、实施方式和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请描述的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请所附权利要求保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明(Unlessotherwiseindicated)。应该理解这样使用的用语在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。本申请中使用的术语“模块”,是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。本申请中使用的术语“遥控器”,是指电子设备(如本申请中公开的显示设备)的一个组件,通常可在较短的距离范围内无线控制电子设备。一般使用红外线和/或射频(RF)信号和/或蓝牙与电子设备连接,也可以包括WiFi、无线USB、蓝牙、动作传感器等功能模块。例如:手持式触摸遥控器,是以触摸屏中用户界面取代一般遥控装置中的大部分物理内置硬键。本申请中使用的术语“手势”,是指用户通过一种手型的变化或手部运动等动作,用于表达预期想法、动作、目的/或结果的用户行为。下文部分实施例中以与用户进行语音交互的智能设备为显示设备为例进行描述,为便于理解,下面对显示设备的结构、显示设备和用户的交互、显示设备和服务器的交互进行描述:图1中示例性示出了根据实施例中显示设备与控制装置之间操作场景的示意图。如图1中示出,用户可通过移动终端300和控制装置100操作显示设备200。在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式等,通过无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键,语音输入、控制面板输入等输入用户指令,来控制显示设备200。如:用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令,来实现控制显示设备200的功能。在一些实施例中,也可以使用移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。该应用程序通过配置可以在与智能设备关联的屏幕上,在直观的用户界面(UI)中为用户提供各种控制。在一些实施例中本文档来自技高网...

【技术保护点】
1.一种电子设备,其特征在于,包括:存储器和处理器;/n所述存储器,用于存储预先训练的坏例badcase挖掘模型;/n所述处理器被配置用于:/n从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息;/n将所述特征信息输入所述badcase挖掘模型得到所述用户日志数据所属的类别;所述类别为以下类别中的一个:非badcase数据类别和至少一个badcase数据类别;所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果不符合用户预期,所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果符合用户预期。/n

【技术特征摘要】
1.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储预先训练的坏例badcase挖掘模型;
所述处理器被配置用于:
从智能设备与用户进行语音交互过程中生成的用户日志数据中提取特征信息;
将所述特征信息输入所述badcase挖掘模型得到所述用户日志数据所属的类别;所述类别为以下类别中的一个:非badcase数据类别和至少一个badcase数据类别;所述badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果不符合用户预期,所述非badcase数据类别用于表示所述智能设备在与用户进行语音交互过程中的输出结果符合用户预期。


2.根据权利要求1所述的电子设备,其特征在于,所述badcase挖掘模型通过以下步骤训练:
获取训练样本,所述训练样本包括已标注类别的用户日志数据;
利用所述训练样本训练所述badcase挖掘模型。


3.根据权利要求1所述的电子设备,其特征在于,所述至少一个badcase数据类别包括以下至少一个:
用于指示未能正确解析用户输入的语音意图的第一类别;
用于指示未能正确定位用户输入的语音的业务领域的第二类别;
用于指示未能正确将用户输入的语音识别为文本的第三类别;
用于指示未能纠正用户输入的语音中的错误信息的第四类别。


4.根据权利要求1所述的电子设备,其特征在于,所述badcase挖掘模型为支持向量机模型、基于树型结构的机器学习模型、神经网络模型和深度神经网络模型中的一种。


5.根据权利要求1所述的电子设备,其特征在于,所述用户日志包括以下至少一种信息:
智能设备与用户进行语音交互过程中用户输入的每一语音对应的语音识别结果、所述语音对应的语义解析结果、智能设备响应所述语音的输出结果、所述输出结果...

【专利技术属性】
技术研发人员:邵星阳杨善松刘永霞
申请(专利权)人:海信视像科技股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1