语义识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:17163367 阅读:21 留言:0更新日期:2018-02-01 21:18
本申请实施例公开了一种语义识别方法、装置、存储介质及电子设备。该方法包括获取语音数据及场景模式;将所述语音数据及场景模式输入预先构建的识别模型进行语义识别;获取所述识别模型输出的与所述场景模式对应的语义识别结果,执行所述语义识别结果对应的操作。采用上述技术方案,使识别模型具有在不同场景模式下准确“听懂”用户的语音的真实含义的能力,避免发生因不能准确理解自然语言对应的含义而导致语义识别的准确率较低的问题发生,可以实现准确、快速地确定在不同场景下用户输入的语音数据对应的语义。

Semantic identification methods, devices, storage media and electronic devices

【技术实现步骤摘要】
语义识别方法、装置、存储介质及电子设备
本申请实施例涉及自然语言处理技术,尤其涉及一种语义识别方法、装置、存储介质及电子设备。
技术介绍
随着应用于电子设备的科学技术的迅猛发展,电子设备已经拥有了强大的处理能力,可以实现在一定程度上像人类一样理解自然语言。然而,由于用户在输入语音数据时表述可能缺乏规范性,且同一意思可能采用不同的表达方式等原因,均对电子设备理解自然语言造成障碍,从而,导致语义识别的准确率往往不高。
技术实现思路
本申请实施例提供一种语义识别方法、装置、存储介质及电子设备,可以提高语义识别的准确率。第一方面,本申请实施例提供了一种语义识别方法,包括:获取语音数据及场景模式;将所述语音数据及场景模式输入预先构建的识别模型进行语义识别,其中,所述识别模型由不同场景模式下的标准语音数据样本训练得到;获取所述识别模型输出的与所述场景模式对应的语义识别结果,执行所述语义识别结果对应的操作,其中,所述语义识别结果包括所述语音数据对应的文本中的关键词。第二方面,本申请实施例还提供了一种语义识别装置,该装置包括:语音获取模块,用于获取语音数据及场景模式;语义识别模块,用于将所述语音数据及场景模式输入预先构建的识别模型进行语义识别,其中,所述识别模型由不同场景模式下的标准语音数据样本训练得到;识别结果执行模块,用于获取所述识别模型输出的与所述场景模式对应的语义识别结果,执行所述语义识别结果对应的操作,其中,所述语义识别结果包括所述语音数据对应的文本中的关键词。第三方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的语义识别方法。第四方面,本申请实施例还提供了一种电子设备,包括用于采集语音数据的语音采集器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的语义识别方法。本申请实施例提供一种语义识别方案,通过获取语音数据及场景模式;将所述语音数据及场景模式输入预先构建的识别模型进行语义识别;获取所述识别模型输出的与所述场景模式对应的语义识别结果,执行所述语义识别结果对应的操作,提高机器在不同场景下理解用户输入的语音的真实含义的能力。采用上述技术方案,通过在识别模型的训练过程中考虑场景模式因素,使识别模型具有在不同场景模式下准确“听懂”用户的语音的真实含义的能力,避免发生因不能准确理解自然语言对应的含义而导致语义识别的准确率较低的问题发生,可以实现准确、快速的确定在不同场景下用户输入的语音数据对应的语义。附图说明图1是本申请实施例提供的一种语义识别方法的流程图;图2是本申请实施例提供的一种长短期记忆网络中神经元的结构示意图;图3是本申请实施例提供的另一种语义识别方法的流程图;图4是本申请实施例提供的一种语义识别装置的结构示意图;图5是本申请实施例提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。相关技术中,语义识别的主要方法是基于循环神经网络的文本语义理解方法和基于卷积神经网络的文本语义理解方法。然而,由于自然语言代表的含义十分丰富,同一句话在不同的场景中可能代表不同的含义。例如,在闹钟响铃时,用户通过语音方式输入“关闭闹铃”,其可能的含义就包括仅关闭本次闹铃(例如,用户设置闹钟为工作日的7点响铃,则关闭本次闹铃的含义是其在下一个工作日的相同时间还会响铃),或者是直接关闭预先设置的闹钟。若当前电子设备处于闹钟响铃模式,即预先设置该闹钟有可能是为了在工作日叫用户起床,则用户语音输入“关闭闹钟”的真正含义可能是“关闭本次或当日闹钟”。若当前电子设备处于事项提醒模式,即预先设置闹钟有可能是为了提醒用户当天需要处理的重要事项,则用户语音输入“关闭闹钟”的真是含义可能是“关闭该预先设置的闹钟”。由于相关技术提供的语义识别方法在语义识别的过程中未考虑场景模式对语义识别结果的影响,因此,往往出现不能正确理解不同场景下用户的真实意愿的情况,导致语义识别的准确率不高。图1为本申请实施例提供的一种语义识别方法的流程图,该方法可以由语义识别装置来执行,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:步骤110、获取语音数据及场景模式。其中,语音数据包括用户输入的语音。电子设备上集成有语音采集器,通过语音采集器可以获取语音数据。其中,语音采集器包括送话器,以及蓝牙耳机、红外耳机等无线耳机。例如,可以是在检测到用户按住语音输入按钮时,通过送话器采集语音数据。又如,还可以是在检测到用户触摸蓝牙耳机上的语音输入按钮时,通过蓝牙耳机采集语音数据,并将采集到的语音数据通过蓝牙模块发送至移动终端。可以理解的是,上述获取语音数据的方式是示例而非限定。所述场景模式与电子设备的工作状态及外部环境等因素相关联。例如,当前环境光的光强值较小,且电子设备的前台运行有扫描二维码的应用程序时,若用户语音输入“打开手电筒”,其真实意图是通过打开电子设备的手电筒功能为扫描二维码的应用提供短时间照明,在扫描成功后,即可自动关闭手电筒功能。对于相同的外部环境因素,即当前环境光的光强值较小,在电子设备的前台运行的应用程序不属于预设的白名单时,若用户同样通过语音方式输入“打开手电筒”,其真实意图是打开电子设备的手电筒功能进行照明,而不是短时间照明后就自动关闭。可以在检测到语音数据时,查询任务管理器,以确定前台运行的应用程序的进程名或包名等唯一标识应用程序的信息。可选的,还可以在语音数据获取完成后,查询任务管理器,以确定前台运行的应用程序。根据所述应用程序的进程名或包名查询预设的白名单,判断该应用程序是否属于该白名单。其中,预设的白名单的确定方式有很多种,本申请实施例中不作具体限定。例如,可以是对一定数量的用户的历史使用习惯进行统计,得出对同一表述作不同理解的场景模式。然后,确定该场景模式下启用次数超过设定阈值的应用程序,对该应用程序的标识信息进行存储,得到该白名单,并在出厂前配置于电子设备中。又如,向用户提供应用程序配置功能,以供用户在启动该应用程序配置功能时,提示用户选择出现语义误解析时前台运行的应用程序,对用户选择的应用程序进行存储得到该白名单。可以理解的是,还可以通过用户选择的出现语义无解析时前台运行的应用程序,更新出厂前配置于电子设备中的预设的白名单。在前台运行的应用程序属于预设的白名单时,获取环境光传感器采集的环境光强度值,根据该环境光强度值及应用程序确定场景模式。示例性的,若前台运行的应用程序是相机应用,则将该环境光强度值与预设光强阈值进行比较。在该环境光强本文档来自技高网...
语义识别方法、装置、存储介质及电子设备

【技术保护点】
一种语义识别方法,其特征在于,包括:获取语音数据及场景模式;将所述语音数据及场景模式输入预先构建的识别模型进行语义识别,其中,所述识别模型由不同场景模式下的标准语音数据样本训练得到;获取所述识别模型输出的与所述场景模式对应的语义识别结果,执行所述语义识别结果对应的操作,其中,所述语义识别结果包括所述语音数据对应的文本中的关键词。

【技术特征摘要】
1.一种语义识别方法,其特征在于,包括:获取语音数据及场景模式;将所述语音数据及场景模式输入预先构建的识别模型进行语义识别,其中,所述识别模型由不同场景模式下的标准语音数据样本训练得到;获取所述识别模型输出的与所述场景模式对应的语义识别结果,执行所述语义识别结果对应的操作,其中,所述语义识别结果包括所述语音数据对应的文本中的关键词。2.根据权利要求1所述的方法,其特征在于,获取语音数据及场景模式,包括:获取语音数据;获取前台运行的应用程序,并判断所述应用程序是否属于预设的白名单;若是,则获取环境光强度值或系统时间,根据所述应用程序及环境光强度值确定场景模式,或者,根据所述应用程序及系统时间确定场景模式;否则,获取默认场景模式作为当前的场景模式。3.根据权利要求2所述的方法,其特征在于,在所述应用程序为相机应用时,根据所述应用程序及环境光强度值确定场景模式,包括:若所述相机应用在前台运行,则将所述环境光强度值与预设光强阈值进行比较;在所述环境光强度值小于预设光强阈值时,确定当前的场景模式为低光拍摄模式。4.根据权利要求2所述的方法,其特征在于,在所述应用程序为闹钟应用时,根据所述应用程序及系统时间确定场景模式,包括:若闹钟应用在前台运行,则获取所述闹钟应用对应的响铃时间;判断所述系统时间是否与所述响铃时间匹配;若是,则确定当前的场景模式为闹钟响铃模式;否则,确定当前的场景模式为事项提醒模式。5.根据权利要求1所述的方法,其特征在于,所述标准语音数据样本包括:预先收集或录制的不同场景模式下的用户输入的语音数据样本;或者,对所述语音数据样本对应的文本进行分词处理,对所述文本中关键词进行同义词扩展,采用同义词替换所述关键词得到替换文本对应的语音数据样本。6.根据权利要求1所述的方法,其特征在于,将所述语音数据及场景模式输入预先构建的识别模型进行语义识别,包括:将所述语音数据对应的语音特征矢量序列输入预先构建的识别模型,通过所述识别模型识别所述语音特征矢量序列对应的发音;根据所述发音确定所述语音数据对应的文本,对所述文本进行分词,根据词语的词性提取出...

【专利技术属性】
技术研发人员:梁昆
申请(专利权)人:广东欧珀移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1