语义解析方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:23050233 阅读:30 留言:0更新日期:2020-01-07 14:48
本申请公开了一种语义解析方法、装置、电子设备以及存储介质,涉及电子设备技术领域。所述方法包括:获取待查询语句,对待查询语句进行实体识别,获取待查询语句中的目标实体,将目标实体与知识图谱进行实体链接,获得与目标实体对应的实体内容,基于实体内容对待查询语句进行意图分析,获得与待查询语句对应的至少一个意图分类。本申请实施例提供的语义解析方法、装置、电子设备以及存储介质通过先定位目标实体,通过实体链接从知识图谱中获取目标实体对应的实体内容,再对实体内容进行意图分析获得至少一个意图分类,从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。

Semantic analysis methods, devices, electronic devices and storage media

【技术实现步骤摘要】
语义解析方法、装置、电子设备以及存储介质
本申请涉及电子设备
,更具体地,涉及一种语义解析方法、装置、电子设备以及存储介质。
技术介绍
随着科学技术的发展,电子设备的使用越来越广泛,功能越来越多,已经成为人们日常生活中的必备之一。目前,电子设备可以用于接收用户的输入并基于输入识别用户的意图,但是,电子设备在应用到某些特定领域时,难以做到意图的准确识别,导致推送给用户的资源过多,用户体验不佳的问题。
技术实现思路
鉴于上述问题,本申请提出了一种语义解析方法、装置、电子设备以及存储介质,以解决上述问题。第一方面,本申请实施例提供了一种语义解析方法,所述方法包括:获取待查询语句;对所述待查询语句进行实体识别,获取所述待查询语句中的目标实体;将所述目标实体与知识图谱进行实体链接,获得与所述目标实体对应的实体内容;基于所述实体内容对所述待查询语句进行意图分析,获得与所述待查询语句对应的至少一个意图分类。第二方面,本申请实施例提供了一种语义解析装置,所述装置包括:待查询语句获取模块,用于获取待查询语句;目标实体获取模块,用于对所述待查询语句进行实体识别,获取所述待查询语句中的目标实体;实体内容获得模块,用于将所述目标实体与知识图谱进行实体链接,获得与所述目标实体对应的实体内容;意图分类获得模块,用于基于所述实体内容对所述待查询语句进行意图分析,获得与所述待查询语句对应的至少一个意图分类。第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行上述方法。第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。本申请实施例提供的语义解析方法、装置、电子设备以及存储介质,获取待查询语句,对待查询语句进行实体识别,获取待查询语句中的目标实体,将目标实体与知识图谱进行实体链接,获得与目标实体对应的实体内容,基于实体内容对待查询语句进行意图分析,获得与待查询语句对应的至少一个意图分类,从而通过先定位目标实体,再通过实体链接从知识图谱中获取目标实体对应的实体内容,再对实体内容进行意图分析获得至少一个意图分类,从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1示出了本申请一个实施例提供的语义解析方法的流程示意图;图2示出了本申请又一个实施例提供的语义解析方法的流程示意图;图3示出了本申请的图2所示的语义解析方法的步骤S220的流程示意图;图4示出了本申请的图2所示的语义解析方法的步骤S250的流程示意图;图5示出了本申请的图4所示的语义解析方法的步骤S252的流程示意图;图6示出了本申请实施例提供的语义解析装置的模块框图;图7示出了本申请实施例用于执行根据本申请实施例的语义解析方法的电子设备的框图;图8示出了本申请实施例的用于保存或者携带实现根据本申请实施例的语义解析方法的程序代码的存储单元。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。媒体垂域(音乐、视频、电台)是语音助手的重点技能,同时也是技术难度很高的领域,因此,为了获取多渠道的影音资源,打造语音助手深度个性化影音场景,需要对媒体垂域进行研发。其中,媒体垂域的语义理解由于实体强依赖性和实体复杂性,使得无法仅靠通用的文本分类技术实现意图理解及槽位提取。其中,专利技术人经过研究发现,媒体垂域的意图识别有三个挑战:(1)实体复杂性带来的过召回和定位问题:其中,从数字资源诞生至今,已产生大量资源,仅音乐领域:QQ音乐有约1500w的媒体资源、网易云音乐有约500w的媒体资源,其中,不同于传统人名、地名、机构名等实体识别任务,媒体资源的命名没有清晰固定的组成规则,其存在大量与生活场景、名词、动词相关的片段,且很多资源名本身便可成句。例如:“打电话”、“短信”、“闹钟”、“下一首”都可以是歌名。因此,通过词典匹配会误命中大量资源,造成过召回和定位的问题。(2)实体信息嵌入问题,如何将实体识别后的信息嵌入到意图理解模型中,也为系统带来了较大的挑战:为解决实体嵌入的问题,目前的电子设备厂商采用的方式是基于常见问题解答(frequentlyaskedquestions,FQA)技术完成对音乐垂域的构建,其主要思想为给定用户文本,搜索出最相似的音乐资源,其整体架构分为:意图抽取、知识库搜索排序、槽位抽取、路径选择及打分、线上数据反馈等几个模块。具体地:1、对用户文本进行预处理及特征抽取;2、从知识库中召回相似歌曲,使用learntorank排序确定用户想听的歌名;3、根据歌名抽取槽位(slot),获取实体信息;4、通过构建实体特征,利用梯度下降树(gradientboostingdecisiontree,GBDT)模型打分完成对实体嵌入信息的引用;5、使用用户反馈优化LTR及打分模型。然而,上述方式仍然存在过召回的问题和架构冗余的问题。具体地,由于使用全用户文本进行资源召回,并且资源名称复杂度高,因此存在大部分用户文本都能召回资源实体的情况,在后续分类过程中会导致非媒体资源被召回,无法解决实体复杂性带来的过召回的问题。使用搜索+LTR解决用户文本的实体识别,和词典匹配+规则没有本质性差异,且将用户文本的意图识别与资源消岐杂糅在一起,不利于扩展,需要大量的训练语料及用户反馈数据进行优化,造成架构冗余的问题。(3)无法支持后续的媒体垂域问答。针对上述问题,专利技术人经过长期的研究发现,并提出了本申请实施例提供的语义解析方法、装置、电子设备以及存储介质,通过先定位目标实体,再通过实体链接从知识图谱中获取目标实体对应的实体内容,再对实体内容进行意图分析获得至少一个意图分类,从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。其中,具体的语义解析方法在后续的实施例中进行详细的说明。请参阅图1,图1示出了本申请一个实施例提供的语义解析方法的流程示意图。所述语义解析方法用于通过先定位目标实体,再通过实体链接从知识图谱中获取目标实体对应的实体内容,再对实体内容进行意图分析获得至少一个意图分类,从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。在具体的实施例中,所述语义解析方法应用于如图6所示的语义解析装置200以及配置有所述语义解析装置200的电子设备100(图7)。下面将以电子设备为例,说明本实施例的具体流程,当然,可以理解的,本实施例所应用的电子设备可以为移动终端、平板电脑、穿戴式电子设备等,在此不做限定本文档来自技高网
...

【技术保护点】
1.一种语义解析方法,其特征在于,所述方法包括:/n获取待查询语句;/n对所述待查询语句进行实体识别,获取所述待查询语句中的目标实体;/n将所述目标实体与知识图谱进行实体链接,获得与所述目标实体对应的实体内容;/n基于所述实体内容对所述待查询语句进行意图分析,获得与所述待查询语句对应的至少一个意图分类。/n

【技术特征摘要】
1.一种语义解析方法,其特征在于,所述方法包括:
获取待查询语句;
对所述待查询语句进行实体识别,获取所述待查询语句中的目标实体;
将所述目标实体与知识图谱进行实体链接,获得与所述目标实体对应的实体内容;
基于所述实体内容对所述待查询语句进行意图分析,获得与所述待查询语句对应的至少一个意图分类。


2.根据权利要求1所述的方法,其特征在于,所述基于所述实体内容对所述待查询语句进行意图分析,获得与所述待查询语句对应的至少一个意图分类,包括:
将所述实体内容嵌入意图分类模型,以通过所述意图分类模型对所述待查询语句进行意图分类和意图消岐;
获取与所述待查询语句对应的至少一个意图分类。


3.根据权利要求2所述的方法,其特征在于,所述将所述实体内容嵌入意图分类模型,包括:
将所述实体内容映射为分布式表达,获得第一词向量;
将所述第一词向量嵌入所述意图分类模型。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述待查询语句映射为分布式表达,获得第二词向量;
所述将所述第一词向量嵌入所述意图分类模型,包括:
将所述第一词向量和所述第二词向量拼接并嵌入所述意图分类模型。


5.根据权利要求1所述的方法,其特征在于,所述对所述待查询语句进行实体识别,获取所述待查询语句中的目标实体,包括:
通过序列标注模型在所述待查询语句中框定待验证实体;
基于预设实体校验规则对所述待验证实体进行筛选,从所述待验证实体中确定满足所述预设实...

【专利技术属性】
技术研发人员:杨振宇
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1