语义识别方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:30069464 阅读:16 留言:0更新日期:2021-09-18 08:21
本申请公开了一种语义识别方法、装置、电子设备及存储介质。其中,该方法包括:在获取待识别文本时,基于待识别文本在标注文本索引库中获取候选文本集合,并在候选文本集合中获取与待识别语句最匹配的标注文本作为目标文本,从而根据目标文本对应的语义标注信息标注待识别文本,获得语义标注结果。如此,可以通过匹配的目标文本标注待识别文本,从而可以不经过实体模型对实体的抽取,快速获得待识别文本的语义识别结果,提升语义识别的响应速度,降低延迟。延迟。延迟。

【技术实现步骤摘要】
语义识别方法、装置、电子设备及计算机可读存储介质


[0001]本申请涉及自然语言处理
,更具体地,涉及一种语义识别方法,装置及计算机可读存储介质。

技术介绍

[0002]人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。自然语言处理(NLP,Nature Language Processing)是人工智能中的一个重要方向,主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
[0003]目前,常用的语义识别方案通常需要先通过机器学习模型识别文本中具有特定意义的实体,例如歌名、人名及地名等,而机器学习模型的训练耗时较长,影响语义识别的效率。

技术实现思路

[0004]有鉴于此,本申请实施例提出了一种语义识别方法、装置、电子设备及计算机可读存储介质,以改善上述问题。
[0005]第一方面,本申请实施例提供了一种语义识别方法,该方法包括:
[0006]获取待识别文本;
[0007]根据所述待识别文本在标注文本索引库中获取候选文本集合;所述标注文本索引库包括多个具有语义标注信息的标注文本;
[0008]在所述候选文本集合中获取与所述待识别语句最匹配的标注文本作为目标文本;
[0009]根据目标文本对应的语义标注信息标注所述待识别文本,获得语义标注结果。
[0010]第二方面,本申请实施例提供了一种语义识别装置,该装置包括:
[0011]待识别文本获取模块,用于获取待识别文本;
[0012]候选文本集合获取模块,用于根据所述待识别文本在标注文本索引库中获取候选文本集合;所述标注文本索引库包括多个具有语义标注信息的标注文本;
[0013]目标文本获取模块,用于在所述候选文本集合中获取与所述待识别语句最匹配的标注文本作为目标文本;
[0014]语义标注模块,用于根据目标文本对应的语义标注信息标注所述待识别文本,获得语义标注结果。
[0015]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面提供的语义识别方法。
[0016]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读取存储介
质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的语义识别方法。
[0017]本申请实施例提供的方案,在获取待识别文本时,基于待识别文本在标注文本索引库中获取候选文本集合,并在候选文本集合中获取与待识别语句最匹配的标注文本作为目标文本,从而根据目标文本对应的语义标注信息标注待识别文本,获得语义标注结果。如此,可以通过匹配的目标文本的语义标注信息标注待识别文本,从而可以不经过实体模型对实体的抽取,快速获得待识别文本的语义识别结果,提升语义识别的响应速度,降低延迟。
[0018]本申请实施例的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
[0019]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1示出了本申请一实施例所涉及的一种应用环境的示意图;
[0021]图2示出了本申请一实施例提出的一种语义平台系统图;
[0022]图3示出了本申请一实施例提出的一种语料标注的页面示意图;
[0023]图4示出了本申请一实施例提出的一种语义识别方法的流程图;
[0024]图5示出了本申请一实施例提出了一种语义识别方法的步骤S221~步骤S223的流程示意图;
[0025]图6示出了本申请一实施例提出的一种语义识别方法的步骤S231~步骤S233的流程示意图;
[0026]图7示出了本申请一实施例提出的一种文本匹配模型的结构示意图;
[0027]图8示出了本申请另一实施例提出的一种文本匹配模型的结构示意图;
[0028]图9示出了本申请实施例提出的语义识别装置的一种结构示意图;
[0029]图10示出了本申请实施例提出的一种电子设备的结构框图;
[0030]图11示出了本申请实施例的用于保存或者携带现实根据本申请实施例的语义识别方法的程序代码的存储单元。
具体实施方式
[0031]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0032]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0033]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层
面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0034]自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
[0035]其中,随着人工智能技术中的文本处理技术的发展,出现了许多的涉及基于文本处理技术以及自然语言处理技术进行语义识别的场景。例如,智能问答场景。在智能问答场景中,用户可以通过文本或语音的形式输入自己所期望了解的问题,智能问答系统则可以根据用户输入的问题来查询对应的回答以反馈给用户。再例如,新闻资讯搜索场景中,用户可以通过文本语音的形式输入所期望了解的主题,而搜索系统这可以根据该主题来搜索对应的信息反馈给用户。当用户通过语音的形式输入时,系统可先将语音转为文本,再对文本进行进一步处理。
[0036]但是,专利技术人在对语义识别场景中的相关文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义识别方法,其特征在于,所述方法包括:获取待识别文本;根据所述待识别文本在标注文本索引库中获取候选文本集合;所述标注文本索引库包括多个具有语义标注信息的标注文本;在所述候选文本集合中获取与所述待识别语句最匹配的标注文本作为目标文本;根据目标文本对应的语义标注信息标注所述待识别文本,获得语义标注结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述语义标注结果获得待识别文本的语义识别结果。3.根据权利要求1所述的方法,其特征在于,所述根据所述待识别文本在标注文本索引库中获取候选文本集合;所述标注文本索引库包括多个具有语义标注信息的标注文本,包括:以待识别文本做为索引在标注文本索引库中检索获得倒排表;根据与待识别文本的相似度大小对倒排表中的标注文本进行排序;将相似度大于预设相似度的标注文本作为候选文本集合。4.根据权利要求3所述的方法,其特征在于,所述将相似度大于预设相似度的标注文本作为候选文本集合包括:按照相似度从大到小的顺序依次将相似度大于预设相似度的标注文本加入候选文本集合,所述候选文本集合中相似文本的数量不超过预设数量。5.根据权利要求1所述的方法,其特征在于,所述标注文本索引库包括多个标注文本,所述标注文本由预处理文本通过索引格式转换获得;所述预处理文本由标注有槽位信息的标注语料通过预处理获得。6.根据权利要求1所述的方法,其特征在于,所述在所述候选文本集合中获取与所述待识别语句最匹配的标注文本作为目标文本,包括:获取待识别文本的第一特征向量表示;获取候选文本集合中标注文本的第二特征向量表示;将所述第一特征向量表示和所述第二特征向量表示输入训练后的文本匹配模型中,获得与所述待识别文本最匹配的标注文本作为目标文本。7.根据权利要求6所述的方法,其特征在于,所述获取待识别文本的第一特征向量表示,包括:将所述待识别文本进行分词处...

【专利技术属性】
技术研发人员:王明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1