自然语言的语义识别方法、装置、设备及存储介质制造方法及图纸

技术编号:25950275 阅读:26 留言:0更新日期:2020-10-17 03:42
本申请实施例公开了一种自然语言的语义识别方法、装置、设备及存储介质,涉及计算机信息处理技术领域。该方法包括:接收目标初始数据;调用第一神经网络模型;对目标初始数据进行数据纠错处理,获取第一文本数据;调用第二神经网络模型,对第一文本数据进行文本断句处理,获取第二文本数据;调用第三神经网络模型,对第二文本数据进行意图识别及实体抽取,获取目标实体和目标意图。本申请还涉及区块链技术,将目标实体和目标意图存储至区块链网络。所述方法应用多种类型的模型共同协作处理自然语言进行语义识别,通过数据纠错提升了模型的适应能力,实现了多意图区分和提高了模型的运行效率及准确性,使用户在人机交互中能获得更好的体验。

【技术实现步骤摘要】
自然语言的语义识别方法、装置、设备及存储介质
本申请涉及计算机信息处理
,特别是一种自然语言的语义识别方法、装置、设备及存储介质。
技术介绍
近年来,随着计算机运算能力的提高和人工智能核心算法的突破性发展,人工智能领域进展迅速。而自然语言处理被誉为“人工智能皇冠上的明珠,是计算机科学领域与人工智能领域中的一个重要方向,有着广阔的应用空间。自然语言处理是计算机科学、语言学和机器学习的交叉点,它关注计算机与人类之间使用自然语言中的沟通交流,致力于让计算机能够理解和生成人类语言。自然语言处理技术主要应用于机器翻译、智能问答、语音助手和文本过滤等多方面,已经开始对各行各业产生巨大的影响。金融业务领域存在较多的文本阅读和客户问答场景,且与数据有高度相关性,成为自然语言处理最先应用的行业之一。现有智能问答中自然语言理解方法多为系统按顺序对用户自然语言输入进行意图分类、实体抽取,再通过业务逻辑返回自然语言理解结果。而在实际应用场景中,经常存在用户输入存在错别字、语音识别不准确、业务专有词汇不断增加、一句话内存在无标点区分的多意图等等问题,使问答系统产生错误,无法实现客户需求。
技术实现思路
本申请实施例所要解决的技术问题是,提供一种自然语言的语义识别方法、装置、设备及存储介质,提升模型对语义识别的适应能力,并提高多意图区分和实体抽取的效率及准确性。为了解决上述技术问题,本申请实施例提供一种自然语言的语义识别方法,采用了如下所述的技术方案:一种自然语言的语义识别方法,包括:<br>接收用户输入的待识别的目标初始数据;触发缺省的语义识别指令,并响应于所述语义识别指令调用预设的第一神经网络模型;通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据;调用预设的第二神经网络模型,通过所述第二神经网络模型对所述第一文本数据进行文本断句处理,以获取包含分词序列标注的第二文本数据;调用预设的第三神经网络模型,通过所述第三神经网络模型对所述第二文本数据进行意图识别及实体抽取,以获取所述第二文本数据包含的每种用户意图中相互匹配的目标实体和目标意图。为了解决上述技术问题,本申请实施例还提供一种自然语言的语义识别装置,采用了如下所述的技术方案:一种自然语言的语义识别装置,包括:数据接收模块,用于接收用户输入的待识别的目标初始数据;指令触发模块,用于触发缺省的语义识别指令,并响应于所述语义识别指令调用预设的第一神经网络模型;数据纠错模块,用于通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据;序列标注模块,用于调用预设的第二神经网络模型,通过所述第二神经网络模型对所述第一文本数据进行文本断句处理,以获取包含分词序列标注的第二文本数据;数据解析模块,用于调用预设的第三神经网络模型,通过所述第三神经网络模型对所述第二文本数据进行意图识别及实体抽取,以获取所述第二文本数据包含的每种用户意图中相互匹配的目标实体和目标意图。为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项技术方案所述的自然语言的语义识别方法的步骤。为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项技术方案所述的自然语言的语义识别方法的步骤。与现有技术相比,本申请实施例主要有以下有益效果:本申请实施例公开了一种自然语言的语义识别方法、装置、设备及存储介质,本申请实施例所述的自然语言的语义识别方法,接收用户输入的待识别的目标初始数据后;便触发缺省的语义识别指令,并响应于语义识别指令调用预设的第一神经网络模型;然后通过第一神经网络模型对目标初始数据进行数据纠错处理,以获取第一文本数据;调用预设的第二神经网络模型后,通过第二神经网络模型对第一文本数据进行文本断句处理,以获取包含分词序列标注的第二文本数据;再调用预设的第三神经网络模型,通过第三神经网络模型对第二文本数据进行意图识别及实体抽取,以获取第二文本数据包含的每种用户意图中相互匹配的目标实体和目标意图。所述方法应用多种类型的神经网络模型共同协作处理自然语言进行语义识别,通过对输入数据进行数据纠错提升了模型的适应能力,对输入数据进行断句实现了多意图区分,并通过意图识别和实体抽取提高了模型的运行效率及准确性,使用户在进行人机交互的过程中能获得更好的使用体验。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例可以应用于其中的示例性系统架构图;图2为本申请实施例中所述自然语言的语义识别方法的一个实施例的流程图;图3为本申请实施例中所述自然语言的语义识别装置的一个实施例的结构示意图;图4为本申请实施例中计算机设备的一个实施例的结构示意图。具体实施方式除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”、“包含”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。在本申请的权利要求书、说明书以及说明书附图中的术语,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其他实施例相结合。为了使本
的人员更好地理解本申请的方案,下面将结合本申请实施例中的相关附图,对本申请实施例中的技术方案进行清楚、完整地描述。如图1所示,系统架构100可以包括第一终端设备101、第二终端设备102、第三终端设备103、网络104和服务器10本文档来自技高网
...

【技术保护点】
1.一种自然语言的语义识别方法,其特征在于,包括:/n接收用户输入的待识别的目标初始数据;/n触发缺省的语义识别指令,并响应于所述语义识别指令调用预设的第一神经网络模型;/n通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据;/n调用预设的第二神经网络模型,通过所述第二神经网络模型对所述第一文本数据进行文本断句处理,以获取包含分词序列标注的第二文本数据;/n调用预设的第三神经网络模型,通过所述第三神经网络模型对所述第二文本数据进行意图识别及实体抽取,以获取所述第二文本数据包含的每种用户意图中相互匹配的目标实体和目标意图。/n

【技术特征摘要】
1.一种自然语言的语义识别方法,其特征在于,包括:
接收用户输入的待识别的目标初始数据;
触发缺省的语义识别指令,并响应于所述语义识别指令调用预设的第一神经网络模型;
通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据;
调用预设的第二神经网络模型,通过所述第二神经网络模型对所述第一文本数据进行文本断句处理,以获取包含分词序列标注的第二文本数据;
调用预设的第三神经网络模型,通过所述第三神经网络模型对所述第二文本数据进行意图识别及实体抽取,以获取所述第二文本数据包含的每种用户意图中相互匹配的目标实体和目标意图。


2.根据权利要求1所述的自然语言的语义识别方法,其特征在于,所述接收用户输入的待识别的目标初始数据的步骤之后,所述方法还包括:
解析所述目标初始数据,标注出其中的非文本数据;
将所述目标初始数据中包含的非文本数据转化为对应的文本数据。


3.根据权利要求1所述的自然语言的语义识别方法,其特征在于,所述通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据的步骤包括:
获取所述目标初始数据对应的拼音序列,并调用数据库中预存的语料库;
将所述拼音序列和所述目标初始数据输入所述第一神经网络模型;
使所述第一神经网络模型根据所述拼音序列在语料库中进行匹配,并将匹配结果与所述目标初始数据进行比对后,输出比对结果中与所述目标初始数据相似度最高的文本数据作为所述第一文本数据。


4.根据权利要求1所述的自然语言的语义识别方法,其特征在于,所述响应于所述语义识别指令调用预设的第一神经网络模型的步骤之前,所述方法还包括:
确认所述目标初始数据所属的目标业务;
获取所述目标业务的真实训练数据;
通过所述真实训练数据对所述第一神经网络模型进行训练;
所述通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据的步骤包括:
获取所述目标初始数据对应的拼音序列;
将所述拼音序列输入所述第一神经网络模型,以通过所述第一神经网络模型输出对应于所述拼音序列的第一文本数据。


...

【专利技术属性】
技术研发人员:陈曾平吴文先闫国伟喻祥
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1