【技术实现步骤摘要】
自然语言的语义识别方法、装置、设备及存储介质
本申请涉及计算机信息处理
,特别是一种自然语言的语义识别方法、装置、设备及存储介质。
技术介绍
近年来,随着计算机运算能力的提高和人工智能核心算法的突破性发展,人工智能领域进展迅速。而自然语言处理被誉为“人工智能皇冠上的明珠,是计算机科学领域与人工智能领域中的一个重要方向,有着广阔的应用空间。自然语言处理是计算机科学、语言学和机器学习的交叉点,它关注计算机与人类之间使用自然语言中的沟通交流,致力于让计算机能够理解和生成人类语言。自然语言处理技术主要应用于机器翻译、智能问答、语音助手和文本过滤等多方面,已经开始对各行各业产生巨大的影响。金融业务领域存在较多的文本阅读和客户问答场景,且与数据有高度相关性,成为自然语言处理最先应用的行业之一。现有智能问答中自然语言理解方法多为系统按顺序对用户自然语言输入进行意图分类、实体抽取,再通过业务逻辑返回自然语言理解结果。而在实际应用场景中,经常存在用户输入存在错别字、语音识别不准确、业务专有词汇不断增加、一句话内存在无标点区分的多意图等等问题,使问答系统产生错误,无法实现客户需求。
技术实现思路
本申请实施例所要解决的技术问题是,提供一种自然语言的语义识别方法、装置、设备及存储介质,提升模型对语义识别的适应能力,并提高多意图区分和实体抽取的效率及准确性。为了解决上述技术问题,本申请实施例提供一种自然语言的语义识别方法,采用了如下所述的技术方案:一种自然语言的语义识别方法,包括:< ...
【技术保护点】
1.一种自然语言的语义识别方法,其特征在于,包括:/n接收用户输入的待识别的目标初始数据;/n触发缺省的语义识别指令,并响应于所述语义识别指令调用预设的第一神经网络模型;/n通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据;/n调用预设的第二神经网络模型,通过所述第二神经网络模型对所述第一文本数据进行文本断句处理,以获取包含分词序列标注的第二文本数据;/n调用预设的第三神经网络模型,通过所述第三神经网络模型对所述第二文本数据进行意图识别及实体抽取,以获取所述第二文本数据包含的每种用户意图中相互匹配的目标实体和目标意图。/n
【技术特征摘要】
1.一种自然语言的语义识别方法,其特征在于,包括:
接收用户输入的待识别的目标初始数据;
触发缺省的语义识别指令,并响应于所述语义识别指令调用预设的第一神经网络模型;
通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据;
调用预设的第二神经网络模型,通过所述第二神经网络模型对所述第一文本数据进行文本断句处理,以获取包含分词序列标注的第二文本数据;
调用预设的第三神经网络模型,通过所述第三神经网络模型对所述第二文本数据进行意图识别及实体抽取,以获取所述第二文本数据包含的每种用户意图中相互匹配的目标实体和目标意图。
2.根据权利要求1所述的自然语言的语义识别方法,其特征在于,所述接收用户输入的待识别的目标初始数据的步骤之后,所述方法还包括:
解析所述目标初始数据,标注出其中的非文本数据;
将所述目标初始数据中包含的非文本数据转化为对应的文本数据。
3.根据权利要求1所述的自然语言的语义识别方法,其特征在于,所述通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据的步骤包括:
获取所述目标初始数据对应的拼音序列,并调用数据库中预存的语料库;
将所述拼音序列和所述目标初始数据输入所述第一神经网络模型;
使所述第一神经网络模型根据所述拼音序列在语料库中进行匹配,并将匹配结果与所述目标初始数据进行比对后,输出比对结果中与所述目标初始数据相似度最高的文本数据作为所述第一文本数据。
4.根据权利要求1所述的自然语言的语义识别方法,其特征在于,所述响应于所述语义识别指令调用预设的第一神经网络模型的步骤之前,所述方法还包括:
确认所述目标初始数据所属的目标业务;
获取所述目标业务的真实训练数据;
通过所述真实训练数据对所述第一神经网络模型进行训练;
所述通过所述第一神经网络模型对所述目标初始数据进行数据纠错处理,以获取对应于所述目标初始数据的第一文本数据的步骤包括:
获取所述目标初始数据对应的拼音序列;
将所述拼音序列输入所述第一神经网络模型,以通过所述第一神经网络模型输出对应于所述拼音序列的第一文本数据。
...
【专利技术属性】
技术研发人员:陈曾平,吴文先,闫国伟,喻祥,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。