意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号:38548018 阅读:10 留言:0更新日期:2023-08-22 20:56
本申请提供一种意图识别方法、装置、设备及存储介质,属于人工智能技术领域该方法包括:获取多个样本数据,样本数据包括样本文本信息和标注的实体信息;将一个样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息;根据预测的实体信息和标注的实体信息,确定神经网络模型是否收敛;在神经网络模型未收敛的情况下,更新神经网络模型的模型参数,并继续将样本数据中的样本文本信息输入至预设的神经网络模型中进行训练,直至神经网络模型收敛,得到实体识别模型;获取待识别的文本信息,并将待识别的文本信息输入至实体识别模型中,得到目标实体信息。本申请能够准确地得到目标实体信息,提高了意图识别的准确性和效率。确性和效率。确性和效率。

【技术实现步骤摘要】
意图识别方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种意图识别方法、装置、设备及存储介质。

技术介绍

[0002]随着科技的发展,人工智能技术在各个领域的应用越来越广泛,例如命名实体识别(Named entity recognition,NER)在生活中得到广泛的利用,NER的任务旨在识别出文本中命名实体,并将命名实体分类为给定的类别中,例如人名、地名、时间和事件等,NER能够有效的解决信息过载的问题,在指令生成和机器翻译均有广泛的应用。
[0003]在养老或康养行业,护工每天都要完成大量的护理工作,例如给被服务者翻身,送水、按摩和送药等,当前护理工作通常是通过表单纸质的方式进行任务的下发,在护理工作繁重的情况下,护工调配不及时,将会出现任务信息同步慢和处理不及时的问题,可能造成被服务者需求不能及时满足的问题。
[0004]因此,如何从文本信息中推测出意图信息,以根据意图信息对服务者进行调度是目前亟待解决的问题。

技术实现思路

[0005]本申请的主要目的在于提供一种意图识别方法、装置、设备及存储介质,旨在准确地从文本信息中推测出意图信息。
[0006]第一方面,本申请提供一种意图识别方法,所述意图识别方法包括以下步骤:
[0007]获取多个样本数据,所述样本数据包括样本文本信息和标注的实体信息,所述实体信息中的实体的类别至少包括:姓名、时间、地点和服务;
[0008]将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息;
[0009]根据所述预测的实体信息和所述标注的实体信息,确定所述神经网络模型是否收敛;
[0010]在所述神经网络模型未收敛的情况下,更新所述神经网络模型的模型参数,并继续执行将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息的步骤,直至所述神经网络模型收敛,得到实体识别模型;
[0011]获取待识别的文本信息,并将所述待识别的文本信息输入至所述实体识别模型中,得到目标实体信息,所述目标实体信息的实体的类别至少包括:姓名、时间、地点和服务。
[0012]在一实施例中,所述神经网络模型包括特征输入层、双向长短时神经网络层和CRF层。
[0013]在一实施例中,所述将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息,包括:
[0014]将所述样本文本信息输入至所述特征输入层中,生成文本特征向量,
[0015]将所述文本特征向量输入至所述双向长短时期神经网络层中,生成文本序列向量;
[0016]将所述文本序列向量输入至所述CRF层中,生成预测的实体信息。
[0017]在一实施例中,所述将所述样本文本信息输入至所述特征输入层中,生成文本特征向量,包括:
[0018]将所述样本文本信息输入至预设Word2Vec模型,生成第一文本特征向量;
[0019]获取所述样本文本信息对应的第二文本特征向量,并对所述第一文本特征向量和所述第二文本特征向量进行拼接,生成文本特征向量。
[0020]在一实施例中,所述根据所述预测的实体信息和所述标注的实体信息,确定所述神经网络模型是否收敛,包括:
[0021]根据所述预测的实体信息和所述标注的实体信息,确定所述神经网络模型的损失值;
[0022]在所述损失值小于或等于预设损失值的情况下,确定所述神经网络模型已收敛;
[0023]在所述损失值大于预设损失值的情况下,确定所述神经网络模型未收敛。
[0024]在一实施例中,所述将所述待识别的文本信息输入至所述实体识别模型中,得到目标实体信息之后,还包括:
[0025]根据所述目标实体信息对服务者进行调度。
[0026]在一实施例中,所述获取待识别的文本信息,包括:
[0027]获取待识别的语音数据;
[0028]将所述语音数据输入至预设语音识别模型中,得到所述待识别的文本信息,所述预设语音识别模型为预先训练好的神经网络模型。
[0029]在一实施例中,所述获取待生成任务的语音数据之前,还包括:
[0030]获取多个样本语音数据,所述样本语音数据包括样本语音和标注的文本信息;
[0031]根据多个所述样本语音数据,对预设的神经网络模型进行训练,直至所述神经网络模型收敛,得到语音识别模型。
[0032]第二方面,本申请还提供一种任务信息生成装置,所述任务信息生成装置包括
[0033]获取模块、训练模块、确定模块、更新模块和生成模块,其中:
[0034]所述获取模块,用于获取多个样本数据,所述样本数据包括样本文本信息和标注的实体信息,所述实体信息中的实体的类别至少包括:姓名、时间、地点和服务;
[0035]所述训练模块,用于将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息;
[0036]所述确定模块,用于根据所述预测的实体信息和所述标注的实体信息,确定所述神经网络模型是否收敛;
[0037]所述更新模块,用于在所述神经网络模型未收敛的情况下,更新所述神经网络模型的模型参数;
[0038]所述生成模块,用于继续执行将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息的步骤,直至所述神经网络模型收敛,得到实体识别模型;
[0039]所述获取模块,还用于获取待识别的文本信息;
[0040]所述生成模块,还用于将所述待识别的文本信息输入至所述实体识别模型中,得到目标实体信息,所述目标实体信息的实体的类别至少包括:姓名、时间、地点和服务。
[0041]第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的意图识别方法的步骤。
[0042]第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的意图识别方法的步骤。
[0043]本申请提供一种意图识别方法、装置、设备及存储介质,本申请获取多个样本数据,样本数据包括样本文本信息和标注的实体信息,实体信息中的实体的类别至少包括:姓名、时间、地点和服务;然后将一个样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息;根据预测的实体信息和标注的实体信息,确定所述神经网络模型是否收敛;在神经网络模型未收敛的情况下,更新神经网络模型的模型参数,并继续执行将一个样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息的步骤,直至神经网络模型收敛,得到实体识别模型;获取待识别的文本信息,并将待识别的文本信息输入至实体识别模型中,得到目标实体信息,目标实体信息的实体的类别至少包括:姓名、时间、地点和服务。本方案本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取多个样本数据,所述样本数据包括样本文本信息和标注的实体信息,所述实体信息中的实体的类别至少包括:姓名、时间、地点和服务;将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息;根据所述预测的实体信息和所述标注的实体信息,确定所述神经网络模型是否收敛;在所述神经网络模型未收敛的情况下,更新所述神经网络模型的模型参数,并继续执行将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息的步骤,直至所述神经网络模型收敛,得到实体识别模型;获取待识别的文本信息,并将所述待识别的文本信息输入至所述实体识别模型中,得到目标实体信息,所述目标实体信息的实体的类别至少包括:姓名、时间、地点和服务。2.如权利要求1所述的意图识别方法,其特征在于,所述神经网络模型包括特征输入层、双向长短时神经网络层和CRF层。3.如权利要求2所述的意图识别方法,其特征在于,所述将一个所述样本数据中的样本文本信息输入至预设的神经网络模型中,得到预测的实体信息,包括:将所述样本文本信息输入至所述特征输入层中,生成文本特征向量,将所述文本特征向量输入至所述双向长短时期神经网络层中,生成文本序列向量;将所述文本序列向量输入至所述CRF层中,生成预测的实体信息。4.如权利要求3所述的意图识别方法,其特征在于,所述将所述样本文本信息输入至所述特征输入层中,生成文本特征向量,包括:将所述样本文本信息输入至预设Word2Vec模型,生成第一文本特征向量;获取所述样本文本信息对应的第二文本特征向量,并对所述第一文本特征向量和所述第二文本特征向量进行拼接,生成文本特征向量。5.如权利要求1所述的意图识别方法,其特征在于,所述根据所述预测的实体信息和所述标注的实体信息,确定所述神经网络模型是否收敛,包括:根据所述预测的实体信息和所述标注的实体信息,确定所述神经网络模型的损失值;在所述损失值小于或等于预设损失值的情况下,确定所述神经网络模型已收敛;在所述损失值大于预设损失值的情况下,确定所述神经网络模型未收敛。6.如权利要求1所述的意图识别方法,其特征在于,所述将所述待识别的文本信息输入至所述...

【专利技术属性】
技术研发人员:张孟
申请(专利权)人:深圳开鸿数字产业发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1