一种基于数字员工的智能交互方法、装置及存储介质制造方法及图纸

技术编号:39430907 阅读:12 留言:0更新日期:2023-11-19 16:15
本公开是一种基于数字员工的智能交互方法,方法包括:数字员工获取用户发送的用户输入数据,根据用户输入数据的数据类型,得到用户输入数据的第一数据类型数据和/或第二数据类型数据;基于第一数据类型数据和/或第二数据类型数据,得到第一数据类型数据和/或第二数据类型数据对应的目标文本数据;构建用户的初始用户画像;将目标文本数据输入至目标OCIR模型中得到用户意图文本数据;基于初始用户画像和用户意图文本数据,得到目标候选指令集;输出目标候选指令集,获取和执行用户确认的目标指令并输出执行结果,以完成数字员工与用户的交互过程。本公开确保目标候选指令集准确反映用户意图,使得数字员工为用户提供精准的服务,提高了用户体验。提高了用户体验。提高了用户体验。

【技术实现步骤摘要】
一种基于数字员工的智能交互方法、装置及存储介质


[0001]本公开涉及意图识别
,尤其涉及一种基于数字员工的智能交互方法、装置及存储介质。

技术介绍

[0002]RPA(Robotic Process Automation,机器人流程自动化)技术是在人工智能和自动化技术的基础上,依据预先录制的脚本与现有用户系统进行交互并完成预期任务的技术。其中,RPA可以用于进行重复性高且无需人工决策的固定性流程化操作(例如对设置好的问题进行回答)。但是,在利用RPA机器人进行实际交互时,需要根据用户的输入数据得到用户意图,进而根据用户意图为用户提供服务。
[0003]相关技术中,可以通过以下方法得到用户意图,并根据用户意图为用户提供服务。
[0004]方法一:直接将用户发送的搜索请求的内容作为用户搜索意图,继而提取意图关键词,再利用知识图谱根据意图关键词为用户反馈待推荐文本;
[0005]方法二:将用户输入的财务类提问信息转换为纯文本,提取关键词,再结合用户身份信息和用户输入的财务类提问信息的背景语料选择意图分析模型,利用余弦相似度分析用户意图,然后通过答疑模型利用预存财务数据知识图谱得到用户财务类答案。
[0006]但是,上述方法一中用户输入的内容可能比较丰富,若直接将搜索请求作为用户搜索意图,可能导致用户搜索意图的精度较低,从而使得待推荐文本可能不是用户真正需要的,用户体验较差;上述方法二中利用余弦相似度分析用户意图时,可能会出现两个词的相似度很高但存在不相同的含义的情况,从而难以保证得到用户意图的准确性,进而无法为用户提供精准的服务,用户体验较差。

技术实现思路

[0007]为克服相关技术中存在的问题,本公开提供一种基于数字员工的智能交互方法、装置、电子设备及计算机可读存储介质。
[0008]根据本公开实施例的第一方面,提供一种基于数字员工的智能交互方法,所述方法包括:
[0009]数字员工获取用户发送的用户输入数据,并根据所述用户输入数据的数据类型,得到所述用户输入数据的第一数据类型数据和/或第二数据类型数据;
[0010]基于所述第一数据类型数据和/或第二数据类型数据,通过数据类型对应的数据处理方法得到所述第一数据类型数据和/或第二数据类型数据对应的目标文本数据;
[0011]构建所述用户的初始用户画像;
[0012]将所述目标文本数据输入至目标OCIR模型中进行用户意图分析,得到用户意图文本数据;
[0013]基于所述初始用户画像和所述用户意图文本数据,得到目标候选指令集;
[0014]输出所述目标候选指令集,获取和执行所述用户确认的目标指令并输出执行结
果,以完成数字员工与用户的交互过程。
[0015]可选的,在本公开实施例中,所述基于所述第一数据类型数据和/或第二数据类型数据,通过数据类型对应的数据处理方法得到所述第一数据类型数据和/或第二数据类型数据对应的目标文本数据,包括:
[0016]基于所述第一数据类型数据,提取所述第一数据类型数据中的关键字,得到所述第一数据类型对应的目标文本数据;
[0017]基于所述第二数据类型数据,对所述第二数据类型数据进行预处理得到处理后的第二数据类型数据,并将所述处理后的第二数据类型数据输入至目标OCIR模型中进行关键字提取,得到所述第二数据类型对应的目标文本数据。
[0018]可选的,在本公开实施例中,所述目标OCIR模型,包括:文本提取层和意图识别层,所述文本提取层包括第一数据处理层、特征提取层、特征映射层、特征聚合层、数据矫正层,所述特征提取层中包括N层卷积层,所述意图识别层包括第二数据处理层、多头注意力层、第三数据处理层。
[0019]可选的,在本公开实施例中,所述将所述处理后的第二数据类型数据输入至目标OCIR模型中进行关键字提取,得到所述第二数据类型对应的目标文本数据包括将所述处理后的第二数据类型数据输入至目标OCIR模型中,利用所述文本提取层进行关键字提取,得到所述第二数据类型对应的目标文本数据;
[0020]所述将所述处理后的第二数据类型数据输入至目标OCIR模型中,利用所述文本提取层进行关键字提取,得到所述第二数据类型对应的目标文本数据,包括:
[0021]利用所述第一数据处理层将所述处理后的第二数据类型数据进行数值化处理,得到图片数据;
[0022]利用所述特征提取层中的N层卷积层提取所述图片数据中的图像字符特征,得到每层卷积层对应的图片字符特征集合;
[0023]利用所述特征映射层对所述每层卷积层对应的图片字符特征集合进行特征识别,得到每层卷积层对应的最大图片字符特征;
[0024]利用所述特征聚合层将所述每层卷积层对应的最大图片字符特征进行特征融合,并对特征融合后的图片特征进行文本提取,得到图片文本;
[0025]利用所述数据矫正层将所述图片文本进行矫正处理,得到所述第二数据类型对应的目标文本数据。
[0026]可选的,在本公开实施例中,所述利用所述数据矫正层将所述图片文本进行矫正处理,得到所述第二数据类型对应的目标文本数据,包括:
[0027]根据预设分词算法对所述图片文本进行分词处理,得到分词结果;
[0028]根据预设停用词库对所述分词结果进行去停用词处理和提取关键字处理,得到关键字序列;
[0029]将所述关键字序列中关键字与预设专业词库进行匹配,以对所述关键字序列中关键字进行矫正,得到所述第二数据类型对应的目标文本数据。
[0030]可选的,在本公开实施例中,所述将所述目标文本数据输入至目标OCIR模型进行用户意图分析,得到用户意图文本数据之前,所述方法还包括:
[0031]确定所述目标文本数据中关键字的数量;
[0032]若所述关键字的数量小于或等于第一阈值,所述数字员工执行所述目标文本数据对应的目标指令,并输出执行结果;
[0033]若所述关键字的数量大于第一阈值,将所述目标文本数据输入至目标OCIR模型进行用户意图分析,得到用户意图文本数据。
[0034]可选的,在本公开实施例中,所述将所述目标文本数据输入至目标OCIR模型中进行用户意图分析,得到用户意图文本数据包括将所述目标文本数据输入至目标OCIR模型中,利用所述意图识别层进行用户意图分析,得到用户意图文本数据;
[0035]所述将所述目标文本数据输入至目标OCIR模型中,利用所述意图识别层进行用户意图分析,得到用户意图文本数据,包括:
[0036]利用所述第二数据处理层将所述目标文本数据进行向量化处理,得到文本矩阵;
[0037]利用所述多头注意力层对所述文本矩阵进行意图识别,得到意图特征集合;
[0038]利用所述第三数据处理层将所述意图特征集合中意图特征与语料库进行比较,得到用户意图文本数据。
[0039]可选的,在本公开实施例中,所述基于所述初始用户画像和所述用户意图文本数据,得到目标候选指令集,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数字员工的智能交互方法,其特征在于,所述方法包括:数字员工获取用户发送的用户输入数据,并根据所述用户输入数据的数据类型,得到所述用户输入数据的第一数据类型数据和/或第二数据类型数据;基于所述第一数据类型数据和/或第二数据类型数据,通过数据类型对应的数据处理方法得到所述第一数据类型数据和/或第二数据类型数据对应的目标文本数据;构建所述用户的初始用户画像;将所述目标文本数据输入至目标光学字符意图识别OCIR模型中进行用户意图分析,得到用户意图文本数据;基于所述初始用户画像和所述用户意图文本数据,得到目标候选指令集;输出所述目标候选指令集,获取和执行所述用户确认的目标指令并输出执行结果,以完成数字员工与用户的交互过程。2.如权利要求1所述的方法,其特征在于,所述基于所述第一数据类型数据和/或第二数据类型数据,通过数据类型对应的数据处理方法得到所述第一数据类型数据和/或第二数据类型数据对应的目标文本数据,包括:基于所述第一数据类型数据,提取所述第一数据类型数据中的关键字,得到所述第一数据类型对应的目标文本数据;基于所述第二数据类型数据,对所述第二数据类型数据进行预处理得到处理后的第二数据类型数据,并将所述处理后的第二数据类型数据输入至目标OCIR模型中进行关键字提取,得到所述第二数据类型对应的目标文本数据。3.如权利要求1或2所述的方法,其特征在于,所述目标OCIR模型,包括:文本提取层和意图识别层,所述文本提取层包括第一数据处理层、特征提取层、特征映射层、特征聚合层、数据矫正层,所述特征提取层中包括N层卷积层,所述意图识别层包括第二数据处理层、多头注意力层、第三数据处理层。4.如权利要求3所述的方法,其特征在于,所述将所述处理后的第二数据类型数据输入至目标OCIR模型中进行关键字提取,得到所述第二数据类型对应的目标文本数据包括将所述处理后的第二数据类型数据输入至目标OCIR模型中,利用所述文本提取层进行关键字提取,得到所述第二数据类型对应的目标文本数据;所述将所述处理后的第二数据类型数据输入至目标OCIR模型中,利用所述文本提取层进行关键字提取,得到所述第二数据类型对应的目标文本数据,包括:利用所述第一数据处理层将所述处理后的第二数据类型数据进行数值化处理,得到图片数据;利用所述特征提取层中的N层卷积层提取所述图片数据中的图像字符特征,得到每层卷积层对应的图片字符特征集合;利用所述特征映射层对所述每层卷积层对应的图片字符特征集合进行特征识别,得到每层卷积层对应的最大图片字符特征;利用所述特征聚合层将所述每层卷积层对应的最大图片字符特征进行特征融合,并对特征融合后的图片特征进行文本提取,得到图片文本;利用所述数据矫正层将所述图片文本进行矫正处理,得到所述第二数据类型对应的目标文本数据。
5.如权利要求4所述的方法,其特征在于,所述利用所述数据矫正层将所述图片文本进行矫正处理,得到所述第二数据类型对应的目标文本数据,包括:根据预设分词算法对所述图片文本进行分词处理,得到分词结果;根据预设停用词库对所述分词结果进行去停用词处理和提取关键字处理,得到关键字序列;将所述关键字序列中关键字与预设专业词库进行匹配,以对所述关键字序列中关键字进行矫正,得到所述第二数据类型对应的目标文本数据。6.如权利要求1所述的方法,其特征在于,所述将所述目标文本数据输入至目标OCIR模型进行用户意图分析,得到用户意图文本数据之前,所述方法还包括:确定所述目标文本数据中关...

【专利技术属性】
技术研发人员:吴宇明
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1