电力用户意图识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:23983665 阅读:52 留言:0更新日期:2020-04-29 12:30
本申请涉及一种电力用户意图识别方法、装置、计算机设备和存储介质。该方法包括:获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据,从多个当前标注数据选出M个数据形成当前支撑集,从多个当前标注数据的剩余数据中选出N个数据形成当前查询集;将当前支撑集和当前查询集输入预先训练好的编码‑归纳‑关系模型,以使编码‑归纳‑关系模型具备区分待识别电力用户意图数据的类别意图的能力;将待识别电力用户意图数据输入到已具备区分待识别电力用户意图数据的类别意图的能力的编码‑归纳‑关系模型,得到待识别电力用户意图数据的意图识别结果。能够在智能助理初始构建阶段,解决“冷启动”问题,提升电力用户意图的识别精度。

Method, device, computer equipment and storage medium of power user intention identification

【技术实现步骤摘要】
电力用户意图识别方法、装置、计算机设备和存储介质
本申请电力
,特别是涉及一种电力用户意图识别方法、装置、计算机设备和存储介质。
技术介绍
随着电力行业以及人工智能技术的快速发展,电力企业内部产生了大量文本数据以及需要交互的业务场景,例如,运营管控智能助理等。智能助理(例如,也称为“智能对话助手”,或简称为“助理”)。用户可以基于计算机设备提供的用户接口与智能助理进行聊天、说话或以其他方式的交互以使智能助理响应用户的需求输出相应信息,或以其他方式执行某些操作。智能助理的实现逻辑与聊天机器人相似,但是多了业务处理的流程,智能助理会根据对话管理返回的结果进行相关业务的处理。在业务交互过程中,智能助理系统通过自然语言理解对用户意图进行识别,可以快速定位用户需求,提高流程效率,简化企业信息交互过程,具有巨大的应用价值。自然语言理解是通过语法、语义、语用的分析,获取自然语言的语义表示。用户能通过自然语言与机器引擎进行交互,机器能识别用户表达的语言结构,并转换为机器语言,最后理解这句话的意图并做出反应。自然语言理解的实现过程主要有三个步骤:首先将用户语音转换后的文本进行分词,然后通过文本向量化模型提取文本特征并转化为计算机可以识别的形式,最后通过基于深度学习的神经网络模型对用户的意图进行识别。其中意图识别是自然语言理解中最核心、最复杂的环节。语义表示可以用意图+槽位的方式来描述。意图即这句话所表达的含义,槽位即表达这个意图所需要的具体参数,用slot(槽位)和value(槽位值)对的方式表示,通过将自然语言进行这样的结构化转换,机器引擎就能准确理解这句话的含义并调用相应的功能。意图识别的准确性对于机器引擎进行人机交互的质量有着决定性的影响。然而,传统的深度学习的神经网络模型进行意图识别,其识别效果依赖于模型训练数据的质量和规模。但电力企业的业务覆盖大、数据类别众多,其智能助理初始构建阶段,会存在比较明显的智能助理的“冷启动”问题,影响电力用户意图的识别精度。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够在智能助理初始构建阶段,提升电力用户意图的识别精度的电力用户意图识别方法、装置、计算机设备和存储介质。一种电力用户意图识别方法,该方法包括:获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据,从多个当前标注数据选出M个数据,形成当前支撑集,从多个当前标注数据的剩余数据中选出N个数据,形成当前查询集;将当前支撑集和当前查询集输入预先训练好的编码-归纳-关系模型,以使编码-归纳-关系模型具备区分待识别电力用户意图数据的类别意图的能力;将待识别电力用户意图数据,输入到已具备区分待识别电力用户意图数据的类别意图的能力的编码-归纳-关系模型,得到待识别电力用户意图数据的意图识别结果。在其中一个实施例中,上述的获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据,包括:从智能助理对应的信息域运营管理系统的系统日志中,获取与待识别电力用户意图数据相同类别的多个当前电力用户对话数据;分别根据各当前电力用户对话数据的电力用户意图进行对应的当前电力用户对话数据的意图标注,得到多个当前标注数据。在其中一个实施例中,上述的编码-归纳-关系模型的训练过程包括:从智能助理对应的信息域运营管理系统的系统日志获取电力用户对话数据,根据电力用户对话数据获得包括多个类别的样本的样本集;从样本集中的样本划分出训练集;在训练集随机抽取C个类别,且每个类别随机抽取K个样本,构成本轮训练支撑集;在训练集的C个类别的剩余样本中随机抽取多个样本,构成本轮训练查询集;将本轮训练支撑集的样本输入到编码-归纳-关系模型,通过最小化本轮训练查询集的损失更新编码-归纳-关系模型的模型参数;在本轮训练结束时,若本轮训练查询集的损失未满足最小化条件,返回在训练集随机抽取C个类别,且每个类别随机抽取K个样本,构成本轮训练支撑集的步骤;在本轮训练结束时,若本轮训练查询集的损失满足最小化条件,将本轮训练得到的编码-归纳-关系模型作为训练好的编码-归纳-关系模型。在其中一个实施例中,上述的编码-归纳-关系模型包括编码模块、归纳模块和关系模块;编码模块用于提取输入样本的语义特征,得到样本语义向量;归纳模块用于从各轮训练的支撑集的样本语义向量中归纳出类别特征,得到类向量;关系模块用于度量各轮训练的查询集和类向量的语义关系。在其中一个实施例中,上述的编码模块采用基于注意力机制的LSTM模型。在其中一个实施例中,上述的归纳模块采用胶囊网络动态表征类向量,通过动态路由算法获得同一类别下的不同样本对类向量的贡献。在其中一个实施例中,上述的编码-归纳-关系模型的训练过程还包括:从样本集中的样本划分出测试集,测试集和训练集没有交集;用测试集对训练好的编码-归纳-关系模型进行测试,获得测试结果;若测试结果不满足测试成功条件,输出提示信息。在其中一个实施例中,上述的编码-归纳-关系模型的训练过程还包括:获取电力用户对话数据的生成时间信息,根据生成时间信息将电力用户对话数据划分为训练集和测试集。在其中一个实施例中,上述的根据生成时间信息将电力用户对话数据划分为训练集和测试集,包括:根据生成时间信息确定起始时刻和终止时刻;将起始时刻和终止时刻之间的目标时段按时间顺序划分为设定数目的子时段;分别将各子时段划分为第一子时段和第二子时段,其中,不同子时段的各第一子时段的时长值均相等,不同子时段的各第二子时段的时长值均相等,或者,不同子时段的第一子时段和第二子时段的比值均相同;将生成时间落入各第一子时段的电力用户对话数据划分到训练集;将生成时间落入各第二子时段的电力用户对话数据划分到测试集。一种电力用户意图识别装置,该装置包括:样本选取模块,用于获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据,从多个当前标注数据选出M个数据,形成当前支撑集,从多个当前标注数据的剩余数据中选出N个数据,形成当前查询集;样本输入模块,用于将当前支撑集和当前查询集输入预先训练好的编码-归纳-关系模型,以使编码-归纳-关系模型具备区分待识别电力用户意图数据的类别意图的能力;识别模块,将待识别电力用户意图数据,输入到已具备区分待识别电力用户意图数据的类别意图的能力的编码-归纳-关系模型,得到待识别电力用户意图数据的意图识别结果。在其中一个实施例中,上述的装置还包括模型训练模块,该模型训练模块包括:样本获取单元,用于从智能助理对应的信息域运营管理系统的系统日志获取电力用户对话数据,根据电力用户对话数据获得包括多个类别的样本的样本集;样本划分单元,用于从样本集中的样本划分出训练集;第一抽取单元,用于在训练集随机抽取C个类别,且每个类别随机抽取K个样本,构成本轮训练支撑集;第二抽取单元,用于在训练集本文档来自技高网
...

【技术保护点】
1.一种电力用户意图识别方法,所述方法包括:/n获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据,从所述多个当前标注数据选出M个数据,形成当前支撑集,从所述多个当前标注数据的剩余数据中选出N个数据,形成当前查询集;/n将所述当前支撑集和所述当前查询集输入预先训练好的编码-归纳-关系模型,以使所述编码-归纳-关系模型具备区分所述待识别电力用户意图数据的类别意图的能力;/n将所述待识别电力用户意图数据,输入到已具备区分所述待识别电力用户意图数据的类别意图的能力的编码-归纳-关系模型,得到所述待识别电力用户意图数据的意图识别结果。/n

【技术特征摘要】
1.一种电力用户意图识别方法,所述方法包括:
获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据,从所述多个当前标注数据选出M个数据,形成当前支撑集,从所述多个当前标注数据的剩余数据中选出N个数据,形成当前查询集;
将所述当前支撑集和所述当前查询集输入预先训练好的编码-归纳-关系模型,以使所述编码-归纳-关系模型具备区分所述待识别电力用户意图数据的类别意图的能力;
将所述待识别电力用户意图数据,输入到已具备区分所述待识别电力用户意图数据的类别意图的能力的编码-归纳-关系模型,得到所述待识别电力用户意图数据的意图识别结果。


2.根据权利要求1所述的方法,其特征在于,所述获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据,包括:
从所述智能助理对应的信息域运营管理系统的系统日志中,获取与待识别电力用户意图数据相同类别的多个当前电力用户对话数据;
分别根据各当前电力用户对话数据的电力用户意图进行对应的当前电力用户对话数据的意图标注,得到所述多个当前标注数据。


3.根据权利要求1或2所述的方法,其特征在于,所述编码-归纳-关系模型的训练过程包括:
从所述智能助理对应的信息域运营管理系统的系统日志获取电力用户对话数据,根据所述电力用户对话数据获得包括多个类别的样本的样本集;
从所述样本集中的样本划分出训练集;
在所述训练集随机抽取C个类别,且每个类别随机抽取K个样本,构成本轮训练支撑集;
在所述训练集的所述C个类别的剩余样本中随机抽取多个样本,构成本轮训练查询集;
将所述本轮训练支撑集的样本输入到编码-归纳-关系模型,通过最小化本轮训练查询集的损失更新所述编码-归纳-关系模型的模型参数;
在本轮训练结束时,若所述本轮训练查询集的损失未满足最小化条件,返回在所述训练集随机抽取C个类别,且每个类别随机抽取K个样本,构成本轮训练支撑集的步骤;
在本轮训练结束时,若所述本轮训练查询集的损失满足所述最小化条件,将本轮训练得到的编码-归纳-关系模型作为训练好的编码-归纳-关系模型。


4.根据权利要求3所述的方法,其特征在于,所述编码-归纳-关系模型包括编码模块、归纳模块和关系模块;
所述编码模块用于提取输入样本的语义特征,得到样本语义向量;优选地,所述编码模块采用基于注意力机制的LSTM模型;
所述归纳模块用于从各轮训练的支撑集的样本语义向量中归纳出类别特征,得到类向量;优选地,所述归纳模块采用胶囊网络动态表征所述类向量,通过动态路由算法获得同一类别下的不同样本对所述类向量的贡献;
所述关系模块用于度量各轮训练的查询集和所述类向量的语义关系。


5.根据权利要求3所述的方法,其特征在于,所述编码-归纳-关系模型的训练过程还包括:
从所述样本集中的样本划分出测试集,所述测试集和所述训练集没有交集;
用所述测试集对所述训练好的编码-归纳-关系模型进行测试,获得测试结果;
若所述测试结果不满足测试成功条件,输出提示信息。


6.根...

【专利技术属性】
技术研发人员:吴石松董召杰吴丹
申请(专利权)人:中国南方电网有限责任公司南方电网数字电网研究院有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1