电力用户意图识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：23983665 阅读：52 留言：0更新日期：2020-04-29 12:30

本申请涉及一种电力用户意图识别方法、装置、计算机设备和存储介质。该方法包括：获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据，从多个当前标注数据选出M个数据形成当前支撑集，从多个当前标注数据的剩余数据中选出N个数据形成当前查询集；将当前支撑集和当前查询集输入预先训练好的编码‑归纳‑关系模型，以使编码‑归纳‑关系模型具备区分待识别电力用户意图数据的类别意图的能力；将待识别电力用户意图数据输入到已具备区分待识别电力用户意图数据的类别意图的能力的编码‑归纳‑关系模型，得到待识别电力用户意图数据的意图识别结果。能够在智能助理初始构建阶段，解决“冷启动”问题，提升电力用户意图的识别精度。

Method, device, computer equipment and storage medium of power user intention identification

全部详细技术资料下载

【技术实现步骤摘要】
电力用户意图识别方法、装置、计算机设备和存储介质
本申请电力
，特别是涉及一种电力用户意图识别方法、装置、计算机设备和存储介质。
技术介绍
随着电力行业以及人工智能技术的快速发展，电力企业内部产生了大量文本数据以及需要交互的业务场景，例如，运营管控智能助理等。智能助理(例如，也称为“智能对话助手”，或简称为“助理”)。用户可以基于计算机设备提供的用户接口与智能助理进行聊天、说话或以其他方式的交互以使智能助理响应用户的需求输出相应信息，或以其他方式执行某些操作。智能助理的实现逻辑与聊天机器人相似，但是多了业务处理的流程，智能助理会根据对话管理返回的结果进行相关业务的处理。在业务交互过程中，智能助理系统通过自然语言理解对用户意图进行识别，可以快速定位用户需求，提高流程效率，简化企业信息交互过程，具有巨大的应用价值。自然语言理解是通过语法、语义、语用的分析，获取自然语言的语义表示。用户能通过自然语言与机器引擎进行交互，机器能识别用户表达的语言结构，并转换为机器语言，最后理解这句话的意图并做出反应。自然语言理解的实现过程主要有三个步骤：首先将用户语音转换后的文本进行分词，然后通过文本向量化模型提取文本特征并转化为计算机可以识别的形式，最后通过基于深度学习的神经网络模型对用户的意图进行识别。其中意图识别是自然语言理解中最核心、最复杂的环节。语义表示可以用意图+槽位的方式来描述。意图即这句话所表达的含义，槽位即表达这个意图所需要的具体参数，用slot(槽位)和value(槽位值)对的方式表示，通过将自然语言进行这样...

【技术保护点】
1.一种电力用户意图识别方法，所述方法包括：/n获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据，从所述多个当前标注数据选出M个数据，形成当前支撑集，从所述多个当前标注数据的剩余数据中选出N个数据，形成当前查询集；/n将所述当前支撑集和所述当前查询集输入预先训练好的编码-归纳-关系模型，以使所述编码-归纳-关系模型具备区分所述待识别电力用户意图数据的类别意图的能力；/n将所述待识别电力用户意图数据，输入到已具备区分所述待识别电力用户意图数据的类别意图的能力的编码-归纳-关系模型，得到所述待识别电力用户意图数据的意图识别结果。/n

【技术特征摘要】
1.一种电力用户意图识别方法，所述方法包括：
获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据，从所述多个当前标注数据选出M个数据，形成当前支撑集，从所述多个当前标注数据的剩余数据中选出N个数据，形成当前查询集；
将所述当前支撑集和所述当前查询集输入预先训练好的编码-归纳-关系模型，以使所述编码-归纳-关系模型具备区分所述待识别电力用户意图数据的类别意图的能力；
将所述待识别电力用户意图数据，输入到已具备区分所述待识别电力用户意图数据的类别意图的能力的编码-归纳-关系模型，得到所述待识别电力用户意图数据的意图识别结果。

2.根据权利要求1所述的方法，其特征在于，所述获取智能助理的与待识别电力用户意图数据相同类别的多个当前标注数据，包括：
从所述智能助理对应的信息域运营管理系统的系统日志中，获取与待识别电力用户意图数据相同类别的多个当前电力用户对话数据；
分别根据各当前电力用户对话数据的电力用户意图进行对应的当前电力用户对话数据的意图标注，得到所述多个当前标注数据。

3.根据权利要求1或2所述的方法，其特征在于，所述编码-归纳-关系模型的训练过程包括：
从所述智能助理对应的信息域运营管理系统的系统日志获取电力用户对话数据，根据所述电力用户对话数据获得包括多个类别的样本的样本集；
从所述样本集中的样本划分出训练集；
在所述训练集随机抽取C个类别，且每个类别随机抽取K个样本，构成本轮训练支撑集；
在所述训练集的所述C个类别的剩余样本中随机抽取多个样本，构成本轮训练查询集；
将所述本轮训练支撑集的样本输入到编码-归纳-关系模型，通过最小化本轮训练查询集的损失更新所述编码-归纳-关系模型的模型参数；
在本轮训练结束时，若所述本轮训练查询集的损失未满足最小化条件，返回在所述训练集随机抽取C个类别，且每个类别随机抽取K个样本，构成本轮训练支撑集的步骤；
在本轮训练结束时，若所述本轮训练查询集的损失满足所述最小化条件，将本轮训练得到的编码-归纳-关系模型作为训练好的编码-归纳-关系模型。

4.根据权利要求3所述的方法，其特征在于，所述编码-归纳-关系模型包括编码模块、归纳模块和关系模块；
所述编码模块用于提取输入样本的语义特征，得到样本语义向量；优选地，所述编码模块采用基于注意力机制的LSTM模型；
所述归纳模块用于从各轮训练的支撑集的样本语义向量中归纳出类别特征，得到类向量；优选地，所述归纳模块采用胶囊网络动态表征所述类向量，通过动态路由算法获得同一类别下的不同样本对所述类向量的贡献；
所述关系模块用于度量各轮训练的查询集和所述类向量的语义关系。

5.根据权利要求3所述的方法，其特征在于，所述编码-归纳-关系模型的训练过程还包括：
从所述样本集中的样本划分出测试集，所述测试集和所述训练集没有交集；
用所述测试集对所述训练好的编码-归纳-关系模型进行测试，获得测试结果；
若所述测试结果不满足测试成功条件，输出提示信息。

6.根...

【专利技术属性】
技术研发人员：吴石松，董召杰，吴丹，
申请(专利权)人：中国南方电网有限责任公司，南方电网数字电网研究院有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人