【技术实现步骤摘要】
智能助理的语料构建方法、装置、计算机设备和存储介质
本申请涉及电力
,特别是涉及一种智能助理的语料构建方法、装置、计算机设备和存储介质。
技术介绍
随着电力行业以及人工智能技术的快速发展,越来越多的电力业务开始使用智能助理(例如,也称为“智能对话助手”,或简称为“助理”)。用户可以基于计算机设备提供的用户接口与智能助理进行聊天、说话或以其他方式的交互以使智能助理响应用户的需求输出相应信息,或以其他方式执行某些操作。智能助理的实现逻辑与聊天机器人相似,但是多了业务处理的流程,智能助理会根据对话管理返回的结果进行相关业务的处理。智能助理作为人工智能领域的一个重要分支,得到了越来越广泛的关注和应用。智能助理通过自然语言理解和问答系统与用户进行交互,其中,原始语料库的采集和构建对于智能助理的响应准确度和功能涵盖程度都是至关重要的。目前的智能助理语料数据主要以人工采集标注或基于模板的方式进行构建,不但构建语料库的周期较长,而且也较难适用于相应的应用场景。
技术实现思路
基于此,有必要针对上述技术问题, ...
【技术保护点】
1.一种智能助理的语料构建方法,所述方法包括:/n从待构建语料的智能助理对应的电力运营管理系统的系统日志中提取当前问答文本数据;/n对所述当前问答文本数据进行文本向量化操作,得到当前问答文本向量;/n将所述当前问答文本向量输入到语料构建模型,所述语料构建模型根据从所述系统日志中提取的问答文本数据训练得到;/n根据所述语料构建模型的输出结果获得问题文本和答案文本,将得到的所述问题文本和所述答案文本关联,关联后的所述问题文本和所述答案文本作为智能助理的问答语料数据。/n
【技术特征摘要】
1.一种智能助理的语料构建方法,所述方法包括:
从待构建语料的智能助理对应的电力运营管理系统的系统日志中提取当前问答文本数据;
对所述当前问答文本数据进行文本向量化操作,得到当前问答文本向量;
将所述当前问答文本向量输入到语料构建模型,所述语料构建模型根据从所述系统日志中提取的问答文本数据训练得到;
根据所述语料构建模型的输出结果获得问题文本和答案文本,将得到的所述问题文本和所述答案文本关联,关联后的所述问题文本和所述答案文本作为智能助理的问答语料数据。
2.根据权利要求1所述的方法,其特征在于,所述语料构建模型的训练过程包括:
从所述系统日志中提取问答文本数据,从所述问答文本数据中划分出训练样本集,所述训练样本集包括多个第一问答文本数据;
将所述多个第一问答文本数据进行文本向量化操作,得到第一问答文本向量;
构建对抗网络,所述对抗网络包括生成器模型和所述判别器模型;所述生成器模型用于根据所述第一问答文本向量生成第一问题文本向量以及所述第一问答文本向量对应的第一答案文本向量;所述判别器模型用于对所述第一问答文本以及所述第一答案文本向量的真实性进行判别;
进行基于生成对抗网络的训练,得到所述语料构建模型。
3.根据权利要求2所述的方法,其特征在于,所述进行基于生成对抗网络的训练,得到语料构建模型,包括:
获取默认真实样本集,所述默认真实样本集包括默认真实问题文本和所述默认真实问题文本对应的默认真实答案文本;
将所述默认真实问题文本和所述默认真实答案文本进行文本向量化操作,得到第二问题文本向量和所述第二问题文本向量对应的第二答案文本向量;
通过所述第一问题文本向量、所述第一答案文本向量、所述第二问题文本向量以及所述第二答案文本向量训练所述对抗网络,所述判别器模型用于输出第一概率和第二概率,所述第一概率为判定输入样本来自于所述第一问题文本向量以及所述第一答案文本向量的概率,所述第二概率为判定输入样本来自于所述第二问题文本向量以及第二答案文本向量的概率,所述对抗网络的目标函数用于对所述对抗网络的网络参数进行优化,以使得最小化所述第一概率的目标函数与最大化所述第二概率的目标函数互相博弈达到平衡;
根据训练完成的对抗网络,得到语料构建模型。
4.根据权利要3所述的方法,其特征在于,根据训练完成的对抗网络,得到语料构建模型,包括:
从所述问答文本数据中划分出测试样本集,所述测试样本集包括多个第二问答文本数...
【专利技术属性】
技术研发人员:林志达,吴石松,吴丹,
申请(专利权)人:中国南方电网有限责任公司,南方电网数字电网研究院有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。