【技术实现步骤摘要】
工单描述信息的生成方法、装置、电子设备及存储介质
本申请涉及摘要生成领域,尤其涉及工单描述信息的生成方法、装置、电子设备及存储介质。
技术介绍
由于工单文档中包含的信息量较大,通常,需要对工单文档中的信息进行提炼,以生成工单描述信息。工单描述信息要求简洁明了,且概括了工单文档中的所有信息。目前,工单描述信息大多是通过人工对工单文档中的信息进行提炼而生成的,但是,信息提炼本身就是一件较为困难的工作,大量重复的提炼工作会大大增加人工的复杂度,因此,通过人工进行提炼,不但会花费大量的时间,而且效率低下,且容易发生错误。
技术实现思路
有鉴于此,本申请实施例至少提供工单描述信息的生成方法、装置、电子设备及存储介质,可以提高生成工单描述信息的效率和准确率。本申请主要包括以下几个方面:第一方面,本申请实施例提供一种工单描述信息的生成方法,所述生成方法包括:获取目标工单文档,并确定所述目标工单文档中包含的多个语句;将所述多个语句输入训练好的双向神经网络中,生成每个语句对应的语句向 ...
【技术保护点】
1.一种工单描述信息的生成方法,其特征在于,所述生成方法包括:/n获取目标工单文档,并确定所述目标工单文档中包含的多个语句;/n将所述多个语句输入训练好的双向神经网络中,生成每个语句对应的语句向量;每个语句向量用于表征对应的语句在所述目标工单文档中的上下文信息;/n根据各个语句对应的语句向量,从所述目标工单文档中包含的所述多个语句中,选取关键语句;/n根据所述关键语句和训练好的编解码网络,生成所述目标工单文档的工单描述信息。/n
【技术特征摘要】
1.一种工单描述信息的生成方法,其特征在于,所述生成方法包括:
获取目标工单文档,并确定所述目标工单文档中包含的多个语句;
将所述多个语句输入训练好的双向神经网络中,生成每个语句对应的语句向量;每个语句向量用于表征对应的语句在所述目标工单文档中的上下文信息;
根据各个语句对应的语句向量,从所述目标工单文档中包含的所述多个语句中,选取关键语句;
根据所述关键语句和训练好的编解码网络,生成所述目标工单文档的工单描述信息。
2.根据权利要求1所述的生成方法,其特征在于,所述双向神经网络包括正向神经网络和反向神经网络;所述将所述多个语句输入训练好的双向神经网络中,生成每个语句对应的语句向量,包括:
将所述多个语句输入训练好的所述正向神经网络中,得到每个语句对应的正向向量,以及将所述多个语句输入训练好的所述反向神经网络,得到每个语句对应的反向向量;所述正向向量用于表征对应的语句在所述目标工单文档中的上文信息;所述反向向量用于表征对应的语句在所述目标工单文档中的下文信息;
将每个语句对应的所述正向向量和所述反向向量进行合并,生成每个语句对应的所述语句向量。
3.根据权利要求1所述的生成方法,其特征在于,所述根据各个语句对应的语句向量,从所述目标工单文档中包含的所述多个语句中,选取关键语句,包括:
针对所述多个语句中的每个语句,将每个语句对应的语句向量输入训练好的二分类网络中,确定每个语句在所述目标工单文档中的重要概率;
根据各个语句在所述目标工单文档中的重要概率,从所述目标工单文档中包含的所述多个语句中,选取关键语句。
4.根据权利要求1所述的生成方法,其特征在于,所述根据所述关键语句和训练好的编解码网络,生成所述目标工单文档的工单描述信息,包括:
将所述关键语句包含的字词输入训练好的所述编解码网络,生成字词序列;
根据所述字词序列,生成所述目标工单文档的所述工单描述信息。
5.根据权利要求4所述的生成方法,其特征在于,所述编解码网络包括编码网络和解码网络;所述将所述关键语句包含的字词输入训练好的编解码网络,生成字词序列,包括:
将所述关键语句包含的字词输入训练好的所述编码网络,生成编码向量;
将所述编码向量输入训练好的所述解码网络,生成所述字词序列。
6.根据权利要求1所述的生成方法,其特征在于,在所述获取目标工单文档,并确定所述目标工单文档中包含的多个语句之前,所述生成方法还包括:
对初始的工单描述信息生成模型进行训练,得到训练好的所述工单描述信息生成模型;
其中,所述工单描述信息生成模型包括一个所述双向神经网络和多个所述编解码网络;不同的所述编解码网络用于处理不同领域的工单文档。
7.根据权利要求6所述的生成方法,其特征在于,所述对初始的工单描述信息生成模型进行训练,得到训练好的所述工单描述信息生成模型,包括:
获取各个领域的工单样本文档,以及每个工单样本文档对应的第一样本描述;
根据各个领域的工单样本文档,以及...
【专利技术属性】
技术研发人员:宋振秋,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。