工作日志的生成方法、装置、存储介质及电子设备制造方法及图纸

技术编号：38552572 阅读：6 留言：0更新日期：2023-08-22 20:58

本发明专利技术公开了一种工作日志的生成方法、装置、存储介质及电子设备，涉及分布式技术领域。该方法包括：获取目标对象的输入信息；判断输入信息中是否存在热门词汇，若输入信息中存在热门词汇，则根据目标权重对热门词汇进行惩罚处理，得到目标输入信息；通过目标主题模型，确定目标输入信息对应的目标主题；确定目标主题对应的目标文本生成模型和目标序列到序列模型，并根据目标输入信息、目标文本生成模型以及目标序列到序列模型，生成目标工作日志，其中，目标文本生成模型和目标序列到序列模型是分别通过混合训练得到的，混合训练包括数据分布式训练和模型分布式训练。本发明专利技术解决了现有技术中人工整理工作日志存在效率低的技术问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
工作日志的生成方法、装置、存储介质及电子设备

[0001]本专利技术涉及分布式
，具体而言，涉及一种工作日志的生成方法、装置、存储介质及电子设备。

技术介绍

[0002]工作日志是指工作人员对自己每天工作内容、在工作过程中遇到的问题、解决问题的思路和方法进行记录的工具。目前，金融机构的业务场景正以小快灵的方式快速发展，工作场景变得越发复杂，与此对应的是工作人员处理的任务变得多、小、细，个人的时间越发碎片化。目前，人工整理工作日志存在效率比较低的问题，增加了工作人员的工作时间，并且，工作人员日常整理的工作日志往往过于流水化，日志内容较为琐碎、没有重点，起不到日后工作汇报或工作交接的作用。
[0003]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种工作日志的生成方法、装置、存储介质及电子设备，以至少解决现有技术中人工整理工作日志存在效率低的技术问题。
[0005]根据本专利技术实施例的一个方面，提供了一种工作日志的生成方法，包括：获取目标对象的输入信息，其中，输入信息表征待生成工作日志的需求数据信息；判断输入信息中是否存在热门词汇，若输入信息中存在热门词汇，则根据目标权重对热门词汇进行惩罚处理，得到目标输入信息，其中，热门词汇为样本数据中出现频率高于目标频率的词汇；通过目标主题模型，确定目标输入信息对应的目标主题，其中，目标主题模型是根据样本数据训练得到的；确定目标主题对应的目标文本生成模型和目标序列到序列模型，并根据目标输入信息、...

【技术保护点】

【技术特征摘要】
1.一种工作日志的生成方法，其特征在于，包括：获取目标对象的输入信息，其中，所述输入信息表征待生成工作日志的需求数据信息；判断所述输入信息中是否存在热门词汇，若所述输入信息中存在所述热门词汇，则根据目标权重对所述热门词汇进行惩罚处理，得到目标输入信息，其中，所述热门词汇为样本数据中出现频率高于目标频率的词汇；通过目标主题模型，确定所述目标输入信息对应的目标主题，其中，所述目标主题模型是根据所述样本数据训练得到的；确定所述目标主题对应的目标文本生成模型和目标序列到序列模型，并根据所述目标输入信息、所述目标文本生成模型以及所述目标序列到序列模型，生成目标工作日志，其中，所述目标文本生成模型和所述目标序列到序列模型是分别通过混合训练得到的，所述混合训练包括数据分布式训练和模型分布式训练。2.根据权利要求1所述的方法，其特征在于，在获取目标对象的输入信息之前，所述方法还包括：通过网络爬虫从网络资源中获取文本语料信息；对所述文本语料信息进行数据清洗，得到清洗后的文本语料信息，并根据所述清洗后的文本语料信息，生成原始语料库，其中，所述原始语料库中至少包括所述样本数据；获取所述原始语料库中的多篇文档，并根据所述目标主题模型和多个预设主题词，确定每篇文档的主题；根据所述每篇文档的主题对所述多篇文档进行分类处理，得到M个文档集合，其中，每个文档集合对应一个主题，所述M个文档集合分别存储于不同服务集群，M为正整数；通过所述M个文档集合中的文档数据，混合训练得到M个文本生成模型和M个序列到序列模型，其中，每个主题对应一个文本生成模型和一个序列到序列模型。3.根据权利要求2所述的方法，其特征在于，通过所述M个文档集合中的文档数据，混合训练得到M个文本生成模型和M个序列到序列模型，包括：根据每个服务集群对应的主题和所述每个服务集群中的文档数据，训练得到所述每个主题对应的文本生成模型和序列到序列模型；根据所述每个主题对应的文本生成模型和序列到序列模型，得到所述M个文本生成模型和所述M个序列到序列模型。4.根据权利要求1所述的方法，其特征在于，判断所述输入信息中是否存在热门词汇，包括：提取所述输入信息中的至少一个关键词，并将所述至少一个关键词与热门词汇清单进行匹配，得到匹配结果，其中，所述匹配结果表征所述至少一个关键词是否为所述热门词汇清单中的热门词汇，所述热门词汇清单是在通过所述样本数据训练所述目标主题模型的过程中生成的。5.根据权利要求1所述的方法，其特征在于，通过目标主题模型，确定所述目...

【专利技术属性】
技术研发人员：章宗杰，余振，吴政楠，殷富成，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人