文档处理方法和文档处理装置制造方法及图纸

技术编号:39827110 阅读:22 留言:0更新日期:2023-12-29 16:02
本公开提供了一种文档处理方法和文档处理装置

【技术实现步骤摘要】
文档处理方法和文档处理装置


[0001]本公开涉及数据处理领域和大语言模型领域,尤其涉及一种文档处理方法和文档处理装置


技术介绍

[0002]根据文档内容生成文档的标签是文档管理工具的必备功能之一,企业和用户能够根据文档的标签高效地进行文档筛选与管理

因此,文档标签的准确程度是影响文档管理效率的重要因素


技术实现思路

[0003]本公开的一个方面提供了一种文档处理方法,包括根据待处理文档和多个代表文档,生成提示信息,提示信息表征待处理文档与多个代表文档对应的指定文档标签之间的相关性,多个代表文档包括多个指定文档标签各自对应的至少一个代表文档;以及通过多任务处理模型,基于提示信息,确定待处理文档的目标文档标签

[0004]根据本公开实施例,根据待处理文档和多个代表文档,生成提示信息,包括:分别确定待处理文档与多个代表文档的多个文档相似度;根据多个文档相似度,从多个指定文档标签中确定至少一个与待处理文档满足相似度条件的初始文档标签;以及根据至少一个初始文档标签和至少一个本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种文档处理方法,包括:根据待处理文档和多个代表文档,生成提示信息,所述提示信息表征所述待处理文档与多个所述代表文档对应的指定文档标签之间的相关性,多个所述代表文档包括多个所述指定文档标签各自对应的至少一个代表文档;以及通过多任务处理模型,基于所述提示信息,确定所述待处理文档的目标文档标签
。2.
根据权利要求1所述的方法,其中,所述根据待处理文档和多个代表文档,生成提示信息,包括:分别确定所述待处理文档与多个所述代表文档的多个文档相似度;根据多个所述文档相似度,从多个所述指定文档标签中确定至少一个与所述待处理文档满足相似度条件的初始文档标签;以及根据至少一个所述初始文档标签和至少一个所述初始文档标签与所述待处理文档的相似度,生成所述提示信息
。3.
根据权利要求2所述的方法,其中,所述根据多个所述文档相似度,从多个所述指定文档标签中确定至少一个与所述待处理文档满足相似度条件的初始文档标签,包括:基于多个所述代表文档与对应的指定文档标签之间的相关性,确定多个所述代表文档的多个代表权重;基于多个所述文档相似度和多个所述代表权重,确定多个所述指定文档标签与所述待处理文档的相似度;以及获得至少一个与所述待处理文档满足相似度条件的初始文档标签
。4.
根据权利要求2所述的方法,其中,所述根据至少一个所述初始文档标签和至少一个所述初始标签与所述待处理文档的相似度,生成所述提示信息,包括:将至少一个所述初始文档标签与所述待处理文档的相似度转换为至少一个概率词;以及根据所述至少一个概率词和所述至少一个初始文档标签,生成所述提示信息
。5.
根据权利要求1所述的方法,其中,所述根据待处理文档和多个代表文档,生成提示信息,包括:获取多个所述代表文档的多个代表文档数据,以及获取所述待处理文档的待处理文档数据,所述代表文档数据表征所述代表文档的文本特征和存储路径特征,所述待处理文档数据表征所述待处理文档的文本特征和存储路径特征;以及根据文本相关性和存储路径相关性,生成所述提示信息,其中,所述文本相关性表征了多个所述代表文档的文本特征与所述待处理文档的文本特征之间的相关性,所述存储路径相关性表征了多个所述代表文档的存储路径特征与所述待处理文档的存储路径特征之间的相关性
。6.
根据权利要求5所述的方法,其中,所述获取所述待处理文档对应的待处理...

【专利技术属性】
技术研发人员:王新宇孙佳
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1