公文辅助写作方法及系统技术方案

技术编号:36907623 阅读:71 留言:0更新日期:2023-03-18 09:26
本发明专利技术公开了一种公文辅助写作方法及系统,该方法包括:获取用户的输入文本;确定所述输入文本的向量;利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;将所述推荐下文推送给所述用户。利用本发明专利技术,可以更好地辅助用户完成公文的写作,提升工作效率及写作质量。提升工作效率及写作质量。提升工作效率及写作质量。

【技术实现步骤摘要】
公文辅助写作方法及系统


[0001]本专利技术涉及信息处理
,具体涉及一种公文辅助写作方法及系统。

技术介绍

[0002]公文是国家机关及政府部门的主要工作方式和展示形式,公文写作对于辅助决策、指导工作、完成任务和政务公开具有重要作用。政策公文具有严格的规范要求和详实的具体内容,要求在文章结构上逻辑清晰、层次清楚,行文结构不能“乱”,要有明确的主题和主线,因此对于工作人员的公文写作能力有很高的要求。公文写作需要一个漫长的学习、训练和积累的过程,对于负责公文写作的工作人员来说,不仅要求具有业务熟悉能力、文笔表达能力,更重要的是知识储备,没有充足的知识储备和业务经验,造成“素材贫乏,资料匮乏,句子缺乏”是公文写作人员面对公文写作的一大问题。现实中更多的工作人员对于公文写作的内心反应就是“不会写、害怕写”,公文写作不仅在素材管理成本、人才培养成本和写作时间成本都是巨大的消耗,更是给工作人员在心理上和精神上造成畏难情绪,影响工作效率。
[0003]随着人工智能的兴起,自然语言处理领域的各项技术不断攀高,基于大数据的自动化技术也得到广泛的应用。对于公文写作而言,业界流行两种方法:一是提供搜索能力,即通过搜索引擎提供与写作关键词相似的公文以作参考,在智能化方面,针对关键词的搜索仅仅能够作为写作素材使用,存在公文素材过于粗糙等问题;二是提供文本生成能力,这种方案发挥了人工智能的优势,但是公文领域是一个业务与描述都相对固定、格式化的一个领域,完全基于人工智能的文本生成会导致公文文本过度自由化,仍需要大量的人工参与,在写作成本上并未真正降低。

技术实现思路

[0004]本专利技术提供一种公文辅助写作方法及系统,可以更好地辅助用户完成公文的写作,提升工作效率及写作质量。
[0005]为此,本专利技术提供如下技术方案:
[0006]本专利技术提供一种公文辅助写作方法,所述方法包括:
[0007]获取用户的输入文本;
[0008]确定所述输入文本的向量;
[0009]利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;
[0010]利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;
[0011]根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;
[0012]将所述推荐下文推送给所述用户。
[0013]可选地,所述方法还包括:按照以下方式构建公文文本索引库:
[0014]收集公文资料,所述公文资料包括公文标题和正文;
[0015]对所述公文资料进行拆分处理,得到并记录所述公文标题及正文信息,所述正文信息:一个或多个文本块、以及文本块的相对位置;
[0016]对所述公文标题和所述文本块建立索引,得到公文文本索引库。
[0017]可选地,所述方法还包括:按照以下方式构建公文向量索引库:
[0018]利用对比学习模型确定各公文标题及对应的所有文本块的向量;
[0019]对所述向量建立索引,得到公文向量索引库。
[0020]可选地,所述方法还包括按照以下方式建立所述对比学习模型:
[0021]以所述文本块为单位,对所述公文标题和正文进行文本主题聚类,得到多个类别的文本主题和对应的文本数据;
[0022]根据所述多个类别的文本主题和对应的文本数据,生成对比数据集;
[0023]利用所述对比数据集建立所述对比学习模型。
[0024]可选地,建立所述对比学习模型还包括:
[0025]在对所述公文标题和正文进行文本主题聚类之前,对所述文本块进行分词得到短文本,去除所述短文本中的停用词。
[0026]可选地,所述相似标题集合中包括多个相似标题及其相似度得分;所述相似向量集合中包括多个相似向量及其相似度得分;
[0027]所述根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文包括:
[0028]根据所述相似标题集合和所述相似向量集合确定最终相似标题集合;
[0029]根据所述最终相似标题集合从所述第一文本块集合和所述第二文本块集合中选出相应的文本块作为推荐下文。
[0030]本专利技术还提供一种公文辅助写作系统,所述系统包括:
[0031]接收模块,用于获取用户的输入文本;
[0032]向量确定模块,用于确定所述输入文本的向量;
[0033]文本检索模块,用于利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;
[0034]向量检索模块,用于利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;
[0035]推荐文本确定模块,根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;
[0036]推送模块,用于将所述推荐下文推送给所述用户。
[0037]可选地,所述系统还包括:公文文本索引库建立模块,用于构建公文文本索引库;所述公文文本索引库建立模块包括:
[0038]资料收集单元,用于收集公文资料,所述公文资料包括公文标题和正文;
[0039]拆分处理单元,用于对所述公文资料进行拆分处理,得到并记录所述公文标题及正文信息,所述正文信息:一个或多个文本块、以及文本块的相对位置;
[0040]文本索引建立单元,用于对所述公文标题和所述文本块建立索引,得到公文文本索引库。
[0041]可选地,所述系统还包括:公文向量索引库建立模块,用于构建公文向量索引库;所述公文向量索引库建立模块包括:
[0042]向量确定单元,用于利用对比学习模型确定各公文标题及对应的所有文本块的向量;
[0043]向量索引建立单元,用于对所述向量建立索引,得到公文向量索引库。
[0044]可选地,所述系统还包括模型建立模块,用于建立所述对比学习模型;所述模型建立模块包括:
[0045]聚类单元,用于以所述文本块为单位,对所述公文标题和正文进行文本主题聚类,得到多个类别的文本主题和对应的文本数据;
[0046]数据集生成单元,用于根据所述多个类别的文本主题和对应的文本数据,生成对比数据集;
[0047]模型生成单元,用于利用所述对比数据集建立所述对比学习模型。
[0048]可选地,所述模型建立模块还包括:
[0049]文本块处理单元,用于在所述聚类单元对所述公文标题和正文进行文本主题聚类之前,对所述文本块进行分词得到短文本,去除所述短文本中的停用词。
[0050]可选地,所述推荐文本确定模块包括:
[0051]计算单元,用于根据所述相似标题集合和所述相似向量集合确定最终相似标题集合;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种公文辅助写作方法,其特征在于,所述方法包括:获取用户的输入文本;确定所述输入文本的向量;利用预先构建的公文文本索引库检索所述输入文本,得到相似标题集合及对应的第一文本块集合;利用预先构建的公文向量索引库检索所述向量,得到相似向量集合及对应的第二文本块集合;根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文;将所述推荐下文推送给所述用户。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:按照以下方式构建公文文本索引库:收集公文资料,所述公文资料包括公文标题和正文;对所述公文资料进行拆分处理,得到并记录所述公文标题及正文信息,所述正文信息:一个或多个文本块、以及文本块的相对位置;对所述公文标题和所述文本块建立索引,得到公文文本索引库。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:按照以下方式构建公文向量索引库:利用对比学习模型确定各公文标题及对应的所有文本块的向量;对所述向量建立索引,得到公文向量索引库。4.根据权利要求3所述的方法,其特征在于,所述方法还包括按照以下方式建立所述对比学习模型:以所述文本块为单位,对所述公文标题和正文进行文本主题聚类,得到多个类别的文本主题和对应的文本数据;根据所述多个类别的文本主题和对应的文本数据,生成对比数据集;利用所述对比数据集建立所述对比学习模型。5.根据权利要求4所述的方法,其特征在于,建立所述对比学习模型还包括:在对所述公文标题和正文进行文本主题聚类之前,对所述文本块进行分词得到短文本,去除所述短文本中的停用词。6.根据权利要求1至5任一项所述的方法,其特征在于,所述相似标题集合中包括多个相似标题及其相似度得分;所述相似向量集合中包括多个相似向量及其相似度得分;所述根据所述相似标题集合及对应的第一文本块集合、相似向量集合及对应的第二文本块集合确定相似文本块集合,根据所述相似文本块集合确定推荐下文包括:根据所述相似标题集合和所述相似向量集合确定最终相似标题集合;根据所述最终相似标题集合从所述第一文本块集合和所述第二文本块集合中选出相应的文本块作为推荐下文。7.一种公文辅助写作系统,其特征在于,所述系统包括:接收模块,用于获取用户的输入文本;向量确定模块,用于确定所述输入文本的向量...

【专利技术属性】
技术研发人员:熊子奇孔德智薛彦凯谭敏
申请(专利权)人:中电科大数据研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1