System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人工智能技术的自动化公文生成系统技术方案_技高网

一种基于人工智能技术的自动化公文生成系统技术方案

技术编号:40475833 阅读:5 留言:0更新日期:2024-02-26 19:12
本发明专利技术涉及智能办公技术领域,具体为一种基于人工智能技术的自动化公文生成系统,包括:编号模块、自然语言处理模块、神经网络算法模块和公文输出模块;所述编号模块,构建不同类型的公文模板,对公文模板进行编号;在对公文模板进行编号时,采用首个大写字母对不同的类型的公文模板进行大类分类,并且采用字母后缀数字对同类型公文的进行小类分类,建立所有公文模板的编号,统一所有公文模板编号格式与编号字符长度;所述自然语言处理模块,存储有自然语言处理算法,对用户输出为自然语言进行处理,并转换成数字序列。本发明专利技术相较于传统人工对公文的处理,极大地提高了公文处理的工作效率,且公文中的错误率也有大幅降低。

【技术实现步骤摘要】

本专利技术涉及智能办公,具体为一种基于人工智能技术的自动化公文生成系统


技术介绍

1、智能办公是基于先进的信息技术构建的办公环境,旨在提高工作效率、优化资源利用、提升工作质量。ai技术在智能办公中发挥着关键作用;深度学习算法被应用于语音识别、自然语言处理、图像识别等领域,实现了文档自动分类、智能语音助手、自动化决策支持等功能;自然语言处理技术使得机器能够理解、处理和生成自然语言;智能办公中的语音识别、文本分析、智能翻译等功能都离不开自然语言处理技术的支持。

2、在现有办公方式中,公文一般由人员手动进行处理,工作效率低,出错概率高,因此,结合人工智能的高效性,研发自动化生成公文十分有必要。


技术实现思路

1、本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。

2、鉴于上述存在的问题,提出了本专利技术。

3、因此,本专利技术解决的技术问题是:基于深度学习算法,自动化生成公文,提升工作效率。

4、为解决上述技术问题,本专利技术提供如下技术方案:一种基于人工智能技术的自动化公文生成系统,其特征在于:包括,编号模块、自然语言处理模块、神经网络算法模块和公文输出模块;

5、所述编号模块,用于构建不同类型的公文模板,并对公文模板进行编号;在对公文模板编号时,采用首个大写字母对不同的类型的公文模板进行大类分类,并且采用字母后缀数字对同类型公文的进行小类分类,建立所有公文模板的编号,统一所有公文模板编号格式与编号字符长度;

6、所述自然语言处理模块,存储有自然语言处理算法,对用户输出为自然语言进行预处理,并转换成数字序列;

7、所述神经网络算法模块,存储有循环神经网络的深度学习模型算法,接受自然语言处理模块传输的自然语言所转换成的数字序列,对数字序列进行计算,生成用户需求的自然语言文本;

8、所述公文输出模块,所述输出到用户界面包括,用户在给出公文需求后,经自然语言处理技术分析需求类容,并将文本转换为与词汇表对应的序列,循环神经网络读取序列信息并读取相应的公文模板,经计算将用户需求的公文信息生成到公文模板中,输出到用户界面。

9、作为本专利技术所述一种基于人工智能技术的自动化公文生成系统的一种优选方案,其中:所述公文模板包括,在对公文模板进行编号时,公文模板的编号留有冗余,在后续对公文模板类型以及数量进行扩展。

10、作为本专利技术所述一种基于人工智能技术的自动化公文生成系统的一种优选方案,其中:所述预处理包括,采用自然语言处理技术,实施分词、词性标注、命名实体识别、句法分析、语义分析、实体关系抽取的技术手段;所述分词包括,将连续的文本划分成词语和子词,形成个体单元,表示为单词;所述词性标注包括,确定每个词语在句子中的词性;所述命名实体识别包括,识别文本中的命令实体,识别出文档的类型;所述句法分析包括,分析句子的结构,了解词语之间的语法关系;所述语义分析包括,确定文本的语义含义,通过词嵌入技术实现;所述实体关系抽取包括,识别文本中实体之间的关系,对文档模板的调用进行判断。

11、作为本专利技术所述一种基于人工智能技术的自动化公文生成系统的一种优选方案,其中:所述预处理用户输入的自然语言文本包括,文本清洗、分词以及建立词汇表;所述文本清洗包括,移除文本中不需要的字符、标点符号和特殊符号;所述分词包括,将文本分割成单词以及子词的序列;所述建立词汇表包括,创建词汇表,将分词后的单词映射为整数;

12、令文本文档表示为一个序列:

13、x={x1,x2,...,xt}

14、其中,t是序列的长度,每个xt是词汇表中的单词。

15、作为本专利技术所述一种基于人工智能技术的自动化公文生成系统的一种优选方案,其中:所述循环神经网络模型还包括,定义循环神经网络的循环隐藏层、输出层以及损失函数,并对神经网络模型进行优化;

16、在每个时刻t,隐藏循环层状态ht计算公式如下:

17、ht=r(et,ht-1)

18、其中,r是循环层函数,ht是时刻t的隐藏状态,ht-1是上一时刻的隐藏状态;

19、定义输出层,将循环隐藏层的输出映射为模型并输出,采用softmax函数对文档类型进行分类识别:

20、yt=softmax(wout·ht)

21、其中,wout是输出层权重矩阵,yt是时刻t的模型输出。

22、作为本专利技术所述一种基于人工智能技术的自动化公文生成系统的一种优选方案,其中:所述交叉熵损失函数包括,在构建交叉熵损失函数时,对循环神经输出的文本模型进行训练,生成最符合用户需求的公文,样本的损失函数如下:

23、

24、其中,c是公文模板数量,yi,t是真实标签的独热编码,是模型的对应概率。

25、作为本专利技术所述一种基于人工智能技术的自动化公文生成系统的一种优选方案,其中:所述对神经网络模型进行优化包括,采用adam优化算法,并使用反向传播算法更新模型参数,最小化损失函数,adam优化算法具体如下:

26、

27、其中,αt表示学习率;α是初始学习率,作为超参数进行设置;β1是一阶矩估计的衰减率;β2是二阶矩估计的衰减率。

28、作为本专利技术所述一种基于人工智能技术的自动化公文生成系统的一种优选方案,其中:所述输出到用户界面包括,用户在给出公文需求后,经自然语言处理技术分析需求类容,并将文本转换为与词汇表对应的序列,循环神经网络读取序列信息并读取相应的公文模板,经计算将用户需求的公文信息生成到公文模板中,输出到用户界面。

29、本专利技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述的一种基于人工智能技术的自动化公文生成系统的步骤。

30、本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述的一种基于人工智能技术的自动化公文生成系统的步骤。

31、本专利技术的有益效果:本专利技术相较于传统人工对公文的处理,提高工作效率:自动化公文生成系统可以大幅提高文档撰写的效率,特别是在大量重复性工作中,使工作人员能够更专注于更复杂的任务;

32、减少人为错误:通过使用自动化系统,可以减少由于疏忽或错误的人为因素导致的文档错误,提高文档的准确性和一致性;

33、应对文档多样性:工作中面临着各种文档类型和格式的需求;自动化公文生成系统的灵活性和适应性使其能够更好地应对多样性的文档需求;

34、释放人力资源:通过自动处理标准化和重复性的文档生成任务,可以更好地利用人力资源,使人员能够集中精力处理更复杂、创造性本文档来自技高网...

【技术保护点】

1.一种基于人工智能技术的自动化公文生成系统,其特征在于:包括,编号模块、自然语言处理模块、神经网络算法模块和公文输出模块;

2.如权利要求1所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述公文模板包括,在对公文模板进行编号时,公文模板的编号留有冗余,在后续对公文模板类型以及数量进行扩展。

3.如权利要求2所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述预处理包括,采用自然语言处理技术,实施分词、词性标注、命名实体识别、句法分析、语义分析、实体关系抽取的技术手段;

4.如权利要求3所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述预处理用户输入的自然语言文本包括,文本清洗、分词以及建立词汇表;

5.如权利要求4所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述循环神经网络模型包括,构建循环神经网络模型的深度学习模型,在嵌入层将整数化的单词映射为密集的向量表示,并采用预训练的词向量模型,以及在模型中学习嵌入,将文本表达转换为数字表达;定义嵌入矩阵E,矩阵中每一行对应词汇表中每一个单词的嵌入表示,通过嵌入层将输入序列X映射为:

6.如权利要求5所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述循环神经网络模型还包括,定义循环神经网络的循环隐藏层、输出层以及损失函数,并对神经网络模型进行优化;

7.如权利要求6所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述交叉熵损失函数包括,在构建交叉熵损失函数时,对循环神经输出的文本模型进行训练,生成最符合用户需求的公文,样本的损失函数如下:

8.如权利要求7所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述对神经网络模型进行优化包括,采用Adam优化算法,并使用反向传播算法更新模型参数,最小化损失函数,Adam优化算法具体如下:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的一种基于人工智能技术的自动化公文生成系统的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的一种基于人工智能技术的自动化公文生成系统的步骤。

...

【技术特征摘要】

1.一种基于人工智能技术的自动化公文生成系统,其特征在于:包括,编号模块、自然语言处理模块、神经网络算法模块和公文输出模块;

2.如权利要求1所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述公文模板包括,在对公文模板进行编号时,公文模板的编号留有冗余,在后续对公文模板类型以及数量进行扩展。

3.如权利要求2所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述预处理包括,采用自然语言处理技术,实施分词、词性标注、命名实体识别、句法分析、语义分析、实体关系抽取的技术手段;

4.如权利要求3所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述预处理用户输入的自然语言文本包括,文本清洗、分词以及建立词汇表;

5.如权利要求4所述的一种基于人工智能技术的自动化公文生成系统,其特征在于:所述循环神经网络模型包括,构建循环神经网络模型的深度学习模型,在嵌入层将整数化的单词映射为密集的向量表示,并采用预训练的词向量模型,以及在模型中学习嵌入,将文本表达转换为数字表达;定义嵌入矩阵e,矩阵中每一行对应词汇表中每一个单词的嵌入表示,通过嵌入层将输入序...

【专利技术属性】
技术研发人员:赵隽隽潘斌赵剑飞欧阳禄萍张怀仁
申请(专利权)人:知学云北京科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1