当前位置: 首页 > 专利查询>科大讯飞华南人工智能研究院广州有限公司专利>正文

文档生成方法及装置、存储介质制造方法及图纸

技术编号：33303745 阅读：10 留言：0更新日期：2022-05-06 12:12

本申请披露了一种文档生成方法及装置、存储介质。该方法包括：根据简略文档和与之对应的音频文件，通过编码器，得到融合特征向量，其中，融合特征向量融合有简略文档对应的第一特征向量和音频文件对应的第二特征向量，第一特征向量包括简略文档的局部关键信息，第二特征向量包括音频文件的全局细节信息；根据融合特征向量，通过解码器，得到第一详细文档，能够同时兼顾文档的局部关键信息和全局细节信息，从而得到了质量更高的详细文档。而得到了质量更高的详细文档。而得到了质量更高的详细文档。

全部详细技术资料下载

【技术实现步骤摘要】
文档生成方法及装置、存储介质

[0001]本申请涉及计算机
，具体涉及一种文档生成方法及装置、存储介质。

技术介绍

[0002]自然语言处理技术是计算机科学计算领域与人工智能计算领域中的一个重要方向，随着自然语言处理技术的不断成熟，其开始广泛应用于文档自动生成。现有的文档自动生成技术包括文档自动摘要技术或文档自动补全技术，例如，文档自动摘要可以从冗余的长文档中迅速归纳关键信息，文档自动补全可以基于用户给定的文本作为开头，补全文本内容，甚至生成一部完整小说和影视剧本。然而，不管是自动摘要还是自动补全，都无法提供高质量的详细文档。

技术实现思路

[0003]有鉴于此，本申请提供一种文档生成方法及装置、存储介质，能够生成质量更高的详细文档。
[0004]第一方面，提供一种文档生成方法，包括：根据简略文档和与之对应的音频文件，通过编码器，得到融合特征向量，其中，所述融合特征向量融合有所述简略文档对应的第一特征向量和所述音频文件对应的第二特征向量，所述第一特征向量包括所述简略文档的局部关键信息，所述第二特征向量包括所述音频文件的全局细节信息；根据所述融合特征向量，通过解码器，得到第一详细文档。
[0005]第二方面，提供一种文档生成装置，包括：获取模块，配置为根据简略文档和与之对应的音频文件，通过编码器，得到融合特征向量，其中，所述融合特征向量融合有所述简略文档对应的第一特征向量和所述音频文件对应的第二特征向量，所述第一特征向量包括所述简略文档的局部关键信息，所述第二特征向量包括所述音频文...

【技术保护点】

【技术特征摘要】
1.一种文档生成方法，其特征在于，包括：根据简略文档和与之对应的音频文件，通过编码器，得到融合特征向量，其中，所述融合特征向量融合有所述简略文档对应的第一特征向量和所述音频文件对应的第二特征向量，所述第一特征向量包括所述简略文档的局部关键信息，所述第二特征向量包括所述音频文件的全局细节信息；根据所述融合特征向量，通过解码器，得到第一详细文档。2.根据权利要求1所述的方法，其特征在于，还包括：a)对第n
‑
1详细文档进行评估，得到第n
‑
1评估结果，其中，所述n为大于或等于2且小于或等于N的整数，当所述n等于2时，所述第n
‑
1详细文档为所述第一详细文档，所述第n
‑
1评估结果用于表示所述第n
‑
1详细文档的质量；b)在所述第n
‑
1评估结果不满足所述预设条件时，根据所述第n
‑
1详细文档，通过所述解码器，得到第n详细文档；迭代执行上述步骤a)和b)，得到第N详细文档；对所述第N详细文档进行评估，得到满足所述预设条件的第N评估结果，并确定所述第N详细文档为最终详细文档。3.根据权利要求2所述的方法，其特征在于，在所述第n
‑
1评估结果不满足所述预设条件时，所述根据所述第n
‑
1详细文档，通过所述解码器，得到第n详细文档，包括：根据所述第n
‑
1详细文档和所述融合特征向量，通过所述解码器，得到所述第n详细文档。4.根据权利要求2所述的方法，其特征在于，所述对第n
‑
1详细文档进行评估，得到第n
‑
1评估结果，包括：基于预设评估模型，对所述第n
‑
1详细文档进行评估，得到所述第n
‑
1评估结果。5.根据权利要求4所述的方法，其特征在于，当所述预设评估模型为基于评估指标ROUGE
‑
L的模型时，所述基于预设评估模型，对所述第n
‑
1详细文档进行评估，得到所述第n
‑
1评估结果，包括：将所述第n
‑
1详细文档输入所述基于评估指标ROUGE
‑
L的模型，对所述第n
‑
1详细文档的语言流畅性进行评估，得到所述第n
‑
1评估结果，和/或当所述预设评估模型为文档自动摘要模型时，所述基于预设评估模型，对所述第n
‑
1详细文档进行评估，得到所述第n
‑
1评估结果，包括：将所述第n
‑
1详细文档输入所述文档自动摘要模型，对所述第n
‑
1详细文档的逻辑完备性和/或用户意图进行评估，得到所述第n
‑
1评估结果，和/或当所述预设评估模型为基于对抗神经网络的判别器时，所述基于预设评估模型，对所述第n
‑
1详细文档进行评估，得到所述第n
‑
1评估结果，包括：将所述第n
‑
1详细文档输入所述基于对抗神经网络的判别器，对所述第n
‑
1详细文档是否符合人类书写习惯进行评估，得到所述第n
‑
1评估结果。6.根据权利要求1至5中任一项所述的方法，其特征在于，所述根据简略文档和与之对应的音频文件，通过编码器，得到融合特征向量，包括：将所述简略文档输入所述编码器中，得到所述第一特征向量；将...

【专利技术属性】
技术研发人员：许光辉，杜倩云，
申请(专利权)人：科大讯飞华南人工智能研究院广州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人