【技术实现步骤摘要】
一种主题纵向拓展方法、装置、设备和介质
[0001]本专利技术涉及知识拓展
,特别涉及一种主题纵向拓展方法、装置、设备和介质。
技术介绍
[0002]一篇文章中的子主题之间是存在关联关系的,多个子主题能够完整地表达出整篇文章的主旨,比如用户需要撰写“人工智能在图像自动生成领域的应用”,文章介绍的子主题大概有:
[0003]1、人工智能的背景
[0004]2、图像自动生成方法(传统方法和人工智能方法)
[0005]3、人工智能在图像自动生成进展以及优缺点
[0006]4、图像自动生成适合的领域
[0007]5、总结
[0008]子主题1、2、3、4、5有先后顺序,且能够完整地阐述这个主旨。
[0009]另外子主题下方文本的描述需要围绕这个子主题去阐述,如果能够根据子主题语义自动提供相关的文本给用户参考,就极大可能给用户带来新的写作灵感,且能大大地提高用户的写作效率。
[0010]因此亟需提供一种主题纵向拓展方法,为用户撰写文章提供便利。目前ChatGPT模型 ...
【技术保护点】
【技术特征摘要】
1.一种主题纵向拓展方法,其特征在于,包括:关联标题生成模型训练过程:利用爬虫技术获取指定领域的文章,将每一篇文章的文章标题及段落标题作为标题数据集;使用T5模型对所述标题数据集进行训练,获取自动生成与输入段落标题相关联的段落标题的模型;文本向量生成模型训练过程:将每一段落标题下对应的文本内容使用BERT模型生成文本向量,通过在BERT模型后面接全连接层以及softmax层,来判断文本属于哪一个段落标题,从而进行BERT模型的训练;数据库存储过程:将BERT模型生成的文本向量,以及该文本向量对应的文本内容和段落标题,存储到数据库中用于检索;主题拓展过程:当获取到用户输入的目标文本时,如用户的主题拓展目标是与该目标文本相近的文本内容,则将目标文本输入训练后的BERT模型获取文本向量,然后根据所述文本向量从数据库中获取文本内容并输出;如用户的主题拓展目标是与该目标文本相关联的文本内容,则将目标文本输入训练后的BERT模型获取文本向量,然后根据所述文本向量从数据库中获取所述文本向量对应的段落标题,将该段落标题输入训练后的T5模型获得相关联主题,通过获得的相关联主题从数据库中获取对应的文本内容并输出。2.根据权利要求1所述的方法,其特征在于:所述标题数据集中,标题之间采用分隔符隔开,保持段落标题前后关联关系;将段落标题输入训练后的T5模型时,根据用户指定的要求生成在目标文本对应的段落标题或者目标文本对应的段落标题之前或者之后的段落标题。3.根据权利要求1或2所述的方法,其特征在于:所述目标文本为文章标题、段落标题或文本内容。4.根据权利要求1所述的方法,其特征在于:使用BERT模型生成文本向量时,对于超过指定长度的文本,采用滑动窗口式进行切割,并设置滑动距离,所述BERT模型的训练过程采用全参数微调的方式。5.一种主题纵向拓展装置,其特征在于,包括:关联标题生成模型训练模块:利用爬虫技术获取指定领域的文章,将每一篇文章的文章标题及段落标题作为标题数据集;使用...
【专利技术属性】
技术研发人员:陈涛,高宋俤,韩笑,
申请(专利权)人:福州悟理妙信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。