【技术实现步骤摘要】
本专利技术涉及语音识别,具体涉及一种基于大语言模型的内容话题分析方法。
技术介绍
1、受益于信息技术的不断创新和发展,在线社交网络应用迅速在全世界范围内普及,成为人们日常交流的重要方式,并且产生了大量的交互式数据,具有参与用户多、信息更新频率快、无用信息多等特点。尤其是,存在多个话题纠缠的情况,即一段连续出现的消息中,属于不同话题的内容会交替出现。因此在交互式海量数据中及时准确获取重要话题信息逐渐成为国内外研究的热点。实现话题的提取,通常需要进行话题分割,而分割的关键在于如何正确判断一条对话内容的话题归属,然后在基于内容总结形成话题名称和摘要。当有人中间加入到对话讨论中,不用再逐一查看所有的历史内容,只需要查看话题分析报告,可大大提高信息获取效率。另外,还可用于辅助查找感兴趣的话题。
2、目前,针对对话文本主题提取现有比较常用的方法如下:
3、1、基于多策略的话题检测技术
4、吴旭等人基于对话内容以及用户、时间、类型等辅助信息,提出一种基于多策略的对话内容话题检测技术。通过构建话题序列解决话题交叉的问
...【技术保护点】
1.一种基于大语言模型的话题分析方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于,对对话内容进行数据预处理,具体方法为:
3.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于,对预处理后的对话内容进行话题分类,将归属于同一话题的内容汇集到一起,具体方法为:
4.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于,提取内容中出现的讨论对象、缩略词、关键短语,收集额外背景知识,具体方法为:
5.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于
...【技术特征摘要】
1.一种基于大语言模型的话题分析方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于,对对话内容进行数据预处理,具体方法为:
3.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于,对预处理后的对话内容进行话题分类,将归属于同一话题的内容汇集到一起,具体方法为:
4.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于,提取内容中出现的讨论对象、缩略词、关键短语,收集额外背景知识,具体方法为:
5.根据权利要求1所述的基于大语言模型的话题分析方法,其特征在于,对对话过程中的多个话题进行相同的处理,形成讨论内容的话题分析报告,具体方法为:
6.根据权...
【专利技术属性】
技术研发人员:李邱苹,杨近朱,李达,孙笑科,党向磊,侯彬,王永健,李佳,张良,翟海滨,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。