【技术实现步骤摘要】
课堂教学语音摘要提取方法
[0001]本专利技术涉及语音摘要提取方法,具体地说是一种基于重音检测和长文本压缩的课堂教学语音摘要提取方法文本摘要方法,属于自然语言处理领域。
技术介绍
[0002]传统的课堂教学中,学生通常需要倾听教师的讲解并做好笔记。然而,随着课堂教学内容的增加和学生学习效率的需求,如何高效地获取课堂教学的核心内容成为了一个重要的问题。语音摘要技术通过提取语音中的关键信息,将长篇的语音转录文本压缩为简洁准确的摘要,帮助学生更好地理解和回顾课堂内容。
[0003]传统的语音摘要一般首先采用自动语音识别组件,实现从语音数据到文本数据的转录过程,然后摘要模块总结转录的关键部分。然而,传统的语音摘要方法存在一些问题。首先,语音摘要生成主要依赖于文本摘要,而在文本摘要过程中完全割裂了语音信息,因此一些重要的语音信息比如情感、语调等都没有被充分利用。其次,长篇的语音转录文本会导致句子规模过大,超出了一些文本摘要模型的输入要求,影响转录内容的准确性,或影响转录过程的实时性。
技术实现思路
[0004 ...
【技术保护点】
【技术特征摘要】
1.一种课堂教学语音摘要提取方法,其特征在于:该提取方法基于重音检测和长文本压缩,具体包括以下步骤:步骤一:长文本压缩通过关键句子筛选算法进行长文本压缩,以缩小句子规模,将长文本摘要问题转化为短文本问题;步骤二:重音标记训练通用的汉语语音重音检测模型,根据音频及其标注文件,对相应的文本序列进行汉语重音标记,得到每段音频对应的词级别的重音序列;步骤三:摘要生成使用生成式摘要模型生成摘要文本,具体包括:使用预训练模型进行特征提取,在预训练模型的输入层进行音频重音序列和文本向量的融合计算;通过预训练模型微调,提取到适合于下游摘要模型输入的词级别的语义特征;训练生成式摘要模型,并在数据集上进行模型微调。2.根据权利要求1所述的课堂教学语音摘要提取方法,其特征在于:语音摘要提取方法中所包括的语音摘要提取结构分为三部分:长文本压缩结构、重音检测结构、摘要生成结构。3.根据权利要求2所述的课堂教学语音摘要提取方法,其特征在于:所述长文本压缩结构使用改进的TextRank算法对候选句子进行权值计算和排序筛选,使得筛选出的关键句子组合的长度小于512。...
【专利技术属性】
技术研发人员:王崇文,严雪晴,
申请(专利权)人:北京理工大学唐山研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。