一种针对5G新通话环境的长对话关键信息提取方法技术

技术编号:45058404 阅读:25 留言:0更新日期:2025-04-22 17:41
本发明专利技术涉及一种面向5G新通话的长对话信息提取方法,所述方法包括的步骤:其一为语音信号的采集与预处理:系统通过5G通话设备采集第一用户与第二用户之间的语音信号;其二为语自动语音识别:自动语音识别技术将预处理后的语音信号转换为文本数据;其三为通过迭代方式进行关键信息提取;其四是输出结果解析。本发明专利技术通过多层次关键信息提取与迭代优化机制,显著增强了大语言模型(LLM)在长对话场景中的信息提取能力。该方法有效缓解了长文本理解的复杂性和计算资源的限制问题。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,具体为一种针对5g新通话环境的长对话关键信息提取方法。


技术介绍

1、目前,面向5g新通话环境下的长对话信息提取技术主要涉及自动语音识别(automatic speech recognition,asr)、文本摘要、关键词提取及待办事项提取等关键技术。由于asr仅是信息处理流程中的初始步骤,本文不对其进行深入讨论。文本摘要方法包括基于统计的抽取式摘要和生成式摘要。基于统计的抽取式摘要方法通过提取文本中的关键句子或短语来生成摘要,生成式摘要方法则利用语言模型生成新的句子来构建摘要。抽取式摘要在语法、句法上有一定的保证,但是也面临了一定的问题,例如:内容选择错误、连贯性差、灵活性差等问题。生成式摘要允许摘要中包含新的词语或短语,灵活性高。大语言模型(large language model,llm)由于其在其强大的语义理解能力和灵活的生成方式,其生成的摘要表现出高度的流畅性和连贯性。关键词是能够表达文档中心内容的词语,传统的关键字提取方法包括基于频率的方法、基于图的方法和统计方法,这些方法在自然语言处理(nlp)领域具有奠基性的作用本文档来自技高网...

【技术保护点】

1.一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:所述方法包括如下步骤:

2.根据权利要求1所述的一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:所述短文本片段长度受限于输入长度与第一提示词Prompt 1长度的差值。

3.根据权利要求1所述的一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:拼接长度受限于系统设置的输入长度与Prompt2的长度之差。

4.根据权利要求1所述的一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:所述大语言模型LLM,包括开源模型和/或闭源模型。

【技术特征摘要】

1.一种针对5g新通话环境的长对话关键信息提取方法,其特征在于:所述方法包括如下步骤:

2.根据权利要求1所述的一种针对5g新通话环境的长对话关键信息提取方法,其特征在于:所述短文本片段长度受限于输入长度与第一提示词prompt 1长度的差值。

3.根据权利...

【专利技术属性】
技术研发人员:罗岚张晶晶陈家志乔治李雪欣汪秋波邹西山李韩弋翔温雪阳邓宇翔罗志亮陈静娴陈星
申请(专利权)人:联通沃音乐文化有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1