【技术实现步骤摘要】
本专利技术涉及自然语言处理,具体为一种针对5g新通话环境的长对话关键信息提取方法。
技术介绍
1、目前,面向5g新通话环境下的长对话信息提取技术主要涉及自动语音识别(automatic speech recognition,asr)、文本摘要、关键词提取及待办事项提取等关键技术。由于asr仅是信息处理流程中的初始步骤,本文不对其进行深入讨论。文本摘要方法包括基于统计的抽取式摘要和生成式摘要。基于统计的抽取式摘要方法通过提取文本中的关键句子或短语来生成摘要,生成式摘要方法则利用语言模型生成新的句子来构建摘要。抽取式摘要在语法、句法上有一定的保证,但是也面临了一定的问题,例如:内容选择错误、连贯性差、灵活性差等问题。生成式摘要允许摘要中包含新的词语或短语,灵活性高。大语言模型(large language model,llm)由于其在其强大的语义理解能力和灵活的生成方式,其生成的摘要表现出高度的流畅性和连贯性。关键词是能够表达文档中心内容的词语,传统的关键字提取方法包括基于频率的方法、基于图的方法和统计方法,这些方法在自然语言处理(nlp)
...【技术保护点】
1.一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:所述方法包括如下步骤:
2.根据权利要求1所述的一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:所述短文本片段长度受限于输入长度与第一提示词Prompt 1长度的差值。
3.根据权利要求1所述的一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:拼接长度受限于系统设置的输入长度与Prompt2的长度之差。
4.根据权利要求1所述的一种针对5G新通话环境的长对话关键信息提取方法,其特征在于:所述大语言模型LLM,包括开源模型和/或闭源模型。
【技术特征摘要】
1.一种针对5g新通话环境的长对话关键信息提取方法,其特征在于:所述方法包括如下步骤:
2.根据权利要求1所述的一种针对5g新通话环境的长对话关键信息提取方法,其特征在于:所述短文本片段长度受限于输入长度与第一提示词prompt 1长度的差值。
3.根据权利...
【专利技术属性】
技术研发人员:罗岚,张晶晶,陈家志,乔治,李雪欣,汪秋波,邹西山,李韩,弋翔,温雪阳,邓宇翔,罗志亮,陈静娴,陈星,
申请(专利权)人:联通沃音乐文化有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。