语义提取方法、报告生成方法、电子设备及存储介质技术

技术编号:33040897 阅读:27 留言:0更新日期:2022-04-15 09:21
本发明专利技术提供一种语义提取方法、报告生成方法、电子设备及存储介质,其中语义提取方法包括:确定待提取文本;基于样本文本的文本语义和语义集合,对待提取文本进行语义提取,得到待提取文本的文本语义,语义集合包括样本文本的正样本动量语义和负样本动量语义。本发明专利技术提供的方法、装置、电子设备及存储介质,能够通过样本文本动量语义和负样本动量语义的语义集合对比学习得到的文本和文本语义之间的映射关系,对待提取文本进行语义提取,负样本动量语义的应用,使得语义提取的过程中能够充分参考负样本动量语义所携带的知识,以强化文本语义的提取能力,进而提高了语义提取的准确度,有助于保证后续报告生成任务执行的准确性和可靠性。可靠性。可靠性。

【技术实现步骤摘要】
语义提取方法、报告生成方法、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种语义提取方法、报告生成方法、电子设备及存储介质。

技术介绍

[0002]互联网产品作为一种线上服务,需要通过分析客服提供的咨询对话、产品订单的评论,提供专业的用户反馈分析报告,帮助产品的功能优化和新服务的构建。基于客服提供的咨询对话、产品订单的评论生成用户反馈分析报告的任务,类似于摘要生成的任务。目前,在利用神经网络模型,进行摘要生成式的任务时,通过提取到文本高层的语义信息,即可完成该文本摘要的生成任务。
[0003]但现有的机器摘要生成的任务,多是基于token级别的语义提取,即本质上更关注字符级特征之间在语言生成的建模任务上,在对全局语义特征的提取上效果不理想,进而导致摘要生成效果不佳。

技术实现思路

[0004]本专利技术提供一种语义提取方法、报告生成方法、电子设备及存储介质,用以解决现有技术中token级别的语义提取方法在全局语义特征的提取上效果不理想的缺陷。
[0005]本专利技术提供一种语义提取方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语义提取方法,其特征在于,包括:确定待提取文本;基于样本文本的文本语义和语义集合,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义,所述语义集合包括所述样本文本的正样本动量语义和负样本动量语义。2.根据权利要求1所述的语义提取方法,其特征在于,所述样本文本的文本语义和语义集合基于如下步骤确定:对当前样本文本进行语义提取,得到所述样本文本的文本语义和正样本动量语义;基于所述正样本动量语义,对负样本缓存队列进行更新,并将更新得到的负样本缓存队列确定为所述当前样本文本的语义集合,将所述当前样本文本的下一样本文本确定为当前样本文本。3.根据权利要求2所述的语义提取方法,其特征在于,所述基于所述正样本动量语义,对负样本缓存队列进行更新,包括:基于所述负样本缓存队列的长度,随机选择插入位置;基于所述插入位置,将所述正样本动量语义插入到所述负样本缓存队列,并将所述负样本缓存队列的队尾样本剔除,得到更新的负样本缓存队列。4.根据权利要求2所述的语义提取方法,其特征在于,所述对当前样本文本进行语义提取,得到所述样本文本的文本语义和正样本动量语义,包括:基于文本语义提取参数,对所述当前样本文本进行文本语义提取,得到所述样本文本的文本语义,以及所述文本语义提取的文本回传梯度;基于动量语义提取参数,对所述当前样本文本进行动量语义提取,得到所述样本文本的正样本动量语义,以及所述动量语义提取的动量回传梯度;基于所述文本回传梯度,对所述文本语义提取参数进行更新,基于所述文本回传梯度和所述动量回传梯度,对所述动量语义提取参数进行更新。5.根据权利要求1至4中任一项所述的语义提取方法,其特征在于,所述基于样本文本的文本语义和语义集合,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义,包括:基于语义映射关系,对所述待提取文本进行语义提取,得到所述待提...

【专利技术属性】
技术研发人员:王楠杨中远陆玥
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1