语义提取方法、报告生成方法、电子设备及存储介质技术

技术编号:33040897 阅读:16 留言:0更新日期:2022-04-15 09:21
本发明专利技术提供一种语义提取方法、报告生成方法、电子设备及存储介质,其中语义提取方法包括:确定待提取文本;基于样本文本的文本语义和语义集合,对待提取文本进行语义提取,得到待提取文本的文本语义,语义集合包括样本文本的正样本动量语义和负样本动量语义。本发明专利技术提供的方法、装置、电子设备及存储介质,能够通过样本文本动量语义和负样本动量语义的语义集合对比学习得到的文本和文本语义之间的映射关系,对待提取文本进行语义提取,负样本动量语义的应用,使得语义提取的过程中能够充分参考负样本动量语义所携带的知识,以强化文本语义的提取能力,进而提高了语义提取的准确度,有助于保证后续报告生成任务执行的准确性和可靠性。可靠性。可靠性。

【技术实现步骤摘要】
语义提取方法、报告生成方法、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种语义提取方法、报告生成方法、电子设备及存储介质。

技术介绍

[0002]互联网产品作为一种线上服务,需要通过分析客服提供的咨询对话、产品订单的评论,提供专业的用户反馈分析报告,帮助产品的功能优化和新服务的构建。基于客服提供的咨询对话、产品订单的评论生成用户反馈分析报告的任务,类似于摘要生成的任务。目前,在利用神经网络模型,进行摘要生成式的任务时,通过提取到文本高层的语义信息,即可完成该文本摘要的生成任务。
[0003]但现有的机器摘要生成的任务,多是基于token级别的语义提取,即本质上更关注字符级特征之间在语言生成的建模任务上,在对全局语义特征的提取上效果不理想,进而导致摘要生成效果不佳。

技术实现思路

[0004]本专利技术提供一种语义提取方法、报告生成方法、电子设备及存储介质,用以解决现有技术中token级别的语义提取方法在全局语义特征的提取上效果不理想的缺陷。
[0005]本专利技术提供一种语义提取方法,包括:
[0006]确定待提取文本;
[0007]基于样本文本的文本语义和语义集合,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义,所述语义集合包括所述样本文本的正样本动量语义和负样本动量语义。
[0008]根据本专利技术提供的一种语义提取方法,所述样本文本的文本语义和语义集合基于如下步骤确定:
[0009]对当前样本文本进行语义提取,得到所述样本文本的文本语义和正样本动量语义;
[0010]基于所述正样本动量语义,对负样本缓存队列进行更新,并将更新得到的负样本缓存队列确定为所述当前样本文本的语义集合,将所述当前样本文本的下一样本文本确定为当前样本文本。
[0011]根据本专利技术提供的一种语义提取方法,所述基于所述正样本动量语义,对负样本缓存队列进行更新,包括:
[0012]基于所述负样本缓存队列的长度,随机选择插入位置;
[0013]基于所述插入位置,将所述正样本动量语义插入到所述负样本缓存队列,并将所述负样本缓存队列的队尾样本剔除,得到更新的负样本缓存队列。
[0014]根据本专利技术提供的一种语义提取方法,所述对当前样本文本进行语义提取,得到所述样本文本的文本语义和正样本动量语义,包括:
[0015]基于文本语义提取参数,对所述当前样本文本进行文本语义提取,得到所述样本文本的文本语义,以及所述文本语义提取的文本回传梯度;
[0016]基于动量语义提取参数,对所述当前样本文本进行动量语义提取,得到所述样本文本的正样本动量语义,以及所述动量语义提取的动量回传梯度;
[0017]基于所述文本回传梯度,对所述文本语义提取参数进行更新,基于所述文本回传梯度和所述动量回传梯度,对所述动量语义提取参数进行更新。
[0018]根据本专利技术提供的一种语义提取方法,所述基于样本文本的文本语义和语义集合,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义,包括:
[0019]基于语义映射关系,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义;
[0020]所述语义映射关系是基于所述样本文本的文本语义和语义集合中各动量语义的相似度分布,以及所述语义集合的正负样本概率分布确定的。
[0021]根据本专利技术提供的一种语义提取方法,所述正负样本概率分布基于如下步骤确定:
[0022]基于所述语义集合中正样本动量语义和负样本动量语义的位置,确定正负样本标签表示;
[0023]基于所述文本语义分别与所述语义集合中各动量语义的组合,确定各组合的融合特征;
[0024]基于所述正负样本标签表示分别与各组合的融合特征之间的相似度,确定所述正负样本概率分布。
[0025]本专利技术还提供一种报告生成方法,包括:基于上述任一项所述的语义提取方法,对原始文本进行语义提取,得到所述原始文本的语义;
[0026]基于所述原始文本的语义,生成所述原始文本对应的报告文本。
[0027]本专利技术还提供一种语义提取装置,包括:
[0028]确定模块,用于确定待提取文本;
[0029]提取模块,用于基于样本文本的文本语义和语义集合,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义,所述语义集合包括所述样本文本的正样本动量语义和负样本动量语义。
[0030]本专利技术还提供一种报告生成装置,包括:
[0031]语义提取模块,用于基于上述任一项所述的语义提取方法,对原始文本进行语义提取,得到所述原始文本的语义;
[0032]报告生成模块,用于基于所述原始文本的语义,生成所述原始文本对应的报告文本。
[0033]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语义提取方法的步骤或者实现如上述提供的所述的报告生成方法的步骤。
[0034]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语义提取方法的步骤或者实现如上述提供的所述的报告生成方法的步骤。
[0035]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语义提取方法的步骤或者实现如上述提供的所述的报告生成方法的步骤。
[0036]本专利技术提供的语义提取方法、报告生成方法、电子设备及存储介质,通过文本及文本语义之间的映射关系,对待提取文本进行语义提取,负样本动量语义的应用,使得语义提取的过程中能够充分参考负样本动量语义所携带的知识,以强化文本语义的提取能力,进而提高了语义提取的准确度,有助于保证后续报告生成任务执行的准确性和可靠性。
附图说明
[0037]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1是本专利技术提供的语义提取方法的流程示意图;
[0039]图2是本专利技术提供的获取当前样本文本的文本语义和语义集合方法的流程示意图;
[0040]图3是本专利技术提供的负样本缓存队列更新方法的流程示意图;
[0041]图4是本专利技术提供的文本语义和动量语义提取参数更新方法流程示意图;
[0042]图5是本专利技术提供的获取正负样本概率分布方法的流程示意图;
[0043]图6是本专利技术提供的报告生成方法流程示意图;
[0044]图7是本专利技术提供的语义提取模型的结构示意图;
[0045]图8是本专利技术提供的报告生成模型的结构示意图;
[0046]图9是本专利技术提供的语义提取装置的结构示意图;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义提取方法,其特征在于,包括:确定待提取文本;基于样本文本的文本语义和语义集合,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义,所述语义集合包括所述样本文本的正样本动量语义和负样本动量语义。2.根据权利要求1所述的语义提取方法,其特征在于,所述样本文本的文本语义和语义集合基于如下步骤确定:对当前样本文本进行语义提取,得到所述样本文本的文本语义和正样本动量语义;基于所述正样本动量语义,对负样本缓存队列进行更新,并将更新得到的负样本缓存队列确定为所述当前样本文本的语义集合,将所述当前样本文本的下一样本文本确定为当前样本文本。3.根据权利要求2所述的语义提取方法,其特征在于,所述基于所述正样本动量语义,对负样本缓存队列进行更新,包括:基于所述负样本缓存队列的长度,随机选择插入位置;基于所述插入位置,将所述正样本动量语义插入到所述负样本缓存队列,并将所述负样本缓存队列的队尾样本剔除,得到更新的负样本缓存队列。4.根据权利要求2所述的语义提取方法,其特征在于,所述对当前样本文本进行语义提取,得到所述样本文本的文本语义和正样本动量语义,包括:基于文本语义提取参数,对所述当前样本文本进行文本语义提取,得到所述样本文本的文本语义,以及所述文本语义提取的文本回传梯度;基于动量语义提取参数,对所述当前样本文本进行动量语义提取,得到所述样本文本的正样本动量语义,以及所述动量语义提取的动量回传梯度;基于所述文本回传梯度,对所述文本语义提取参数进行更新,基于所述文本回传梯度和所述动量回传梯度,对所述动量语义提取参数进行更新。5.根据权利要求1至4中任一项所述的语义提取方法,其特征在于,所述基于样本文本的文本语义和语义集合,对所述待提取文本进行语义提取,得到所述待提取文本的文本语义,包括:基于语义映射关系,对所述待提取文本进行语义提取,得到所述待提...

【专利技术属性】
技术研发人员:王楠杨中远陆玥
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1