情感预测模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:31017921 阅读:16 留言:0更新日期:2021-11-30 03:01
本公开公开了一种情感预测模型的训练方法、装置、设备及存储介质,涉及深度学习、语音技术等人工智能技术领域,实现方案为:获取标注数据集;将标注数据集中同一文本内容对应的标注情感标签进行融合,以确定文本内容对应的标注情感标签分布;将文本内容输入初始预测模型,以获取初始预测模型输出的预测情感标签分布;基于文本内容对应的标注情感标签分布与预测情感标签分布间的第一差异,对初始预测模型进行修正,以生成情感预测模型。由此,通过利用包含文本内容及其对应的情感标签分布的数据集,训练情感预测模型,从而可以生成用于预测文本内容对应的情感分布的模型,为更准确的生成文本内容对应的音频数据提供了条件。成文本内容对应的音频数据提供了条件。成文本内容对应的音频数据提供了条件。

【技术实现步骤摘要】
情感预测模型的训练方法、装置、设备及存储介质


[0001]本公开涉及计算机
,更具体的,涉及深度学习、语音技术等人工智能
,尤其涉及一种情感预测模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]随着计算机技术和通信技术的发展,有声读物变得越来越普及,该产品的性能十分依赖情感自动标注,即标注出读物中每句文本的情感风格。因此,如何准确的对读物中的文本内容进行情感标注,成为目前亟需解决的问题。

技术实现思路

[0003]本公开提供了一种用于情感预测模型的训练的方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种情感预测模型的训练方法,包括:
[0005]获取标注数据集,其中,所述标注数据集中包括多个文本内容及文本内容对应的标注情感标签;
[0006]将所述标注数据集中同一文本内容对应的标注情感标签进行融合,以确定文本内容对应的标注情感标签分布;
[0007]将所述文本内容输入初始预测模型,以获取所述初始预测模型输出的预测情感标签分布;
[0008]基于所述文本内容对应的标注情感标签分布与预测情感标签分布间的第一差异,对所述初始预测模型进行修正,以生成情感预测模型。
[0009]根据本公开的另一方面,提供了一种情感预测模型的训练装置,包括:
[0010]第一获取模块,用于获取标注数据集,其中,所述标注数据集中包括多个文本内容及文本内容对应的标注情感标签;
[0011]确定模块,用于将所述标注数据集中同一文本内容对应的标注情感标签进行融合,以确定文本内容对应的标注情感标签分布;
[0012]第二获取模块,用于将所述文本内容输入初始预测模型,以获取所述初始预测模型输出的预测情感标签分布;
[0013]修正模块,用于基于所述文本内容对应的标注情感标签分布与预测情感标签分布间的第一差异,对所述初始预测模型进行修正,以生成情感预测模型。
[0014]本公开第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请第一方面实施例提出的方法。
[0015]本公开第四方面实施例提出了一种非临时性计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如本申请第一方面实施例提出的方法。
[0016]本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行本公开第一方面实施例提出的方法。
[0017]本公开实施例中,首先获取标注数据集,其中,标注数据集中包括文本内容及每个文本内容对应的标注情感标签,然后将标注数据集中同一文本内容对应的标注情感标签进行融合,以确定文本内容对应的标注情感标签分布,之后将文本内容输入初始预测模型,以获取初始预测模型输出的预测情感标签分布,最后基于文本内容对应的标注情感标签分布与预测情感标签分布间的第一差异,对初始预测模型进行修正,以生成情感预测模型。由此,通过利用包含文本内容及其对应的情感标签分布的数据集,训练情感预测模型,从而可以生成用于预测文本内容对应的情感分布的模型,为更准确的生成文本内容对应的音频数据提供了条件。
[0018]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0020]图1为本公开一实施例所提供的情感预测模型的训练方法的流程示意图;
[0021]图2为本公开又一实施例所提供的情感预测模型的训练方法的流程示意图;
[0022]图3为本公开又一实施例所提供的情感预测模型的训练及使用过程示意图;
[0023]图4为本公开一实施例所提供的情感预测模型的训练装置的结构框图;
[0024]图5是用来实现本公开实施例的情感预测模型的训练方法的电子设备的框图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]本公开实施例涉及深度学习、语音技术、人工智能

[0027]其中,深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
[0028]语音技术是指在计算机领域中的关键技术有自动语音识别技术和语音合成技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。让计算机说话需要用到语音合成技术,其核心是文语转换技术,语音合成甚至已经应用到汽车的信息系统上,车主可以将下载到系统电脑中的文本文件、电子邮件、网络新闻或小说,转换成语音在车内收听。
[0029]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0030]本公开提供的一种情感预测模型的训练方法,该方法可以由本公开提供的一种情
感预测模型的训练装置执行,也可以由本公开提供的电子设备执行,其中,电子设备可以包括但不限于手机、台式电脑、平板电脑等终端设备,下面以由本公开提供的情感预测模型的训练装置来执行本公开提供的一种情感预测模型的训练方法,而不作为对本公开的限定,以下简称为“装置”。
[0031]本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
[0032]下面结合参考附图对本公开提供的情感预测模型的训练方法、装置、计算机设备及存储介质进行详细描述。
[0033]图1是根据本公开一实施例的一种情感预测模型的训练方法的流程示意图。
[0034]如图1所示,该情感预测模型的训练方法可以包括以下步骤:
[0035]步骤101,获取标注数据集,其中,标注数据集中包括多个文本内容及文本内容对应的标注情感标签。
[0036]可以理解的是,对于一些文学作品,比如小说和话剧剧本,其对应的文本内容,比如文中的对白,在被读者解读时可能是不尽相同,甚至是截然相反的。也即,文学作品的文本内容往本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情感预测模型的训练方法,包括:获取标注数据集,其中,所述标注数据集中包括多个文本内容及所述文本内容对应的标注情感标签;将所述标注数据集中同一文本内容对应的标注情感标签进行融合,以确定所述文本内容对应的标注情感标签分布;将所述文本内容输入初始预测模型,以获取所述初始预测模型输出的预测情感标签分布;基于所述文本内容对应的标注情感标签分布与预测情感标签分布间的第一差异,对所述初始预测模型进行修正,以生成情感预测模型。2.如权利要求1所述的方法,其中,所述将所述标注数据集中同一文本内容对应的标注情感标签进行融合,以确定所述文本内容对应的标注情感标签分布,包括:根据所述标注数据集中同一文本内容对应的每种标注情感标签的数量,确定所述同一文本内容对应的每种标注情感标签的得分;将所述同一文本内容对应的多种标注情感标签的得分进行归一化,以确定所述同一文本内容对应的标注情感标签分布,其中,所述标注情感标签分布中的各种情感标签对应的得分和为一。3.如权利要求1或2所述的方法,其中,所述对所述初始预测模型进行修正,包括:根据所述文本内容对应的标注情感标签分布,确定所述文本内容对应的参考情感标签;根据所述文本内容对应的预测情感标签分布,确定所述文本内容对应的预测情感标签;根据所述文本内容对应的参考情感标签与预测情感标签间的第二差异、及对应的标注情感标签分布与预测情感标签分布间的第一差异,对所述初始预测模型进行修正。4.如权利要求3所述的方法,其中,所述标注情感标签分布中包括各个情感标签对应的标注次数,所述根据所述文本内容对应的标注情感标签分布,确定所述文本内容对应的参考情感标签,包括:将所述文本内容对应的标注情感标签分布中标注次数最大的情感标签,确定为所述文本内容对应的参考情感标签;或者,在任一文本内容对应的标注情感标签分布中标注次数最大的情感标签为至少两个的情况下,将所述至少两个情感标签中在所述标注数据集中出现次数最多的一个,确定为所述任一文本内容对应的参考情感标签。5.如权利要求3所述的方法,其中,所述根据所述文本内容对应的参考情感标签与预测情感标签间的第二差异、及对应的标注情感标签分布与预测情感标签分布间的第一差异,对所述初始预测模型进行修正,包括:根据所述文本内容对应的标注情感标签分布与预测情感标签分布间的第一差异,确定第一修正梯度;根据所述文本内容对应的参考情感标签与预测情感标签间的第二差异,确定第二修正梯度;
基于所述第一修正梯度及所述第二修正梯度,对所述初始预测模型进行修正。6.如权利要求3所述的方法,其中,所述根据所述文本内容对应的参考情感标签与预测情感标签间的第二差异、及对应的标注情感标签分布与预测情感标签分布间的第一差异,对所述初始预测模型进行修正,包括:根据所述文本内容对应的标注情感标签分布与预测情感标签分布间的第一差异,对所述初始预测模型进行修正,以获取各个修正后的第一模型参数;根据所述文本内容对应的参考情感标签与预测情感标签间的第二差异,对所述初始预测模型进行修正,以获取各个修正后的第二模型参数;将所述各个修正后的第一模型参数及第二模型参数进行融合,以确定修正后的模型参数。7.一种情感预测模型的训练装置,包括:第一获取模块,用于获取标注数据集,其中,所述标注数据集中包括多个...

【专利技术属性】
技术研发人员:潘政林白洁李若铭
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1