模型训练方法及装置和语句情感识别方法及装置制造方法及图纸

技术编号:15616628 阅读:200 留言:0更新日期:2017-06-14 03:30
本申请公开了一种模型训练方法及装置和语句情感识别方法及装置。其中,该模型训练方法包括:获取带有情感标记的文本信息,其中,文本信息包括按照预先定义的情感类型标记的多条语句,每条语句携带有与其对应的情感标记;确定文本信息中每条语句对应的语句向量,其中,语句向量为用于唯一表示对应的语句的多维数组;将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络,训练得到神经网络模型,其中,神经网络模型用于识别语句中的情感类型。本申请解决了现有技术中对语句中所包含的情感识别准确性低的技术问题。

【技术实现步骤摘要】
模型训练方法及装置和语句情感识别方法及装置
本申请涉及文本处理领域,具体而言,涉及一种模型训练方法及装置和语句情感识别方法及装置。
技术介绍
用户输入的语句中通常蕴含用户的情感,现有技术中主要根据语句中的情感关键词或者标点符号、表情符号等来识别语句的情感。然而,当分析的该语句中没有出现情感类词语或者机器不好识别的情感时,这种识别方式准确率比较低,比如:你不会唱歌?该句是悲伤、愤怒还是高兴的情感,需要结合上下文理解,在“你不会唱歌?真没用!”,“你不会唱歌?好可惜”,“你不会唱歌?好啊,我也不会,他们唱,我们玩。”分别表示愤怒、悲伤、高兴的情感。而该语句中并没有包含有明确的情感倾向的词语,因此,现有技术中无法识别出这些语句的情感。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种模型训练方法及装置和语句情感识别方法及装置,以至少解决现有技术中对语句中所包含的情感识别准确性低的技术问题。根据本申请实施例的一个方面,提供了一种模型训练方法,其特征在于,包括:获取带有情感标记的文本信息,其中,所述文本信息包括按照预先定义的情感类型标记的多条语句,每条语句携带有与其对应的情感标记;确定所述文本信息中每条语句对应的语句向量,其中,所述语句向量为用于唯一表示对应的语句的多维数组;将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络,训练得到神经网络模型,其中,所述神经网络模型用于识别语句中的情感类型。进一步地,确定所述文本信息中每条语句对应的语句向量包括:对所述文本信息中每条语句进行分词处理;查找每条语句分词后的每个词语对应的词向量,其中,所述词向量为用于唯一表示对应的词语的多维数组;根据每条语句中每个词语对应的词向量确定出相应语句的语句向量。进一步地,在查找每条语句分词后的每个词语对应的词向量之前,所述模型训练方法还包括:采集预设数据量的文本信息,得到文本信息集合;利用机器学习方式生成所述文本信息集合中每个词语的词向量,得到词向量集;其中,查找每条语句分词后的每个词语对应的词向量包括:从所述词向量集中查找出所述分词后的每个词语对应的词向量。进一步地,根据每条语句中每个词语对应的词向量确定出相应语句的语句向量包括:对于每条语句,将其包含的所有词语对应的词向量相加,得到词向量和,其中,词向量相加是指词向量中相应位置的数值加和得到的与词向量具有相同数量维度的向量;将所述词向量和除以词语的个数,得到所述语句向量,其中,所述词向量和除以词语的个数是指所述词向量和中每个位置的数值除以词语的个数。根据本申请实施例的另一方面,还提供了一种语句情感识别方法,包括:确定待测文本中每条语句对应的语句向量;将待测文本中每条语句对应的语句向量输入到神经网络模型中,利用所述神经网络模型识别出所述待测文本中每条语句的情感类型。根据本申请实施例的另一方面,还提供了一种模型训练装置,包括:获取单元,用于获取带有情感标记的文本信息,其中,所述文本信息包括按照预先定义的情感类型标记的多条语句,每条语句携带有与其对应的情感标记;确定单元,用于确定所述文本信息中每条语句对应的语句向量,其中,所述语句向量为用于唯一表示对应的语句的多维数组;训练单元,用于将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络,训练得到神经网络模型,其中,所述神经网络模型用于识别语句中的情感类型。进一步地,所述确定单元包括:分词模块,用于对所述文本信息中每条语句进行分词处理;查询模块,用于查找每条语句分词后的每个词语对应的词向量,其中,所述词向量为用于唯一表示对应的词语的多维数组;确定模块,用于根据每条语句中每个词语对应的词向量确定出相应语句的语句向量。进一步地,所述模型训练装置还包括:采集单元,用于在查找每条语句分词后的每个词语对应的词向量之前,采集预设数据量的文本信息,得到文本信息集合;生成单元,用于利用机器学习方式生成所述文本信息集合中每个词语的词向量,得到词向量集;其中,所述查询模块具体用于从所述词向量集中查找出所述分词后的每个词语对应的词向量。进一步地,所述确定模块包括:第一计算子模块,用于对于每条语句,将其包含的所有词语对应的词向量相加,得到词向量和,其中,词向量相加是指词向量中相应位置的数值加和得到的与词向量具有相同数量维度的向量;第二计算子模块,用于将所述词向量和除以词语的个数,得到所述语句向量,其中,所述词向量和除以词语的个数是指所述词向量和中每个位置的数值除以词语的个数。根据本申请实施例的另一方面,还提供了一种语句情感识别装置,包括:向量确定单元,用于确定待测文本中每条语句对应的语句向量;识别单元,用于将待测文本中每条语句对应的语句向量输入到神经网络模型中,利用所述神经网络模型识别出所述待测文本中每条语句的情感类型。根据本申请实施例,获取带有情感标记的文本信息,其中,文本信息包括按照预先定义的情感类型标记的多条语句,每条语句携带有与其对应的情感标记;确定文本信息中每条语句对应的语句向量,其中,语句向量为用于唯一表示对应的语句的多维数组;将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络,训练得到神经网络模型,以便于利用神经网络模型来识别语句中的情感类型,解决了现有技术中对语句中所包含的情感识别准确性低的技术问题,达到了提高语句中情感识别准确率的效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的模型训练方法的流程图;图2是根据本申请实施例的语句情感识别方法的流程图;图3是根据本申请实施例的模型训练装置的示意图;图4是根据本申请实施例的语句情感识别装置的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本申请实施例,提供了一种模型训练方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本申请实施例的模型训练方法的流程图,如图1所示,该方法包括如下步骤:步骤S102,获取带有情感标记的文本信息,其中,文本信息包括按照预先定本文档来自技高网
...
模型训练方法及装置和语句情感识别方法及装置

【技术保护点】
一种模型训练方法,其特征在于,包括:获取带有情感标记的文本信息,其中,所述文本信息包括按照预先定义的情感类型标记的多条语句,每条语句携带有与其对应的情感标记;确定所述文本信息中每条语句对应的语句向量,其中,所述语句向量为用于唯一表示对应的语句的多维数组;将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络,训练得到神经网络模型,其中,所述神经网络模型用于识别语句中的情感类型。

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取带有情感标记的文本信息,其中,所述文本信息包括按照预先定义的情感类型标记的多条语句,每条语句携带有与其对应的情感标记;确定所述文本信息中每条语句对应的语句向量,其中,所述语句向量为用于唯一表示对应的语句的多维数组;将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络,训练得到神经网络模型,其中,所述神经网络模型用于识别语句中的情感类型。2.根据权利要求1所述的模型训练方法,其特征在于,确定所述文本信息中每条语句对应的语句向量包括:对所述文本信息中每条语句进行分词处理;查找每条语句分词后的每个词语对应的词向量,其中,所述词向量为用于唯一表示对应的词语的多维数组;根据每条语句中每个词语对应的词向量确定出相应语句的语句向量。3.根据权利要求2所述的模型训练方法,其特征在于,在查找每条语句分词后的每个词语对应的词向量之前,所述模型训练方法还包括:采集预设数据量的文本信息,得到文本信息集合;利用机器学习方式生成所述文本信息集合中每个词语的词向量,得到词向量集;其中,查找每条语句分词后的每个词语对应的词向量包括:从所述词向量集中查找出所述分词后的每个词语对应的词向量。4.根据权利要求2所述的模型训练方法,其特征在于,根据每条语句中每个词语对应的词向量确定出相应语句的语句向量包括:对于每条语句,将其包含的所有词语对应的词向量相加,得到词向量和,其中,词向量相加是指词向量中相应位置的数值加和得到的与词向量具有相同数量维度的向量;将所述词向量和除以词语的个数,得到所述语句向量,其中,所述词向量和除以词语的个数是指所述词向量和中每个位置的数值除以词语的个数。5.一种语句情感识别方法,其特征在于,包括:确定待测文本中每条语句对应的语句向量;将待测文本中每条语句对应的语句向量输入到权利要求1至4中任一项所述的模型训练方法训练得到的神经网络模型中,利用所述神经网络模型识别出所述待测文本中每条语句的情感类型。6.一种模型训练装置,其特征在于,包括...

【专利技术属性】
技术研发人员:刘粉香
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1