模型训练方法及装置和语句情感识别方法及装置制造方法及图纸

技术编号：15616628 阅读：200 留言：0更新日期：2017-06-14 03:30

本申请公开了一种模型训练方法及装置和语句情感识别方法及装置。其中，该模型训练方法包括：获取带有情感标记的文本信息，其中，文本信息包括按照预先定义的情感类型标记的多条语句，每条语句携带有与其对应的情感标记；确定文本信息中每条语句对应的语句向量，其中，语句向量为用于唯一表示对应的语句的多维数组；将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络，训练得到神经网络模型，其中，神经网络模型用于识别语句中的情感类型。本申请解决了现有技术中对语句中所包含的情感识别准确性低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法及装置和语句情感识别方法及装置
本申请涉及文本处理领域，具体而言，涉及一种模型训练方法及装置和语句情感识别方法及装置。
技术介绍
用户输入的语句中通常蕴含用户的情感，现有技术中主要根据语句中的情感关键词或者标点符号、表情符号等来识别语句的情感。然而，当分析的该语句中没有出现情感类词语或者机器不好识别的情感时，这种识别方式准确率比较低，比如：你不会唱歌？该句是悲伤、愤怒还是高兴的情感，需要结合上下文理解，在“你不会唱歌？真没用！”，“你不会唱歌？好可惜”，“你不会唱歌？好啊，我也不会，他们唱，我们玩。”分别表示愤怒、悲伤、高兴的情感。而该语句中并没有包含有明确的情感倾向的词语，因此，现有技术中无法识别出这些语句的情感。针对上述的问题，目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种模型训练方法及装置和语句情感识别方法及装置，以至少解决现有技术中对语句中所包含的情感识别准确性低的技术问题。根据本申请实施例的一个方面，提供了一种模型训练方法，其特征在于，包括：获取带有情感标记的文本信息，其中，所述文本信息包括按照预先定义的情感类型标记的多条语句，每条语句携带有与其对应的情感标记；确定所述文本信息中每条语句对应的语句向量，其中，所述语句向量为用于唯一表示对应的语句的多维数组；将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络，训练得到神经网络模型，其中，所述神经网络模型用于识别语句中的情感类型。进一步地，确定所述文本信息中每条语句对应的语句向量包括：对所述文本信息中每条语句进行分词处理；查找每条语句分词后的每个词语对应的词向量，...
模型训练方法及装置和语句情感识别方法及装置

【技术保护点】
一种模型训练方法，其特征在于，包括：获取带有情感标记的文本信息，其中，所述文本信息包括按照预先定义的情感类型标记的多条语句，每条语句携带有与其对应的情感标记；确定所述文本信息中每条语句对应的语句向量，其中，所述语句向量为用于唯一表示对应的语句的多维数组；将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络，训练得到神经网络模型，其中，所述神经网络模型用于识别语句中的情感类型。

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取带有情感标记的文本信息，其中，所述文本信息包括按照预先定义的情感类型标记的多条语句，每条语句携带有与其对应的情感标记；确定所述文本信息中每条语句对应的语句向量，其中，所述语句向量为用于唯一表示对应的语句的多维数组；将每条语句对应的情感标记及其对应的语句向量输入到循环神经网络，训练得到神经网络模型，其中，所述神经网络模型用于识别语句中的情感类型。2.根据权利要求1所述的模型训练方法，其特征在于，确定所述文本信息中每条语句对应的语句向量包括：对所述文本信息中每条语句进行分词处理；查找每条语句分词后的每个词语对应的词向量，其中，所述词向量为用于唯一表示对应的词语的多维数组；根据每条语句中每个词语对应的词向量确定出相应语句的语句向量。3.根据权利要求2所述的模型训练方法，其特征在于，在查找每条语句分词后的每个词语对应的词向量之前，所述模型训练方法还包括：采集预设数据量的文本信息，得到文本信息集合；利用机器学习方式生成所述文本信息集合中每个词语的词向量，得到词向量集；其中，查找每条语句分词后的每个词语对应的词向量包括：从所述词向量集中查找出所述分词后的每个词语对应的词向量。4.根据权利要求2所述的模型训练方法，其特征在于，根据每条语句中每个词语对应的词向量确定出相应语句的语句向量包括：对于每条语句，将其包含的所有词语对应的词向量相加，得到词向量和，其中，词向量相加是指词向量中相应位置的数值加和得到的与词向量具有相同数量维度的向量；将所述词向量和除以词语的个数，得到所述语句向量，其中，所述词向量和除以词语的个数是指所述词向量和中每个位置的数值除以词语的个数。5.一种语句情感识别方法，其特征在于，包括：确定待测文本中每条语句对应的语句向量；将待测文本中每条语句对应的语句向量输入到权利要求1至4中任一项所述的模型训练方法训练得到的神经网络模型中，利用所述神经网络模型识别出所述待测文本中每条语句的情感类型。6.一种模型训练装置，其特征在于，包括...

【专利技术属性】
技术研发人员：刘粉香，
申请(专利权)人：北京国双科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人