信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：25308636 阅读：28 留言：0更新日期：2020-08-18 22:27

本发明专利技术提供了一种信息处理方法，包括：获取与名称预测模型的使用环境相匹配的第一训练样本，确定名称预测模型中的第一神经网络的初始参数和第二神经网络的初始参数；通过名称预测模型对特征集合进行处理，确定名称预测模型的不同神经网络对应的更新参数；根据名称预测模型的不同神经网络对应的更新参数，通过特征集合对所述名称预测模型的第一神经网络的参数和第二神经网络的参数分别进行迭代更新。本发明专利技术还提供了信息处理装置、电子设备及存储介质。本发明专利技术能够实现名称预测模型的泛化能力更强，提升名称预测模型的训练精度与训练速度，同时使得名称预测模型能够适应不同的使用场景，提升了名称备注的处理效率和准确率。

全部详细技术资料下载

【技术实现步骤摘要】
信息处理方法、装置、电子设备及存储介质
本专利技术涉及信息处理技术，尤其涉及信息处理方法、装置、电子设备及存储介质。
技术介绍
传统技术中，在通过社交软件产品对联系人进行备注的时候，仅能够由用户手动输入备注名称，或者通过群昵称(群名片)推荐备注名称的方式完成备注，不但不利于用户对数量较多的联系人同时进行名称备注，同时手工进行名称备注的速率与准确度都影响了用户的使用体验，为此，人工智能技术(AI，ArtificialIntelligence)提供了适当的文本处理进程的运行机制来支持上述应用的方案。其中，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能，在语音处理领域中，也就是通过利用数字计算机或者数字计算机控制的机器实现对自动化的对备注对象进行名称备注。
技术实现思路
有鉴于此，本专利技术实施例提供一种信息处理方法、装置、电子设备及存储介质，本专利技术实施例的技术方案是这样实现的：本专利技术实施例提供了一种信息处理方法，包括：获取与所述名称预测模型的使用环境相匹配的第一训练样本，其中，所述训练样本中包括相应目标用户的历史行为信息；对所述第一训练样本集合进行去噪处理，形成相应的第二训练样本集合，并提取与所述第二训练样本相匹配的特征集合；通过所述名称预测模型对所述特征集合进行处理，以确定名称预测模...

【技术保护点】
1.一种信息处理方法，其特征在于，所述方法包括：/n获取与所述名称预测模型的使用环境相匹配的第一训练样本，其中，所述训练样本中包括相应目标用户的历史行为信息；/n对所述第一训练样本集合进行去噪处理，形成相应的第二训练样本集合，并提取与所述第二训练样本相匹配的特征集合；/n通过所述名称预测模型对所述特征集合进行处理，以确定名称预测模型中的第一神经网络的初始参数和第二神经网络的初始参数；/n响应于所述第一神经网络的初始参数和所述第二神经网络的初始参数，通过所述名称预测模型对所述特征集合进行处理，确定所述名称预测模型的不同神经网络对应的更新参数；/n根据所述名称预测模型的不同神经网络对应的更新参数，通过所述特征集合对所述名称预测模型的第一神经网络的参数和第二神经网络的参数分别进行迭代更新，以实现通过所述名称预测模型确定与备注对象相匹配的备注名称。/n

【技术特征摘要】
1.一种信息处理方法，其特征在于，所述方法包括：
获取与所述名称预测模型的使用环境相匹配的第一训练样本，其中，所述训练样本中包括相应目标用户的历史行为信息；
对所述第一训练样本集合进行去噪处理，形成相应的第二训练样本集合，并提取与所述第二训练样本相匹配的特征集合；
通过所述名称预测模型对所述特征集合进行处理，以确定名称预测模型中的第一神经网络的初始参数和第二神经网络的初始参数；
响应于所述第一神经网络的初始参数和所述第二神经网络的初始参数，通过所述名称预测模型对所述特征集合进行处理，确定所述名称预测模型的不同神经网络对应的更新参数；
根据所述名称预测模型的不同神经网络对应的更新参数，通过所述特征集合对所述名称预测模型的第一神经网络的参数和第二神经网络的参数分别进行迭代更新，以实现通过所述名称预测模型确定与备注对象相匹配的备注名称。

2.根据权利要求1所述的方法，其特征在于，所述获取与所述名称预测模型的使用环境相匹配的第一训练样本，包括：
获取所述目标用户的日志信息；
基于所述目标用户的日志信息，确定所述目标用户使用所述名称预测模型所推荐的备注名称作为正例样本；
基于所述目标用户的日志信息，确定所述目标用户未使用所述名称预测模型所推荐的备注名称作为负例样本；
基于所述正例样本和所述负例样本，确定与所述名称预测模型的使用环境相匹配的第一训练样本。

3.根据权利要求1所述的方法，其特征在于，所述对所述第一训练样本集合进行去噪处理，形成相应的第二训练样本集合，并提取与所述第二训练样本相匹配的特征集合，包括：
确定与所述名称预测模型的使用环境相匹配的动态噪声阈值；
根据所述动态噪声阈值对所述第一训练样本集合进行去噪处理，以形成与所述动态噪声阈值相匹配的第二训练样本集合；
提取与所述第二训练样本相匹配的词语级特征向量，并对所述不同的词语级特征向量进行除噪处理，形成与所待备注名称文本内容相对应的词语级特征向量集合，其中，所述与所待备注名称文本内容相对应的词语级特征向量集合包括所述待备注名称文本内容的数据来源。

4.根据权利要求1所述的方法，其特征在于，所述对所述第一训练样本集合进行去噪处理，形成相应的第二训练样本集合，并提取与所述第二训练样本相匹配的特征集合，包括：
确定与所述名称预测模型的使用环境相匹配的固定噪声阈值；
根据所述固定噪声阈值对所述第一训练样本集合进行去噪处理，以形成与所述固定噪声阈值相匹配的第二训练样本集合；
提取与所述第二训练样本相匹配的词语级特征向量，并对所述不同的词语级特征向量进行除噪处理，形成与所待备注名称文本内容相对应的词语级特征向量集合，其中，所述与所待备注名称文本内容相对应的词语级特征向量集合包括所述待备注名称文本内容的数据来源。

5.根据权利要求1所述的方法，其特征在于，所述响应于所述第一神经网络的初始参数和所述第二神经网络的初始参数，通过所述名称预测模型对所述特征集合进行处理，确定所述名称预测模型的不同神经网络对应的更新参数，包括：
将所述特征集合中不同备注名称向量，代入由所述名称预测模型的第一神经网络的编码器和解码器构成的自编码网络对应的损失函数；
确定所述损失函数满足第一收敛条件时对应所述第一神经网络的编码器的参数和相应的解码器参数作为所述第一神经网络的更新参数；
将所述特征集合中不同语句样本，代入由所述名称预测模型的第二神经网络的编码器和解码器构成的自编码网络对应的损失函数；
确定所述损失函数满足第二收敛条件时对应所述第二神经网络的编码器的参数和相应的解码器参数作为所述第二神经网络的更新参数。

6.根据权利要求5所述的方法，其特征在于，所述根据所述名称预测模型的不同神经网络对应的更新参数，通过所述特征集合对所述名称预测模型的第一神经网络的参数和第二神经网络的参数分别进行迭代更新，以实现通过所述名称预测模型确定与备注对象相匹配的备注名称，包括：
确定与所述名称预测模型中不同神经网络相匹配的收敛条件；
对所述第一神经网络的编码器参数和解码器参数进行迭代更新，直至所述第一神经网络的编码器和解码器构成的自编码网络对应的损失函数满足对应的收敛条件；
对所述第二神经网络的编码器参数和解码器参数进行迭代更新，直至所述第二神经网络的编码器和解码器构成的自编码网络对应的损失函数满足对应的收敛条件。

7.根据权利要求1-6...

【专利技术属性】
技术研发人员：田植良，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人