用于生成信息的方法和装置制造方法及图纸

技术编号：26259375 阅读：28 留言：0更新日期：2020-11-06 17:53

本公开的实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括：获取目标呈现用信息关联的文本作为目标文本；将目标文本输入预先训练的文本特征提取模型，获得目标文本所对应的文本特征向量；基于文本特征向量，生成目标呈现用信息对应的目标特征向量。该实施方式为呈现用信息的后续处理提供了支持；并且，可以提取出更多的信息特征，有助于利用所提取的特征，更为准确、有效地表征呈现用信息的内容。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成信息的方法和装置
本公开的实施例涉及计算机
，尤其涉及用于生成信息的方法和装置。
技术介绍
随着科技的发展，用户可以使用手机、电脑等电子设备浏览呈现用信息。呈现用信息可以是包括文本的、用于呈现给用户的信息(例如广告、新闻等)。实践中，存在很多需要提取呈现用信息的特征的场景，例如，为了实现个性化的信息推荐，需要提取呈现用信息的特征，以与用户特征进行匹配。目前，通常提取呈现用信息包括的文本中的关键词的特征作为呈现用信息的特征。
技术实现思路
本公开的实施例提出了用于生成信息的方法和装置。第一方面，本公开的实施例提供了一种用于生成信息的方法，该方法包括：获取目标呈现用信息关联的文本作为目标文本；将目标文本输入预先训练的文本特征提取模型，获得目标文本所对应的文本特征向量；基于文本特征向量，生成目标呈现用信息对应的目标特征向量。在一些实施例中，文本特征提取模型通过以下步骤训练获得：获取预置的样本呈现用信息集合；对于样本呈现用信息集合中的样本呈现用信息，提取该样本呈现用信...

【技术保护点】
1.一种用于生成信息的方法，包括：/n获取目标呈现用信息关联的文本作为目标文本；/n将所述目标文本输入预先训练的文本特征提取模型，获得所述目标文本所对应的文本特征向量；/n基于所述文本特征向量，生成所述目标呈现用信息对应的目标特征向量。/n

【技术特征摘要】
1.一种用于生成信息的方法，包括：
获取目标呈现用信息关联的文本作为目标文本；
将所述目标文本输入预先训练的文本特征提取模型，获得所述目标文本所对应的文本特征向量；
基于所述文本特征向量，生成所述目标呈现用信息对应的目标特征向量。

2.根据权利要求1所述的方法，其中，所述文本特征提取模型通过以下步骤训练获得：
获取预置的样本呈现用信息集合；
对于所述样本呈现用信息集合中的样本呈现用信息，提取该样本呈现用信息关联的两个样本文本组成第一样本文本组；将该样本呈现用信息关联的一个样本文本和其他样本呈现用信息关联的一个样本文本组成第二样本文本组；
获取初始文本匹配模型，其中，初始文本匹配模型包括初始文本特征提取模型和初始相似度计算模型，所述初始文本特征提取模型用于提取所输入的文本的文本特征向量，所述初始相似度计算模型用于对所输入的两个文本特征向量进行相似度计算；
将所组成的第一样本文本组作为正样本，将所组成的第二样本文本组作为负样本，对初始文本匹配模型进行训练，以获得训练完成的文本匹配模型，其中，训练完成的文本匹配模型包括训练完成的文本特征提取模型。

3.根据权利要求2所述的方法，其中，所述将所组成的第一样本文本组作为正样本，将所组成的第二样本文本组作为负样本，对初始文本匹配模型进行训练包括：
分别将正样本和负样本输入初始文本匹配模型，获得正样本对应的第一相似度预估值和负样本对应的第二相似度预估值；
对所述第一相似度预估值和所述第二相似度预估值进行求差，获得预估正负样本差异值；
确定所述预估正负样本差异值相对于预设正负样本差异值的损失值；
利用所确定的损失值，对初始文本匹配模型进行训练。

4.根据权利要求1所述的方法，其中，所述获取目标呈现用信息关联的文本作为目标文本包括：
获取目标呈现用信息关联的至少两个文本作为至少两个目标文本；以及
所述将所述目标文...

【专利技术属性】
技术研发人员：周旻平，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人