【技术实现步骤摘要】
基于人工智能的文本推荐方法、装置及电子设备
本专利技术涉及人工智能技术,尤其涉及一种基于人工智能的文本推荐方法、装置、电子设备及计算机可读存储介质。
技术介绍
人工智能(AI,ArtificialIntelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。自然语言处理(NLP,NatureLanguageprocessing)是人工智能领域中的一个重要方向,主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。文本推荐是自然语言处理的一个重要应用,具体如新闻推荐及广告推荐等。在相关技术提供的方案中,通常是将用户历史触发的文本输入至word2vec模型或其他模型中进行训练,得到文本的向量表示,再根据向量表示计算与历史触发的某个文本较为相似的文本,并推荐给用户。但是,通过该种方式,推荐的文本基本与历史触发的文本极其相似,容易使用户产生视觉疲劳,文本推荐的准确性较低。
技术实现思路
本专利 ...
【技术保护点】
1.一种基于人工智能的文本推荐方法,其特征在于,包括:/n根据待推荐用户的文本触发序列中的文本的属性,将所述文本触发序列拆分为多个子序列;其中,每个所述子序列包括的文本的属性相同;/n将任意两个所述子序列组合为序列样本,并根据所述序列样本预测所述序列样本中位于预测位置的文本、以及所述序列样本中子序列之间的关联关系,以形成预测结果;/n根据所述预测结果与实际结果之间的差异,更新所述序列样本中的文本的向量表示;/n根据所述序列样本中的文本的向量表示,确定所述文本触发序列中的文本与数据库中的文本之间的相似度,并/n根据所述相似度,在所述数据库中的多个文本中筛选出对应所述待推荐用户的待推荐文本。/n
【技术特征摘要】
1.一种基于人工智能的文本推荐方法,其特征在于,包括:
根据待推荐用户的文本触发序列中的文本的属性,将所述文本触发序列拆分为多个子序列;其中,每个所述子序列包括的文本的属性相同;
将任意两个所述子序列组合为序列样本,并根据所述序列样本预测所述序列样本中位于预测位置的文本、以及所述序列样本中子序列之间的关联关系,以形成预测结果;
根据所述预测结果与实际结果之间的差异,更新所述序列样本中的文本的向量表示;
根据所述序列样本中的文本的向量表示,确定所述文本触发序列中的文本与数据库中的文本之间的相似度,并
根据所述相似度,在所述数据库中的多个文本中筛选出对应所述待推荐用户的待推荐文本。
2.根据权利要求1所述的文本推荐方法,其特征在于,
所述根据所述序列样本预测所述序列样本中位于预测位置的文本、以及所述序列样本中子序列之间的关联关系,以形成预测结果,包括:
对所述序列样本中的每个文本进行映射处理,得到所述文本的向量表示;
通过语言表示模型,对所述序列样本中的文本的向量表示进行预测处理,以形成与所述序列样本中位于预测位置的文本、以及所述序列样本中子序列之间的关联关系对应的预测结果;
所述根据所述预测结果与实际结果之间的差异,更新所述序列样本中的文本的向量表示,包括:
根据所述预测结果与实际结果之间的差异,在所述语言表示模型中进行反向传播,并
在反向传播的过程中,更新所述序列样本中的文本的向量表示。
3.根据权利要求2所述的文本推荐方法,其特征在于,所述对所述序列样本中的每个文本进行映射处理,得到所述文本的向量表示,包括:
对所述序列样本中的每个文本进行向量初始化处理,得到所述文本的文本向量表示;
对所述序列样本中每个文本的属性进行向量初始化处理,得到所述文本的属性向量表示;
对所述序列样本中每个文本所在的位置进行向量初始化处理,得到所述文本的位置向量表示;
将所述文本的文本向量表示、属性向量表示及位置向量表示进行融合处理,得到所述文本的向量表示。
4.根据权利要求3所述的文本推荐方法,其特征在于,所述根据所述序列样本中的文本的向量表示,确定所述文本触发序列中的文本与数据库中的文本之间的相似度,包括:
执行以下任意一种处理以得到所述相似度:
根据所述序列样本中的文本的文本向量表示,确定所述文本触发序列中的文本与所述数据库中的文本之间的相似度;
根据所述序列样本中的文本的属性向量表示,确定所述文本触发序列中的文本与所述数据库中的文本之间的第一相似度,并
根据所述序列样本中的文本的文本向量表示,确定所述文本触发序列中的文本与所述数据库中的文本之间的第二相似度,将所述第一相似度与所述第二相似度进行加权平均的结果,作为所述文本触发序列中的文本与所述数据库中的文本之间的相似度。
5.根据权利要求2所述的文本推荐方法,其特征在于,所述通过语言表示模型,对所述序列样本中的文本的向量表示进行预测处理之前,还包括:
随机将所述序列样本中文本所在的位置确定为预测位置,直至所述预测位置对应的文本所占的比例达到预测比例;
对所述预测位置对应的文本执行屏蔽处理、替换处理及保留处理中的一种处理;
在所述序列样本前添加分类标识;
其中,所述分类标识用于使所述语言表示模型学习所述序列样本中子序列之间的关联关系。
6.根据权利要求5所述的文本推荐方法,其特征在于,所述通过语言表示模型,对所述序列样本中的文本的向量表示进行预测处理,以形成与所述序列样本中位于预测位置的文本、以及所述序列样本中子序列之间的关联关系对应的预测结果,包括:
通过所述语言表示模型,对所述序列样本中的文本的向量表示进行预测处理,得到与所述预测位置对应的输出向量、以及与分类标识对应的输出向量;
对所述预测位置对应的输出向量进行分类处理,得到与所述序列样本中位于预测位置的文本对应的预测结果;
对所述分类标识对应的输出向量进行分类处理,得到与所述序列样本中子序列之间的关联关系对应的预测结果。
7.根据权利要求2所述的文本推荐方法,其特征在于,所述根据所述预测结果与实际结果之间的差异,在所述语言表示模型中进行反向传播,包括:
根据所述语言表示模型的第一损失函数,确定所述序列样本中位于预测位置的文本对应的预测结...
【专利技术属性】
技术研发人员:杜颖,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。