资讯去重方法、装置、电子设备及计算机可读取存储介质制造方法及图纸

技术编号：35030622 阅读：23 留言：0更新日期：2022-09-24 23:04

本申请提供一种资讯去重方法、装置、电子设备及计算机可读取存储介质，涉及数据处理技术领域。该方法包括：对资讯文本进行处理，得到当前文本向量；对当前文本向量进行验证，若对当前文本向量验证通过，将当前文本向量作为目标文本向量；若对当前文本向量验证未通过，则对当前文本向量进行更新，以得到目标文本向量；基于去重阈值对目标文本向量去重，得到目标资讯文本。本申请能够通过对推荐的资讯文本进行处理、验证、更新等方式，将得到的目标文本向量进行去重，从而得到去重后用于推荐给用户的目标资讯文本，能够对体量较长、维度较广、多种不同环境下的资讯文本都进行去重，有效地减少推荐的资讯中重复、冗余的内容，提高了去重的精度。的精度。的精度。

全部详细技术资料下载

【技术实现步骤摘要】
资讯去重方法、装置、电子设备及计算机可读取存储介质

[0001]本申请涉及数据处理
，具体而言，涉及一种资讯去重方法、装置、电子设备及计算机可读取存储介质。

技术介绍

[0002]近年来，金融市场受到人们的关注越来越高，各大金融公司，例如各种银行每天可以向用户提供成千上万条的金融资讯供用户浏览。在对银行资讯进行推荐时，可以根据用户的历史行为、身份标签、兴趣属性等数据特征来对相关的资讯进行推荐。但是，推荐过程中容易出现重复、冗余的内容，导致对资讯的推荐效率较低，用户无法准确地获取感兴趣的资讯。

技术实现思路

[0003]有鉴于此，本申请实施例的目的在于提供一种资讯去重方法、装置、电子设备及计算机可读取存储介质，以改善现有技术中存在的推荐的资讯文本中重复内容较多问题。
[0004]为了解决上述问题，第一方面，本申请实施例提供了一种资讯去重方法，所述方法包括：对资讯文本进行处理，得到当前文本向量；对所述当前文本向量进行验证，若对所述当前文本向量验证通过，将所述当前文本向量作为目标文本向量；若对所述当前文本向量验证未通过，则对所述当前文本向量进行更新，以得到目标文本向量；基于去重阈值对所述目标文本向量去重，得到目标资讯文本。
[0005]在上述实现过程中，为了对资讯文本中存在的重复内容进行去除，可以先对资讯文本进行向量化地处理，从而得到当前文本向量，并通过对当前文本向量进行验证，以根据验证结果确定处理后能够进行去重的目标文本向量，根据去重阈值对目标文本向量进行去重。能够对体量较长、维度较...

【技术保护点】

【技术特征摘要】
1.一种资讯去重方法，其特征在于，所述方法包括：对资讯文本进行处理，得到当前文本向量；对所述当前文本向量进行验证，若对所述当前文本向量验证通过，将所述当前文本向量作为目标文本向量；若对所述当前文本向量验证未通过，则对所述当前文本向量进行更新，以得到目标文本向量；基于去重阈值对所述目标文本向量去重，得到目标资讯文本。2.根据权利要求1所述的方法，其特征在于，所述对资讯文本进行处理，得到当前文本向量，包括：根据文本处理模型对资讯文本进行处理，得到所述当前文本向量；所述对所述当前文本向量进行更新，以得到目标文本向量，包括：对所述文本处理模型进行更新，确定更新处理模型；根据所述更新处理模型对所述当前文本向量进行更新，以得到所述目标文本向量。3.根据权利要求2所述的方法，其特征在于，所述文本处理模型包括摘要模型、对比模型和降维模型；所述根据文本处理模型对资讯文本进行处理，得到所述当前文本向量，包括：根据所述摘要模型对资讯文本进行提取，得到文本摘要；根据所述对比模型对所述文本摘要进行向量提取，得到初始向量；根据所述降维模型对所述初始向量进行降维，得到所述当前文本向量。4.根据权利要求3所述的方法，其特征在于，所述根据所述对比模型对所述文本摘要进行向量提取，得到初始向量之前，所述方法还包括：获取资讯文本训练集，其中，所述资讯文本训练集中包括多条历史资讯文本的语料文本；根据资讯文本训练集对所述对比模型进行对比训练。5.根据权利要求3所述的方法，其特征在于，所述对所述文本处理模型进行更新，确定更新处理模型，包括：根据所述当前文本向量对所述对比模型的第一模型参数进行调整，得到第一调整模型参数；根据所述第一调整模型参数对应的所述对比模型、所述摘要模型和所述降维模型对所述资讯文本进行处理，得到第一调整文本向量；基于所述第一调整文本向量对所述摘要模型的第二模型参数进行调整，得到第二调整模型参数；根据所述第一调整模型参数对应的所述对比模型、所述第二调整模型参数对应的所述摘要模型和所述降维模型对所述资讯文本进行处理，得到第二调整文本向量；基于所述第二调整文本向量对所述降维模型的第三模型参数进行调整，得到第三调整模型参数，以所述第一调整模型参数对应的所述对比模型、所述第二调整模型参数对应的所述摘要模型和所述第三调整模型参数对应的所述降维模型作为所述更新处理模型。6.根据权利要求5所述的方法，其特征在于，所述根据所述更新处理模型对所述当前文本向量进行更新，以得到所述目标文本向量，包括：
根据所述第一调整模型参数对应的所述对比模型、所述第二调整模型参数对应的所述...

【专利技术属性】
技术研发人员：李珊，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人