内容建联方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38819540 阅读:11 留言:0更新日期:2023-09-15 19:58
本申请涉及一种内容建联方法、装置、计算机设备和存储介质。所述方法包括:获取资讯文本数据和产品服务文本描述数据,进行分词处理,得到文本数据集合;对所述文本数据集合中的资讯文本数据进行向量化,得到第一语义特征向量和第二语义特征向量;针对标签词,采用语义向量模型训练得到标签词对应的标签语义向量,以及标签语义向量列表;将资讯文本数据和产品服务文本描述数据对应的文本标签和标签语义向量存储在内存数据库中;在线检索时,通过查询资讯文本的文本标签对应的标签语义向量,得到相似文本列表,从相似文本列表选择最终建联的产品服务文本列表。采用本方法能够提高建联的准确性。高建联的准确性。高建联的准确性。

【技术实现步骤摘要】
内容建联方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种内容建联方法、装置、计算机设备和存储介质。

技术介绍

[0002]内容

产品/服务建联是指在信息流推荐场景下,将资讯内容跟实际业务中的产品或服务相互关联,使得资讯内容与产品/服务之间形成有机的联系。产品/服务可以通过内容来宣传自己的特点和优势,而内容/服务也可以通过产品来传达自己的价值和意义。通过内容

产品/服务建联,可以提高产品的知名度和认可度,同时也可以提升内容的传播效果和影响力。有效的内容

产品/服务建联体系既可以提升资讯内容消费转化,也可以降低内容运营的复杂度。
[0003]目前,内容建联方法基本是通过标签把特定的内容与服务进行匹配关联,并没有考虑产品/服务实际的内容,从而导致内容建联的准确度不高,后续维护效率低下。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够内容建联方法、装置、计算机设备和存储介质。
[0005]一种内容建联方法,所述方法包括:获取资讯文本数据和产品服务文本描述数据,对所述资讯文本数据和产品服务文本描述数据进行分词处理,得到文本数据集合;对所述文本数据集合中的资讯文本数据进行向量化,得到所述资讯文本数据的标签对应的第一语义特征向量,对所述文本数据集合中的产品服务文本描述数据进行向量化,得到产品服务文本描述数据的标签对应的第二语义特征向量;针对所述第一语义特征向量和所述第二语义特征向量对应的标签词,采用语义向量模型训练得到所述标签词对应的标签语义向量,以及标签语义向量列表;将所述资讯文本数据和产品服务文本描述数据对应的文本标签和所述标签语义向量采用Key

Value方式存储在内存数据库中;在线检索时,通过查询资讯文本的文本标签对应的标签语义向量,得到相似文本列表,从所述相似文本列表选择最终建联的资讯文本和/或产品服务文本列表。
[0006]在其中一个实施例中,所述资讯文本数据包括:标题、文本内容的文本数据,所述产品服务文本描述数据包括:名称、描述、所属行业、类型的描述数据。
[0007]在其中一个实施例中,还包括:获取所述标签词对应的多个所述第一语义特征向量和所述第二语义特征向量;通过Word2Vec方式对所述第一语义特征向量和所述第二语义特征向量进行训练,生成标签词的标签语义向量。
[0008]在其中一个实施例中,还包括:对内存数据库中存储的数据的标签变化进行全量数据更新。
[0009]在其中一个实施例中,还包括:提取待检索资讯文本的标签词,根据所述标签词从所述内存数据库中检索标签词对应的标签语义向量,得到标签列表;获取所述待检索资讯文本的语义向量,根据所述语义向量在所述内存数据库进行语义检索,得到标签相似度列表;根据所述标签列表和标签相似度列表,排序得到最终建联的资讯文本和/或产品服务文本列表。
[0010]在其中一个实施例中,所述待检索资讯文本包含多个标签词;还包括:提取待检索资讯文本的多个标签词,依次将每个所述标签词在所述内存数据库中检索标签词对应的标签语义向量,得到标签列表。
[0011]一种内容建联装置,所述装置包括:文本处理模块,用于获取资讯文本数据和产品服务文本描述数据,对所述资讯文本数据和产品服务文本描述数据进行分词处理,得到文本数据集合;语义向量化模块,用于对所述文本数据集合中的资讯文本数据进行向量化,得到所述资讯文本数据的标签对应的第一语义特征向量,对所述文本数据集合中的产品服务文本描述数据进行向量化,得到产品服务文本描述数据的标签对应的第二语义特征向量;标签向量化模块,用于针对所述第一语义特征向量和所述第二语义特征向量对应的标签词,采用语义向量模型训练得到所述标签词对应的标签语义向量,以及标签语义向量列表;内容建联模块,用于将所述资讯文本数据和产品服务文本描述数据对应的文本标签和所述标签语义向量采用Key

Value方式存储在内存数据库中;在线检索时,通过查询文本标签对应的标签语义向量,得到相似文本列表,从所述相似文本列表选择最终建联的资讯文本和/或产品服务文本列表。
[0012]在其中一个实施例中,所述资讯文本数据包括:标题、文本内容的文本数据,所述产品服务文本描述数据包括:名称、描述、所属行业、类型的描述数据。
[0013]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取资讯文本数据和产品服务文本描述数据,对所述资讯文本数据和产品服务文本描述数据进行分词处理,得到文本数据集合;对所述文本数据集合中的资讯文本数据进行向量化,得到所述资讯文本数据的标签对应的第一语义特征向量,对所述文本数据集合中的产品服务文本描述数据进行向量化,得到产品服务文本描述数据的标签对应的第二语义特征向量;针对所述第一语义特征向量和所述第二语义特征向量对应的标签词,采用语义向量模型训练得到所述标签词对应的标签语义向量,以及标签语义向量列表;将所述资讯文本数据和产品服务文本描述数据对应的文本标签和所述标签语义向量采用Key

Value方式存储在内存数据库中;在线检索时,通过查询资讯文本的文本标签对应的标签语义向量,得到相似文本列表,从所述相似文本列表选择最终建联的资讯文本和/或产品服务文本列表。
[0014]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取资讯文本数据和产品服务文本描述数据,对所述资讯文本数据和产品服务文
本描述数据进行分词处理,得到文本数据集合;对所述文本数据集合中的资讯文本数据进行向量化,得到所述资讯文本数据的标签对应的第一语义特征向量,对所述文本数据集合中的产品服务文本描述数据进行向量化,得到产品服务文本描述数据的标签对应的第二语义特征向量;针对所述第一语义特征向量和所述第二语义特征向量对应的标签词,采用语义向量模型训练得到所述标签词对应的标签语义向量,以及标签语义向量列表;将所述资讯文本数据和产品服务文本描述数据对应的文本标签和所述标签语义向量采用Key

Value方式存储在内存数据库中;在线检索时,通过查询资讯文本的文本标签对应的标签语义向量,得到相似文本列表,从所述相似文本列表选择最终建联的资讯文本和/或产品服务文本列表。
[0015]上述内容建联方法、装置、计算机设备和存储介质,通过对资讯文本数据和产品服务文本描述数据进行两个维度的关联,最终实现内容建立的精准度,第一个维度的建联是分别提取资讯文本数据和产品服务文本描述数据的语义向量,将资讯文本和产品/服务文本进行相同维度的转化,第二个维度是通过对文本的标签进行统一,在大量的文本数据支持下,每个标签对应的语义向量来自于不同的资讯文本和产品服务文本描述数据,通过上述语义向量综合来描述标签词,从而实现了资讯和产品服务第二维度的建联,将上述处理的数据存储在高性能内存数据库中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容建联方法,其特征在于,所述方法包括:获取资讯文本数据和产品服务文本描述数据,对所述资讯文本数据和产品服务文本描述数据进行分词处理,得到文本数据集合;对所述文本数据集合中的资讯文本数据进行向量化,得到所述资讯文本数据的标签对应的第一语义特征向量,对所述文本数据集合中的产品服务文本描述数据进行向量化,得到产品服务文本描述数据的标签对应的第二语义特征向量;针对所述第一语义特征向量和所述第二语义特征向量对应的标签词,采用语义向量模型训练得到所述标签词对应的标签语义向量,以及标签语义向量列表;将所述资讯文本数据和产品服务文本描述数据对应的文本标签和所述标签语义向量采用Key

Value方式存储在内存数据库中;在线检索时,通过查询资讯文本的文本标签对应的标签语义向量,得到相似文本列表,从所述相似文本列表选择最终建联的产品服务文本列表。2.根据权利要求1所述的方法,其特征在于,所述资讯文本数据包括:标题、文本内容的文本数据,所述产品服务文本描述数据包括:名称、描述、所属行业、类型的描述数据。3.根据权利要求1所述的方法,其特征在于,采用语义向量模型训练得到所述标签词对应的标签语义向量,包括:获取所述标签词对应的多个所述第一语义特征向量和所述第二语义特征向量;通过Word2Vec方式对所述第一语义特征向量和所述第二语义特征向量进行训练,生成标签词的标签语义向量。4.根据权利要求1所述的方法,其特征在于,在将所述资讯文本数据和产品服务文本描述数据对应的文本标签和所述标签语义向量采用Key

Value方式存储在内存数据库中之后,所述方法还包括:对内存数据库中存储的数据的标签变化进行全量数据更新。5.根据权利要求1至4任一项所述的方法,其特征在于,通过查询文本标签对应的标签语义向量,得到多个相似的文本标签,从所述相似文本列表选择最终建联的产品服务文本列表,包括:提取待检索资讯文本的标签词,根据所述标签词从所述内存数据库中检索标签词对应的标签语义向量,得到标签列表;获取所述待检索资讯文本的语义向...

【专利技术属性】
技术研发人员:李煜丑晓慧王玮
申请(专利权)人:宁波深擎信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1