System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机数据处理,特别是涉及一种对象代称挖掘方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、在日常生活中,对于某些对象人们通常会取相应的代称,如影视形象的昵称、公众人物的别称或者虚拟偶像的爱称等。这些对象的代称,通常可携带有信息以作为后续处理的基础,如代称可以反映人们对于对象的情绪或者态度,以用于该对象的相关内容推荐等。
2、在相关技术中,对象代称通常是通过爬虫在网页中爬取信息,再由人工对爬取到的信息进行筛选,以确定目标对象的代称。对运营人员依赖严重,需要人工进行筛选筛选,存在代称挖掘效率较低的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种对象代称挖掘方法、装置、计算机设备、存储介质和计算机程序产品。
2、一方面,本申请提供了一种对象代称挖掘方法,该方法包括:
3、获取与涉及到目标对象的媒体数据对应的媒体互动数据;
4、从媒体互动数据中筛选针对目标对象进行互动的目标互动数据;
5、根据目标互动数据挖掘出与目标对象对应的多个备选代称;
6、基于目标对象的本称、或者媒体数据中与目标对象相关的媒体内容中的至少一种数据,对各备选代称进行有效性验证;
7、基于有效性验证通过的备选代称,确定属于目标对象的目标代称。
8、另一方面,本申请还提供了一种对象代称挖掘装置,该装置包括:
9、获取模块,用于获取与涉及到目标对象的媒体数据对应的媒体互动数
10、筛选模块,用于从媒体互动数据中筛选针对目标对象进行互动的目标互动数据;
11、挖掘模块,用于根据目标互动数据挖掘出与目标对象对应的多个备选代称;
12、验证模块,用于基于目标对象的本称、或者媒体数据中与目标对象相关的媒体内容中的至少一种数据,对各备选代称进行有效性验证;
13、确定模块,用于基于有效性验证通过的备选代称,确定属于目标对象的目标代称。
14、在其中一个实施例中,筛选模块,具体用于从媒体互动数据中,筛选出包括有目标对象的本称的第一互动数据;按照第一互动数据的互动时刻与各媒体互动数据的互动时刻之间的接近程度,从各媒体互动数据中筛选出目标互动数据。
15、在其中一个实施例中,筛选模块,具体用于确定媒体数据中目标对象的出现时刻;按照目标对象的出现时刻与各媒体互动数据的互动时刻之间的接近程度,从各媒体互动数据中筛选出目标互动数据。
16、在其中一个实施例中,挖掘模块,具体用于基于目标互动数据获得多个词片段;对于每个词片段,从目标互动数据中确定出包括有相应词片段的第二互动数据,并确定各第二互动数据各自对应的互动权重;基于每个词片段各自对应的第二互动数据的互动权重,确定每个词片段各自对应的词频权重;根据每个词片段各自对应的词频权重,从多个词片段中筛选出满足预设条件的词片段作为备选代称。
17、在其中一个实施例中,挖掘模块,还用于获取各第二互动数据的发布对象分别对目标对象的偏好程度;确定每个第二互动数据各自的互动热度;根据各第二互动数据所对应的偏好程度和互动热度,确定各第二互动数据各自对应的互动权重。
18、在其中一个实施例中,挖掘模块,还用于确定涉及到目标对象的多个媒体数据,并确定每个媒体数据各自对应的媒体热度;获取第二互动数据的发布对象针对每个媒体数据的感知完成度;根据发布对象对于每个媒体数据的感知完成度、以及各媒体数据的媒体热度,确定发布对象对目标对象的偏好程度。
19、在其中一个实施例中,有效性验证包括第一有效性验证和第二有效性验证;验证模块,具体用于从媒体互动数据中确定出包括有目标对象的本称的第一互动数据;基于第一互动数据,或者包括有备选代称的第三互动数据中的至少一种互动数据,对各备选代称进行第一有效性验证;将第一有效性验证通过的备选代称作为候选代称,并根据媒体数据中与目标对象相关的媒体内容,对候选代称进行第二有效性验证。
20、在其中一个实施例中,验证模块,还用于对于多个备选代称中的当前备选代称,用当前备选代称替换第一互动数据中的本称得到第一替换文本,当前备选代称为任一备选代称;确定第一替换文本的第一语义通顺度;用本称替换第三互动数据中的当前备选代称,得到第二替换文本,并确定第二替换文本的第二语义通顺度;根据各个备选代称各自对应的第一语义通顺度和第二语义通顺度,确定各备选代称的第一有效性验证结果。
21、在其中一个实施例中,验证模块,还用于对于多个候选代称中的当前候选代称,确定包括有当前候选代称的第四互动数据,当前候选代称为任一候选代称;确定媒体数据中与第四互动数据相匹配的媒体内容;在第四互动数据所匹配的媒体内容中出现有目标对象的情况下,确定相应的第四互动数据为共现互动数据;基于与各候选代称分别对应的共现互动数据,确定各候选代称的第二有效性验证结果。
22、在其中一个实施例中,验证模块,还用于对于多个候选代称中的当前候选代称,确定与当前候选代称对应的共现互动数据和第四互动数据;根据各个共现互动数据的互动权重,计算得到第一权重和,根据各个第四互动数据的互动权重,计算得到第二权重和;基于第一权重和与第二权重和间的对比值,确定与当前候选代称对应的共现概率得分;根据各个候选代称对应的共现概率得分,确定各候选代称的第二有效性验证结果。
23、在其中一个实施例中,在存在多个涉及到目标对象的媒体数据的情况下,有效性验证通过的备选代称为有效代称;确定模块,具体用于获取从多个媒体数据的媒体互动数据中挖掘出的有效代称,并获取各有效代称分别对应的有效性得分;确定每个媒体数据各自对应的媒体权重;基于各媒体数据分别对应的媒体权重、以及各有效代称分别对应的有效性得分,对有效代称进行筛选,得到属于目标对象的目标代称。
24、在其中一个实施例中,确定模块,还用于获取有效代称被从目标互动数据中挖掘出时所对应的第一分数;获取有效代称被进行有效性验证时所对应的第二分数;基于第一分数和第二分数,确定有效代称的有效性得分。
25、在其中一个实施例中,该装置还包括:
26、更新模块,用于在检测到媒体互动数据的互动增量达到预设数量时,返回从媒体互动数据中筛选针对目标对象进行互动的目标互动数据的步骤继续执行,以对目标对象的目标代称进行更新。
27、在其中一个实施例中,该装置还包括:
28、推送模块,用于在待推荐对象的关注标签中包括有目标对象的本称情况下,将属于目标对象的目标代称作为待推荐对象的关联关注标签;向待推荐对象推送与关联关注标签相关的媒体互动数据。
29、在其中一个实施例中,推送模块,还用于在待推荐对象的关注标签中未包括有目标对象的本称的情况下,在向待推荐对象推送与各目标代称相关的媒体互动数据时,将目标对象的本称标注于与媒体互动数据的展示区域相邻近的预设区域。
30、另一方面,本申请还提供了一种计算机设本文档来自技高网...
【技术保护点】
1.一种对象代称挖掘方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从所述媒体互动数据中筛选针对所述目标对象进行互动的目标互动数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述从所述媒体互动数据中筛选针对所述目标对象进行互动的目标互动数据,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标互动数据挖掘出与所述目标对象对应的多个备选代称,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定各第二互动数据各自对应的互动权重,包括:
6.根据权利要求5所述的方法,其特征在于,每个第二互动数据的发布对象对所述目标对象的偏好程度的获取步骤包括:
7.根据权利要求1所述的方法,其特征在于,所述有效性验证包括第一有效性验证和第二有效性验证,所述基于所述目标对象的本称、或者所述媒体数据中与所述目标对象相关的媒体内容中的至少一种数据,对各备选代称进行有效性验证,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述第一互动数据,或者包括有所述备
9.根据权利要求7所述的方法,其特征在于,所述根据所述媒体数据中与所述目标对象相关的媒体内容,对所述候选代称进行第二有效性验证,包括:
10.根据权利要求9所述的方法,其特征在于,所述基于与各候选代称分别对应的共现互动数据,确定各候选代称的第二有效性验证结果,包括:
11.根据权利要求1所述的方法,其特征在于,在存在多个涉及到目标对象的媒体数据的情况下,所述有效性验证通过的备选代称为有效代称,所述基于有效性验证通过的备选代称,确定属于所述目标对象的目标代称,包括:
12.根据权利要求11所述的方法,其特征在于,每个有效代称所对应的有效性得分的获取步骤包括:
13.根据权利要求1至12中任一项所述的方法,其特征在于,所述方法还包括:
14.根据权利要求1至12中任一项所述的方法,其特征在于,所述方法还包括:
15.根据权利要求14所述的方法,其特征在于,所述方法还包括:
16.一种对象代称挖掘装置,其特征在于,所述装置包括:
17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至15中任一项所述的方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至15中任一项所述的方法的步骤。
19.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至15中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种对象代称挖掘方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从所述媒体互动数据中筛选针对所述目标对象进行互动的目标互动数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述从所述媒体互动数据中筛选针对所述目标对象进行互动的目标互动数据,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标互动数据挖掘出与所述目标对象对应的多个备选代称,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定各第二互动数据各自对应的互动权重,包括:
6.根据权利要求5所述的方法,其特征在于,每个第二互动数据的发布对象对所述目标对象的偏好程度的获取步骤包括:
7.根据权利要求1所述的方法,其特征在于,所述有效性验证包括第一有效性验证和第二有效性验证,所述基于所述目标对象的本称、或者所述媒体数据中与所述目标对象相关的媒体内容中的至少一种数据,对各备选代称进行有效性验证,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述第一互动数据,或者包括有所述备选代称的第三互动数据中的至少一种互动数据,对各备选代称进行第一有效性验证,包括:
9.根据权利要求7所述的方法,其特征在于,所述根据所述媒体数据中与所述目标对象相关的媒体内容,对所述候选代称进行第二有效性验证,包括:
...
【专利技术属性】
技术研发人员:陈小帅,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。