一种体育赛事直播的全媒体内容智能感知及关联的方法技术

技术编号:33152365 阅读:13 留言:0更新日期:2022-04-22 14:07
本发明专利技术提供一种体育赛事直播的全媒体内容智能感知及关联的方法,包括以下步骤:步骤1,预建立内容库与内容索引库;步骤2,离线赛前预筛选阶段;步骤3,事件提取过程;步骤4,初步匹配过程;步骤5,事件语义扩展过程;步骤6,深度语义匹配过程;步骤7,多模态内容输出,作为当前时刻的实时赛事数据的关联内容,即时呈现。本发明专利技术能够实现对体育赛事直播节目的全媒体内容智能感知及同源内容动态关联,可以快速、全面准确的从全媒体内容数据库中搜索到与当前赛事数据最为关联的关联内容,提升体育赛事直播效果。事直播效果。事直播效果。

【技术实现步骤摘要】
一种体育赛事直播的全媒体内容智能感知及关联的方法


[0001]本专利技术属于数据感知及处理
,具体涉及一种体育赛事直播的全媒体内容智能感知及关联的方法。

技术介绍

[0002]体育赛事直播过程中,当发生一个事件时,需要搜索全媒体内容数据库,获得与事件相关的关联内容,再将关联内容匹配上,即时呈现,对实时性要求、关联内容的全面性和精确性要求均非常高。
[0003]上述关联内容匹配方式存在以下问题:由于全媒体内容数据库的数据量大、数据形态多、涉及范围广,全媒体内容数据库包括多条内容,每一条内容采用标签进行静态描述和关联索引,因此,难以快速、全面准确的从全媒体内容数据库中搜索到关联内容,降低体育赛事直播效果。

技术实现思路

[0004]针对现有技术存在的缺陷,本专利技术提供一种体育赛事直播的全媒体内容智能感知及关联的方法,可有效解决上述问题。
[0005]本专利技术采用的技术方案如下:
[0006]本专利技术提供一种体育赛事直播的全媒体内容智能感知及关联的方法,包括以下步骤:
[0007]步骤1,预建立内容库与内容索引库;
[0008]所述内容库用于存储多条原始内容;每条所述原始内容具有内容id;
[0009]所述内容索引库用于存储绑定有对应的内容id的内容索引;其中,每条所述内容索引包括多个内容属性标签;
[0010]步骤2,离线赛前预筛选阶段:
[0011]步骤2.1,针对当前待直播的体育赛事,获取赛事静态数据集;所述赛事静态数据集包括多个赛事静态数据;
[0012]步骤2.2,以所述赛事静态数据集中的每个赛事静态数据为检索词,检索所述内容索引库,一共预筛选得到N1条与所述赛事静态数据集相关联的内容索引,表示为:预筛选内容索引预筛选内容索引预筛选内容索引由此形成预筛内容索引库B0_index;
[0013]步骤3,事件提取过程:
[0014]步骤3.1,针对当前待直播的体育赛事,预定义赛事提取触发规则以及重点关注的锚点集合;其中,所述赛事提取触发规则包括多个赛事关键词;所述锚点集合包括多个锚点;
[0015]预定义事件层次结构;所述事件层次结构为三层结构,按自上向下的方向,包括:第一层节点,第二层节点和第三层节点;其中,所述第一层节点为根节点,用于存储一级事
件类型;所述第二层节点为所述第一层节点的子节点,包括多种不同的二级事件类型;所述第三层节点为各个所述第二层节点的子节点,用于表示二级事件类型包括的三级事件类型;其中,所述三级事件类型中,包括体育赛事事件;
[0016]步骤3.2,当体育赛事直播开始时,通过体育赛事直播源实时读取到当前t时刻的实时赛事数据;
[0017]根据步骤3.1预定义的事件层次结构,判断所述实时赛事数据是否属于体育赛事事件数据,如果不是,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果是,则进一步判断所述实时赛事数据,是否满足所述赛事提取触发规则,如果不满足,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果满足,则执行步骤3.3;
[0018]步骤3.3,采用事件抽取模型,从所述实时赛事数据中提取得到事件,表示为:事件Event
t
={e
t1
,e
t2
,...,e
t11
};其中,e
t1
,e
t2
,...,e
t11
代表事件Event
t
的11个事件变量;
[0019]其中:
[0020]e
t1
为一级事件类型变量;
[0021]e
t2
为二级事件类型变量;
[0022]e
t3
为三级事件类型变量;
[0023]e
t4
为赛事具体事件类型变量;
[0024]e
t5
为对阵双方名称变量;
[0025]e
t6
为当前比分变量;
[0026]e
t7
为事件锚点变量;
[0027]e
t8
为当前球员姓名变量;
[0028]e
t9
为当前球员所在球队名称变量;
[0029]e
t10
为事件简要描述变量;
[0030]e
t11
为事件发生时间变量;
[0031]从所述实时赛事数据中提取得到事件的提取方法为:
[0032]按照设定顺序排列11个事件变量的组合槽位,从第1个槽位开始,利用槽位识别技术确定当前槽位,再通过对所述实时赛事数据的分析,得到当前槽位的变量值,并向当前槽位填充相应的变量值;然后向后移动一个槽位,循环进行,直到完成对第11个槽位的填充,得到包含11个事件变量的事件Event
t
,即为提取到的事件;如果某个槽位相应的变量值不存在,则为空;
[0033]其中,事件锚点变量的提取方法为:根据步骤3.1预定义的锚点集合,如果存在属于锚点集合的事件属性,则将该事件属性作为事件锚点;
[0034]步骤4,初步匹配过程:
[0035]步骤4.1,将步骤3提取到的事件Event
t
,与步骤2得到的预筛选内容索引预筛选内容索引预筛选内容索引输入到已训练完成的逻辑回归模型进行补步匹配,逻辑回归模型分别计算得到事件Event
t
与预筛选内容索引的匹配得分事件Event
t
与预筛选内容索引的匹配得分事件Event
t
与预筛选
内容索引的匹配得分
[0036]获得匹配得分最高的前N2个预筛选内容索引,表示为:预筛选内容索引预筛选内容索引预筛选内容索引其中,N2<N1,由此形成初筛内容索引库B1_index;
[0037]步骤4.2,由于每条预筛选内容索引均绑定有对应的内容id,因此,对于初筛内容索引库B1_index中的每一条预筛选内容索引,根据其绑定的内容id,查找步骤1预建立的内容库,得到对应的初步关联内容,将得到的N2个初步关联内容表示为:初步关联内容初步关联内容初步关联内容由此形成初步关联内容库;
[0038]步骤5,事件语义扩展过程:
[0039]步骤5.1,对事件Event
t
往前进行一定时间长度的回溯,提取事件Event
t
在回溯时间段内的所有前置事件,形成前置事件合集,按时间序列,依次表示为:前置事件F_Event
t
(1),前置事件F_Event
t
(2),...,前置事件F_Event
t
(n1);其中,n1代表前置事件的总数量;
[0040]将n1个前置事件按时间序列的排序,称为语义扩展后的前置事件合集;
[0041]步骤5.2,判断步骤5.1得到的前本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种体育赛事直播的全媒体内容智能感知及关联的方法,其特征在于,包括以下步骤:步骤1,预建立内容库与内容索引库;所述内容库用于存储多条原始内容;每条所述原始内容具有内容id;所述内容索引库用于存储绑定有对应的内容id的内容索引;其中,每条所述内容索引包括多个内容属性标签;步骤2,离线赛前预筛选阶段:步骤2.1,针对当前待直播的体育赛事,获取赛事静态数据集;所述赛事静态数据集包括多个赛事静态数据;步骤2.2,以所述赛事静态数据集中的每个赛事静态数据为检索词,检索所述内容索引库,一共预筛选得到N1条与所述赛事静态数据集相关联的内容索引,表示为:预筛选内容索引预筛选内容索引...,预筛选内容索引由此形成预筛内容索引库B0_index;步骤3,事件提取过程:步骤3.1,针对当前待直播的体育赛事,预定义赛事提取触发规则以及重点关注的锚点集合;其中,所述赛事提取触发规则包括多个赛事关键词;所述锚点集合包括多个锚点;预定义事件层次结构;所述事件层次结构为三层结构,按自上向下的方向,包括:第一层节点,第二层节点和第三层节点;其中,所述第一层节点为根节点,用于存储一级事件类型;所述第二层节点为所述第一层节点的子节点,包括多种不同的二级事件类型;所述第三层节点为各个所述第二层节点的子节点,用于表示二级事件类型包括的三级事件类型;其中,所述三级事件类型中,包括体育赛事事件;步骤3.2,当体育赛事直播开始时,通过体育赛事直播源实时读取到当前t时刻的实时赛事数据;根据步骤3.1预定义的事件层次结构,判断所述实时赛事数据是否属于体育赛事事件数据,如果不是,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果是,则进一步判断所述实时赛事数据,是否满足所述赛事提取触发规则,如果不满足,则结束对此实时赛事数据的处理,继续读取下一时间段的实时赛事数据;如果满足,则执行步骤3.3;步骤3.3,采用事件抽取模型,从所述实时赛事数据中提取得到事件,表示为:事件Event
t
={e
t1
,e
t2
,...,e
t11
};其中,e
t1
,e
t2
,...,e
t11
代表事件Event
t
的11个事件变量;其中:e
t1
为一级事件类型变量;e
t2
为二级事件类型变量;e
t3
为三级事件类型变量;e
t4
为赛事具体事件类型变量;e
t5
为对阵双方名称变量;e
t6
为当前比分变量;e
t7
为事件锚点变量;
e
t8
为当前球员姓名变量;e
t9
为当前球员所在球队名称变量;e
t10
为事件简要描述变量;e
t11
为事件发生时间变量;从所述实时赛事数据中提取得到事件的提取方法为:按照设定顺序排列11个事件变量的组合槽位,从第1个槽位开始,利用槽位识别技术确定当前槽位,再通过对所述实时赛事数据的分析,得到当前槽位的变量值,并向当前槽位填充相应的变量值;然后向后移动一个槽位,循环进行,直到完成对第11个槽位的填充,得到包含11个事件变量的事件Event
t
,即为提取到的事件;如果某个槽位相应的变量值不存在,则为空;其中,事件锚点变量的提取方法为:根据步骤3.1预定义的锚点集合,如果存在属于锚点集合的事件属性,则将该事件属性作为事件锚点;步骤4,初步匹配过程:步骤4.1,将步骤3提取到的事件Event
t
,与步骤2得到的预筛选内容索引预筛选内容索引...,预筛选内容索引输入到已训练完成的逻辑回归模型进行补步匹配,逻辑回归模型分别计算得到事件Event
t
与预筛选内容索引的匹配得分事件Event
t
与预筛选内容索引的匹配得分...,事件Event
t
与预筛选内容索引的匹配得分获得匹配得分最高的前N2个预筛选内容索引,表示为:预筛选内容索引预筛选内容索引...,预筛选内容索引其中,N2<N1,由此形成初筛内容索引库B1_index;步骤4.2,由于每条预筛选内容索引均绑定有对应的内容id,因此,对于初筛内容索引库B1_index中的每一条预筛选内容索引,根据其绑定的内容id,查找步骤1预建立的内容库,得到对应的初步关联内容,将得到的N2个初步关联内容表示为:初步关联内容初步关联内容...,初步关联内容由此形成初步关联内容库;步骤5,事件语义扩展过程:步骤5.1,对事件Event
t
往前进行一定时间长度的回溯,提取事件Event
t
在回溯时间段内的所有前置事件,形成前置事件合集,按时间序列,依次表示为:前置事件F_Event
t
(1),前置事件F_Event
t
(2),...,前置事...

【专利技术属性】
技术研发人员:金璨孙剑麻书城
申请(专利权)人:北京中视广信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1