实体词识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:29048458 阅读:26 留言:0更新日期:2021-06-26 06:07
本申请公开了实体词识别方法、装置、电子设备和存储介质,涉及知识图谱、自然语言处理领域。具体实现方案为:对目标视频中的任一帧目标图像进行文本识别,以确定各文本区域包含的文本内容和各文本区域所在的图像位置,并识别各文本区域中的关键词,以及处于两关键词之间的候选词,并根据各文本区域在相邻帧图像中的图像位置,以及在目标图像中的图像位置,确定字幕方向,进而根据字幕方向,从两关键词中,确定与候选词关联的目标关键词,以将候选词,作为目标关键词类目下的实体词。由此,可实现自动识别关键词类目下的实体词,例如识别每个类目下的责任人信息,而无需人工查看视频的方式,抽取上述实体词,可提升实体词识别效率,降低识别成本。低识别成本。低识别成本。

【技术实现步骤摘要】
实体词识别方法、装置、电子设备和存储介质


[0001]本申请涉及NLP(Natural Language Processing,自然语言处理)、计算机视觉等AI(Artificial Intelligence,人工智能)领域,尤其涉及实体词识别方法、装置、电子设备和存储介质。

技术介绍

[0002]在新闻视频中,往往会出现与新闻相关的记者、通讯员等责任人,在新闻结尾处往往也会以滚动字幕的形式出现新闻报道的导播、编辑、技术、监制、总监制等责任人信息。这些责任人信息在新闻编目中是非常重要的编目项,能够清晰明了地确定该条新闻的负责人。因此,如何利用计算机相关技术自动化地抽取这些责任人信息,并将其应用到新闻编目系统中是非常重要的。

技术实现思路

[0003]本申请提供了一种用于实体词识别方法、装置、电子设备以及存储介质。
[0004]根据本申请的一方面,提供了一种实体词识别方法,包括:
[0005]对目标视频中的任一帧目标图像进行文本识别,以确定各文本区域包含的文本内容和各所述文本区域所在的图像位置;
[0006本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体词识别方法,包括:对目标视频中的任一帧目标图像进行文本识别,以确定各文本区域包含的文本内容和各所述文本区域所在的图像位置;从各所述文本区域的所述文本内容中识别出关键词,以及处于两关键词之间的候选词;根据各所述文本区域在相邻帧图像中的图像位置,以及在所述目标图像中的图像位置,确定字幕方向;根据所述字幕方向,从所述两关键词中,确定与所述候选词关联的目标关键词;将所述候选词,作为所述目标关键词类目下的实体词。2.根据权利要求1所述的实体词识别方法,其中,所述图像位置包括横坐标和纵坐标;所述根据各所述文本区域在相邻帧图像中的图像位置,以及在所述目标图像中的图像位置,确定字幕方向,包括:若各所述文本区域在所述相邻帧图像中的纵坐标取值,与在所述目标图像中的纵坐标取值相同,则确定所述字幕方向为水平方向;若各所述文本区域在所述相邻帧图像中的横坐标取值,与在所述目标图像中的横坐标取值相同,则确定所述字幕方向为垂直方向。3.根据权利要求1所述的实体词识别方法,其中,所述图像位置包括横坐标和纵坐标,所述相邻帧图像为所述目标图像的前一帧图像;所述根据各所述文本区域在相邻帧图像中的图像位置,以及在所述目标图像中的图像位置,确定字幕方向,包括:若各所述文本区域在所述相邻帧图像中的纵坐标取值,与在所述目标图像中的纵坐标取值相同,则判断各所述文本区域在所述相邻帧图像中的横坐标取值,是否小于在所述目标图像中的横坐标取值;在各所述文本区域在所述相邻帧图像中的横坐标取值,小于在所述目标图像中的横坐标取值的情况下,则确定所述字幕方向为水平向右滚动方向;在各所述文本区域在所述相邻帧图像中的横坐标取值,大于在所述目标图像中的横坐标取值的情况下,则确定所述字幕方向为水平向左滚动方向。4.根据权利要求3所述的实体词识别方法,其中,所述根据所述字幕方向,从所述两关键词中,确定与所述候选词关联的目标关键词,包括:在所述字幕方向为水平向右滚动方向的情况下,将所述两关键词在所述目标图像中的横坐标取值,大于所述候选词在所述目标图像中的横坐标取值的关键词,确定为与所述候选词关联的目标关键词;在所述字幕方向为水平向左滚动方向的情况下,将所述两关键词在所述目标图像中的横坐标取值,小于所述候选词在所述目标图像中的横坐标取值的关键词,确定为与所述候选词关联的目标关键词。5.根据权利要求4所述的实体词识别方法,其中,所述方法还包括:根据所述目标视频的来源信息,查询预设的视频来源与第一关键词之间的映射关系,确定与所述来源信息匹配的第一关键词;在所述字幕方向为水平向右滚动方向的情况下,确定第一目标候选词,其中,所述第一
目标候选词在所述目标图像中的横坐标取值小于所述匹配的第一关键词在所述目标图像中的横坐标取值;根据所述第一目标候选词,确定所述匹配的第一关键词类目下的实体词;在所述字幕方向为水平向左滚动方向的情况下,确定第二目标候选词,其中,所述第二目标候选词在所述目标图像中的横坐标取值大于所述匹配的第一关键词在所述目标图像中的横坐标取值;根据所述第二目标候选词,确定所述匹配的第一关键词类目下的实体词。6.根据权利要求3所述的实体词识别方法,其中,所述根据各所述文本区域在相邻帧图像中的图像位置,以及在所述目标图像中的图像位置,确定字幕方向,还包括:若各所述文本区域在所述相邻帧图像中的横坐标取值,与在所述目标图像中的横坐标取值相同,则判断各所述文本区域在所述相邻帧图像中的纵坐标取值,是否小于在所述目标图像中的纵坐标取值;在各所述文本区域在所述相邻帧图像中的纵坐标取值,小于在所述目标图像中的...

【专利技术属性】
技术研发人员:杨虎贺峰汪琦冯知凡柴春光朱勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1