【技术实现步骤摘要】
关键词抽取方法、装置、电子设备及计算机可读存储介质
本申请涉及人工智能
,具体而言,本申请涉及一种关键词抽取方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着信息技术的发展,图像处理技术随之发展,现在越来越多的信息可以通过图像进行展示,并且图像也在我们的生活中应用越来越广泛,例如,手机截图、海报、票据等均是以图像的形式出现。其中,由于这些图像中包含很多重要的信息,通常情况下,我们需要从这些图像中获取关键信息,以通过这些关键信息帮助用户进行图片标签编辑和快速检索图片等操作,例如,若用户输入“侏罗纪世界”以从多张图像中查找包含“侏罗纪世界”的图像,若可以从这些图像中抽取关键词,则可以通过用户输入“侏罗纪世界”,以快速从这些图像中查找到目标图像。因此,如何从图像中抽取关键词成为一个重要问题。
技术实现思路
本申请提供了一种关键词抽取方法、装置、电子设备及计算机可读存储介质,可以解决上述至少一种技术问题。所述技术方案如下:第一方面,提供了一种关键词抽取方法,该方法包括: >提取待处理图像对应本文档来自技高网...
【技术保护点】
1.一种关键词抽取的方法,其特征在于,包括:/n提取待处理图像对应的特征信息;/n基于所述特征信息,从所述待处理图像中抽取关键词。/n
【技术特征摘要】
1.一种关键词抽取的方法,其特征在于,包括:
提取待处理图像对应的特征信息;
基于所述特征信息,从所述待处理图像中抽取关键词。
2.根据权利要求1所述的方法,其特征在于,所述特征信息包括文本表达信息和图像视觉信息中的至少一项;文本表达信息包括文本内容和文本视觉信息中的至少一项。
3.根据权利要求2所述的方法,其特征在于,所述文本视觉信息,包括待处理图像中各个文本行对应的文本视觉信息;
对于一个文本行,该文本行对应的文本视觉信息包括以下至少一项:
该文本行对应的文本特征图;
该文本行在所述待处理图像中的位置信息;
该文本行中的各个词在所述待处理图像中的位置信息;
该文本行中的各个词在该文本行中的相对位置信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述特征信息,从所述待处理图像中抽取关键词,包括:
将所述特征信息进行编码,得到所述特征信息的编码结果;
基于所述编码结果,从所述待处理图像中抽取关键词。
5.根据权利要求4所述的方法,其特征在于,所述特征信息包括文本表达信息和图像视觉信息,其中,文本表达信息包括文本视觉信息和文本内容中的至少一项;
所述编码结果包括文本背景表示、图像特征表示、文本行结构信息以及主题信息表示中的至少一项;
其中,所述文本背景表示是基于文本表达信息得到的,所述图像特征表示是基于图像视觉信息得到的,所述文本行结构信息以及主题信息表示是基于文本背景表示得到的。
6.根据权利要求4或5所述的方法,其特征在于,所述基于所述编码结果从所述待处理图像中抽取关键词,包括:
基于所述编码结果,确定各预测时间步各自所对应的目标预测模式、以及所述目标预测模式对应的预测词;
输出各预测时间步所对应的预测词;
基于所述各预测时间步所对应的预测词,得到关键词。
7.根据权利要求6所述的方法,其特征在于,针对一个预测时间步,基于所述编码结果,确定预测时间步所对应的目标预测模式、以及所述目标预测模式对应的预测词,包括以下至少一项:
基于所述编码结果,确定该预测时间步对应于预配置的各预测模式的预测词以及该预测时间步所对应的目标预测模式,并基于所述各预测模式的预测词以及该预测时间步所对应的目标预测模式,得到所述目标预存模式对应的预测词;
基于所述编码结果,从预配置的各预测模式中确定该预测时间步所对应的目标预测模式,基于所述编码结果,得到所述目标预测模式对应的预测词。
8.根据权利要求6或7所述的方法,其特征在于,预配置的预测模式包括:
基于词库进行关键词预测的第一预测模式;
基于文本行所包含的各词进行关键词预测的第二预测模式。
9.根据权利要求8所述的方法,其特征在于,若所述目标预测模式为所述第二预测模式,基于所述编码结果,确定所述目标预测模式对应的预测词,包括:
基于所述编码结果,确定所述待处理图像中的文本内容所包含的各词分别对...
【专利技术属性】
技术研发人员:汪华东,刘松,孟祥峰,
申请(专利权)人:北京三星通信技术研究有限公司,三星电子株式会社,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。