当前位置: 首页 > 专利查询>北京金山办公软件股份有限公司武汉金山办公软件有限公司专利>正文

识别演示文稿内图片类型的方法及装置、电子设备制造方法及图纸

技术编号：38892512 阅读：11 留言：0更新日期：2023-09-22 14:16

本申请涉及智能办公技术领域，公开了一种识别演示文稿内图片类型的方法。该识别演示文稿内图片类型的方法包括：获得演示文稿内的图片以及文本框中的文本内容；提取文本框中的文本内容的文本特征向量，以及提取图片的图片特征向量；拼接文本特征向量以及图片特征向量，获得待识别特征向量；对待识别特征向量进行识别，获得图片的类型。采用该识别演示文稿内图片类型的方法可识别出符合演示文稿的演示场景的图片类型，便于继续为用户推荐相关操作，以提高用户的使用体验。本申请还公开一种识别演示文稿内图片类型的装置、电子设备和存储介质。质。质。

全部详细技术资料下载

【技术实现步骤摘要】
识别演示文稿内图片类型的方法及装置、电子设备

[0001]本申请涉及智能办公
，例如涉及一种识别演示文稿内图片类型的方法及装置、电子设备。

技术介绍

[0002]如图1所示，现有演示文稿具备单页美化功能或全文美化功能，单页美化功能的作用范围是演示文稿的单一页面，全文美化功能的作用范围是完整的演示文稿。单页美化或全文美化均需要获得页面的类型，并根据页面的类型提供相应美化方案。以下结合图2对现有技术中的单页美化功能进行进一步说明：首先确定当前页的页面类型，页面类型可包括封面、目录、章节页、正文页以及结束页，再展示当前页的页面类型对应的多种美化风格，以供用户选择。
[0003]在实现本申请实施例的过程中，发现相关技术中至少存在如下问题：
[0004]用户在演示文稿中插入不同类型的图片后，通常会有对应于图片类型的相关操作，例如，在图片类型为标志(Logo)的情况下，则应当使该插图缩小居边，而不是放大居中；若实现为不同类型的图片推荐对应的操作，则首先需要对演示文稿内包含的图片进行分类。现有技术仅可对演示文稿的页面类型进行分类，无法对演示文稿内包含的图片进行分类，进而无法为不同类型的图片提供对应的操作。

技术实现思路

[0005]为了对披露的实施例的一些方面有基本的理解，下面给出了简单的概括。所述概括不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围，而是作为后面的详细说明的序言。
[0006]本申请实施例提供了一种识别演示文稿内图片类型的方法及装置、电子设备，以...

【技术保护点】

【技术特征摘要】
1.一种识别演示文稿内图片类型的方法，其特征在于，包括：获得演示文稿中的图片以及文本框中的文本内容；提取所述文本框中的文本内容的文本特征向量，以及提取所述图片的图片特征向量；拼接所述文本特征向量以及所述图片特征向量，获得待识别特征向量；对所述待识别特征向量进行分类处理，获得所述图片的类型。2.根据权利要求1所述的方法，其特征在于，获得演示文稿中的文本框中的文本内容，包括：获得演示文稿中的全部文本框；在全部文本框中选定设定数量的特征文本框；将所述特征文本框中的文本内容确定为演示文稿中的文本框中的文本内容；其中，所述特征文本框中文本内容的长度小于或等于全部文本框中除所述特征文本框之外的文本框中的文本内容的长度。3.根据权利要求1所述的方法，其特征在于，提取文本框中的文本内容的文本特征向量，包括：提取每个文本框中的文本内容的子文本特征向量；拼接全部子文本特征向量，获得所述文本特征向量。4.根据权利要求3所述的方法，其特征在于，提取每个文本框中的文本内容的子文本特征向量，包括：针对每个所述文本框执行以下处理：将所述文本框中的文本内容进行文本嵌入处理和位置嵌入处理，获得原始嵌入向量；利用至少一个子编码器对所述原始嵌入向量依次进行编码处理；将最后一个子编码器的输出确定为所述子文本特征向量。5.根据权利要求3所述的方法，其特征在于，提取每个文本框中的文本内容的子文本特征向量，包括：针对每个所述文本框执行以下处理：通过孪生神经网络的子网络对所述文本框的文本内容进行特征提取处理，得到所述文本框...

【专利技术属性】
技术研发人员：潘云嵩，张家瑞，宋超，
申请(专利权)人：北京金山办公软件股份有限公司武汉金山办公软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人