基于办公文档的文本搜索方法、装置和电子设备制造方法及图纸

技术编号:21628924 阅读:49 留言:0更新日期:2019-07-17 11:05
本发明专利技术公开了一种基于办公文档的文本搜索方法、装置和电子设备。基于办公文档的文本搜索方法包括:根据用户输入的待搜索文本内容确定目标内容;确定搜索范围;确定搜索范围内的搜索对象,搜索对象包括文本框对象、图片对象以及音频/视频对象中的至少一种;在确定的搜索对象中查找搜索目标。本发明专利技术的上述基于办公文档的文本搜索方法、装置和电子设备,能够在文本数据以外的数据中查找目标内容,其处理效率高,处理结果较为准确。

Text Search Method, Device and Electronic Equipment Based on Office Document

【技术实现步骤摘要】
基于办公文档的文本搜索方法、装置和电子设备
本专利技术涉及信息处理技术,尤指一种基于办公文档的文本搜索方法、装置和电子设备。
技术介绍
在现有办公软件中,例如MSOffice、WPSOffice,可以通过“查找和替换”功能在文档中查到要目标内容出现的位置。但是,只能在文档的文本数据范围内查找,文本数据以外的数据若包含目标内容是查不到的,例如图片、视/音频中的某一段语音表达的文本。
技术实现思路
本专利技术提供了一种基于办公文档的文本搜索方法、装置和电子设备,以解决现有技术不能在文本数据以外的数据中查找目标内容的问题。为了达到本专利技术目的,本专利技术提供了一种基于办公文档的文本搜索方法,包括:根据用户输入的待搜索文本内容确定目标内容;确定搜索范围;确定所述搜索范围内的搜索对象,所述搜索对象包括文本框对象、图片对象以及音频/视频对象中的至少一种;在确定的搜索对象中查找所述搜索目标。进一步地,所述搜索范围为当前文档、当前页和当前文本框之一。进一步地,在确定的搜索对象包括文本框对象、且该文本框对象的背景填充包括图片对象的情况下:在该文本框对象中对所述搜索目标进行查找;在作为该文本框对象的背景填充的图片对象中对所述搜索目标进行查找。进一步地,在确定的搜索对象包括图片对象的情况下,对该图片对象进行图像文字识别,获得该图片对象对应的图片识别文本,以在该图片识别文本中查找所述目标内容。进一步地,所述的对所述图片对象进行图像文字识别的步骤包括:当该图片对象包括位图时,采用图片文字识别模块接口识别出所述位图中的文本,作为该图片对象对应的图片识别文本;和/或当该图片对象包括矢量图时,采用矢量图数据解析功能模块接口提取出该矢量图中的文本,作为该图片对象对应的图片识别文本。进一步地,在确定的搜索对象包括音频/视频对象的情况下,对该音频/视频对象进行语音文字识别,获得该音频/视频对象对应的语音识别文本,以在该语音识别文本中查找所述目标内容。进一步地,在搜索对象中的音频/视频对象中包括视频对象的情况下,对该视频对象中的部分帧或全部帧进行图像文字识别,获得所述部分帧或全部帧的视频识别文本,以在该视频识别文本中查找所述目标内容。进一步地,所述音频/视频对象包括:音频对象和/或视频对象。本专利技术还提供了一种基于办公文档的文本搜索装置,包括:搜索内容输入单元,其适于根据用户输入的待搜索文本内容确定目标内容;搜索范围确定单元,其适于确定搜索范围;搜索对象确定单元,其适于确定所述搜索范围内的搜索对象,所述搜索对象包括文本框对象、图片对象以及音频/视频对象中的至少一种;查找处理单元,其适于在确定的搜索对象中查找所述搜索目标。此外,本专利技术还提供了一种电子设备,包括如上所述的基于办公文档的文本搜索装置。与现有技术相比,本专利技术不仅能够在文档的文本数据范围内查找目标内容,当需要在文档中的图片、音频/视频对象中查找的目标内容时能够将将查找功能的搜索范围扩大到文档中的图片、视/音频对象中,由此使查找功能变的更加完整,能够克服现有办公软件中文本查找功能点的缺陷,具有较高的处理效率和准确的查找结果。进一步地,本专利技术可以利用图片文字识别功能模块将文本查找的功能的查找范围扩大到了位图图片对象,利用wmf/emf矢量图的数据解析功能模块将文本查找的功能的查找范围扩大到wmf/emf矢量图格式的图片对象。进一步地,本专利技术可以利用语音识别功能模块将文本查找的功能的查找范围扩大到音频/视频对象的语音数据。进一步地,本专利技术可以利用图像文字识别功能将文本查找的功能的查找范围扩大到音频/视频对象的图像帧数据。进一步地,本专利技术可以结合视频中的图像帧数据和语音数据进行文字识别,在所得到的文本中进行目标内容搜索,从而使得搜索结果更为准确,匹配度更高。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术的基于办公文档的文本搜索方法的一个示例性处理的流程图;图2为本专利技术的基于办公文档的文本搜索装置的结构示意图;图3为本专利技术的优选实施例中关于搜索界面的示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本专利技术的实施例提供了一种基于办公文档的文本搜索方法,包括:根据用户输入的待搜索文本内容确定目标内容;确定搜索范围;确定搜索范围内的搜索对象,搜索对象包括文本框对象、图片对象以及音频/视频对象中的至少一种;在确定的搜索对象中查找搜索目标。图1给出了本专利技术的基于办公文档的文本搜索方法的一个处理示例的流程图。如图1所示,该方法开始后,执行步骤S101。在步骤S101中,根据用户输入的待搜索文本内容确定目标内容。然后,执行步骤S102。在步骤S102中,确定搜索范围。然后,执行步骤S103。其中,搜索范围例如为当前文档、当前页和当前文本框之一。例如,可以根据用户的选择确定当前文档中的对应部分作为搜索范围。在用户未对搜索范围进行选择的情况下,例如可以默认搜索范围为当前文档。在步骤S103中,确定搜索范围内的搜索对象,搜索对象包括文本框对象、图片对象以及音频/视频对象中的至少一种。然后,执行步骤S104。其中,音频/视频对象例如包括音频对象和视频对象中的至少一种。在步骤S104中,在确定的搜索对象中查找搜索目标。根据一个实现方式,在确定的搜索对象包括文本框对象、且该文本框对象的背景填充包括图片对象的情况下,例如可以在该文本框对象中对搜索目标进行查找,还可以在作为该文本框对象的背景填充的图片对象中对搜索目标进行查找。其中,“在作为该文本框对象的背景填充的图片对象中对搜索目标进行查找”的处理例如可以在执行完“在该文本框对象中对搜索目标进行查找”的处理之后执行(如在执行完“在该文本框对象中对搜索目标进行查找”后,当用户点击“查找下一个”按钮时,再进行“在作为该文本框对象的背景填充的图片对象中对搜索目标进行查找”的处理)。此外,根据一个实现方式,在确定的搜索对象包括图片对象的情况(可以是只包含图片对象的情况,也可以是同时包含图片对象和其他对象的情况)下,对该图片对象进行图像文字识别,获得该图片对象对应的图片识别文本,以在该图片识别文本中查找目标内容。例如,可以采用如下方式来对图片对象进行图像文字识别:当该图片对象包括位图时,采用图片文字识别模块接口识别出位图中的文本,作为该图片对象对应的图片识别文本;和/或当该图片对象包括矢量图时,采用矢量图数据解析功能模块接口提取出该矢量图中的文本,作为该图片对象对应的图片识别文本。根据另一个实现方式,在确定的搜索对象包括音频/视频对象的情况(可以是只包含音频/视频对象本文档来自技高网...

【技术保护点】
1.基于办公文档的文本搜索方法,其特征在于,包括:根据用户输入的待搜索文本内容确定目标内容;确定搜索范围;确定所述搜索范围内的搜索对象,所述搜索对象包括文本框对象、图片对象以及音频/视频对象中的至少一种;在确定的搜索对象中查找所述搜索目标。

【技术特征摘要】
1.基于办公文档的文本搜索方法,其特征在于,包括:根据用户输入的待搜索文本内容确定目标内容;确定搜索范围;确定所述搜索范围内的搜索对象,所述搜索对象包括文本框对象、图片对象以及音频/视频对象中的至少一种;在确定的搜索对象中查找所述搜索目标。2.根据权利要求1所述的基于办公文档的文本搜索方法,其特征在于,所述搜索范围为当前文档、当前页和当前文本框之一。3.根据权利要求1所述的基于办公文档的文本搜索方法,其特征在于,在确定的搜索对象包括文本框对象、且该文本框对象的背景填充包括图片对象的情况下:在该文本框对象中对所述搜索目标进行查找;在作为该文本框对象的背景填充的图片对象中对所述搜索目标进行查找。4.根据权利要求1-3中任一项所述的基于办公文档的文本搜索方法,其特征在于,在确定的搜索对象包括图片对象的情况下,对该图片对象进行图像文字识别,获得该图片对象对应的图片识别文本,以在该图片识别文本中查找所述目标内容。5.根据权利要求4所述的基于办公文档的文本搜索方法,其特征在于,所述的对所述图片对象进行图像文字识别的步骤包括:当该图片对象包括位图时,采用图片文字识别模块接口识别出所述位图中的文本,作为该图片对象对应的图片识别文本;和/或当该图片对象包括矢量图时,采用矢量图数据解...

【专利技术属性】
技术研发人员:王峰区钺坚黄志军高延平
申请(专利权)人:珠海金山办公软件有限公司北京金山办公软件股份有限公司广州金山移动科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1