一种内容替换方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:22974793 阅读:11 留言:0更新日期:2019-12-31 23:27
本发明专利技术实施例提供了一种内容替换方法、装置、电子设备及可读存储介质。该方法包括:接收针对文档中的目标图片的内容替换指令;内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;判断目标字符中是否存在与第一字符匹配的字符;若存在,生成记录有第二字符的子图片;利用子图片对目标图片的目标区域进行覆盖。应用本发明专利技术实施例,可以对文档中图片所记录的文字内容进行替换,提高了用户的办公体验。

【技术实现步骤摘要】
一种内容替换方法、装置、电子设备及可读存储介质
本专利技术涉及文档处理
,特别是涉及一种内容替换方法、装置、电子设备及可读存储介质。
技术介绍
目前,在办公过程中,用户常常需要通过办公软件来处理各种各样的文档。例如,常常需要对word文档、PDF(PortableDocumentFormat,便携式文档格式)文档和PPT(PowerPoint,演示文稿)文档等文档进行编辑。这些文档中常常会存储有一些图片,并且,这些图片中有时会记录有一些文字内容。例如,文档中一张图片记录有文字:其它。专利技术人发现,当用户想要利用办公软件的替换功能,将该文档中的出现的“其它”替换为“其他”,从而使文档的用词统一时,办公软件无法对图片所记录的“其它”进行替换,影响了用户的办公体验。
技术实现思路
本专利技术实施例的目的在于提供一种内容替换方法、装置、电子设备及可读存储介质,以能够实现对图片所记录的文字内容进行替换,提高用户的办公体验。具体技术方案如下:第一方面,本专利技术实施例提供了一种内容替换方法,该方法可以包括:接收针对文档中的目标图片的内容替换指令;其中,内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;判断目标字符中是否存在与第一字符匹配的字符;若存在,生成记录有第二字符的子图片;利用子图片对目标图片的目标区域进行覆盖;目标区域为:与第一字符匹配的目标字符的位置区域信息所对应的区域。可选地,在将目标图片输入至预先构建的图片字符识别模型之前,该方法还可以包括:构建图片字符识别模型;构建图片字符识别模型的步骤,包括:获得记录有字符的多张预设图片;利用预设深度学习算法对训练样本进行训练,得到图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。可选地,一个训练样本中还可以包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。可选地,将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息的步骤,可以包括:将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;生成记录有第二字符的子图片的步骤,包括:生成记录有第二字符和目标背景内容的子图片;目标背景内容为:与第一字符匹配的目标字符的背景内容。可选地,预设深度学习算法可以包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;组合算法包括卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。第二方面,本专利技术实施例还提供了一种内容替换装置,该装置可以包括:接收单元,用于接收针对文档中的目标图片的内容替换指令;其中,内容替换指令中至少携带:待被替换的第一字符和用于替换第一字符的第二字符;输入单元,用于将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符和每个目标字符的位置区域信息;图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;判断单元,用于判断目标字符中是否存在与第一字符匹配的字符;生成单元,用于在目标字符中存在与第一字符匹配的字符时,生成记录有第二字符的子图片;覆盖单元,用于利用子图片对目标图片的目标区域进行覆盖;目标区域为:与第一字符匹配的目标字符的位置区域信息所对应的区域。可选地,在本专利技术实施例中,该装置还可以包括:构建单元,用于在将目标图片输入至预先构建的图片字符识别模型之前,构建图片字符识别模型;构建单元具体用于:获得记录有字符的多张预设图片;利用预设深度学习算法对训练样本进行训练,得到图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。可选地,一个训练样本中还可以包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。可选地,在本专利技术实施例中,输入单元具体可以用于:将目标图片输入至预先构建的图片字符识别模型,得到目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;相应地,生成单元具体可以用于:生成记录有第二字符和目标背景内容的子图片;目标背景内容为:与第一字符匹配的目标字符的背景内容。可选地,预设深度学习算法可以包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;组合算法包括卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。第三方面,本专利技术实施例还提供了一种电子设备,可以包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述任一项内容替换方法的方法步骤。第四方面,本专利技术实施例还提供了一种可读存储介质,该可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项内容替换方法的方法步骤。第五方面,本专利技术实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行:上述任一项内容替换方法的方法步骤。在本专利技术实施例中,可以接收到针对文档中目标图片的内容替换指令,该内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符。在接收到该内容替换指令后,可以将该目标图片输入至预先构建的图片字符识别模型。由于图片字符识别模型可以对图片所记录的字符和所记录的每个字符的位置区域信息进行识别。因而,在将目标图片输入至图片字符识别模型后,图片字符识别模型可以识别并输出:目标图片所记录的目标字符和每个目标字符的位置区域信息。然后,可以判断目标字符中是否存在与第一字符相匹配的字符。若存在,则生成记录有第二字符的子图片。之后,利用该子图片对目标图片中的、与第一字符匹配的目标字符的位置区域信息所对应的目标区域进行覆盖。这样,在利用子图片对目标区域进行覆盖后,实现了利用第二字符替换掉目标图片中的第一字符。该种内容替换方式,不需要用户将目标图片发送至图片编辑软件,再通过图片编辑软件对图片内容进行调整,降低了对图片内容进行调整的操作复杂度和操作时间,降低了内容替换成本,提高了用户的办公效率和办公体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附本文档来自技高网...

【技术保护点】
1.一种内容替换方法,其特征在于,所述方法包括:/n接收针对文档中的目标图片的内容替换指令;其中,所述内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符;/n将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符和每个目标字符的位置区域信息;所述图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;/n判断所述目标字符中是否存在与所述第一字符匹配的字符;/n若存在,生成记录有所述第二字符的子图片;/n利用所述子图片对所述目标图片的目标区域进行覆盖;所述目标区域为:与所述第一字符匹配的目标字符的位置区域信息所对应的区域。/n

【技术特征摘要】
1.一种内容替换方法,其特征在于,所述方法包括:
接收针对文档中的目标图片的内容替换指令;其中,所述内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符;
将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符和每个目标字符的位置区域信息;所述图片字符识别模型用于:识别图片所记录的字符和所记录的每个字符的位置区域信息;
判断所述目标字符中是否存在与所述第一字符匹配的字符;
若存在,生成记录有所述第二字符的子图片;
利用所述子图片对所述目标图片的目标区域进行覆盖;所述目标区域为:与所述第一字符匹配的目标字符的位置区域信息所对应的区域。


2.根据权利要求1所述的方法,其特征在于,在将所述目标图片输入至预先构建的图片字符识别模型之前,所述方法还包括:
构建所述图片字符识别模型;
所述构建所述图片字符识别模型的步骤,包括:
获得记录有字符的多张预设图片;
利用预设深度学习算法对训练样本进行训练,得到所述图片字符识别模型;其中,一个训练样本中包括:一张预设图片、该预设图片中的字符和该字符在该预设图片中对应的位置区域信息。


3.根据权利要求2所述的方法,其特征在于,一个训练样本中还包括:该训练样本中所包含的预设图片中的字符在该预设图片中的背景内容。


4.根据权利要求3所述的方法,其特征在于,所述将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符和每个目标字符的位置区域信息的步骤,包括:
将所述目标图片输入至预先构建的图片字符识别模型,得到所述目标图片所记录的目标字符、每个目标字符的位置区域信息和每个目标字符的背景内容;
所述生成记录有所述第二字符的子图片的步骤,包括:
生成记录有所述第二字符和目标背景内容的子图片;所述目标背景内容为:与所述第一字符匹配的目标字符的背景内容。


5.根据权利要求2-4中任一项所述的方法,其特征在于,所述预设深度学习算法包括:卷积循环神经网络算法CRNN和组合算法中的任意一项;所述组合算法包括所述卷积循环神经网络算法CRNN和场景文本检测网络算法CTPN。


6.一种内容替换装置,其特征在于,所述装置包括:
接收单元,用于接收针对文档中的目标图片的内容替换指令;其中,所述内容替换指令中至少携带:待被替换的第一字符和用于替换所述第一字符的第二字符;<...

【专利技术属性】
技术研发人员:冷志峰张作兵刘浩丽朱静
申请(专利权)人:广州金山移动科技有限公司珠海金山办公软件有限公司北京金山办公软件股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1