【技术实现步骤摘要】
文本替换方法、装置以及计算机可读存储介质
[0001]本申请涉及计算机
,具体涉及一种文本替换方法、装置以及计算机可读存储介质。
技术介绍
[0002]文本直译是指在保持原文内容、原文形式的前提下,对文本内容进行翻译,如将文本中的英文内容直译为中文,或将中文直译为其他语言文本。为了实现对广域网((World Wide Web,web)页面内容进行文本直译,现有技术是通过暴力字符匹配的方式对字符进行匹配替换,以实现文本直译。
[0003]在对现有技术的研究和实践过程中,本申请的专利技术人发现现有技术在通过暴力字符匹配方式对字符进行匹配替换时,需要对每个字符进行匹配,这种匹配替换方式成功率较低,且在匹配失败时需要回溯到相应的字符位置重新匹配,需要花费大量的时间,降低了文本替换的效率。
技术实现思路
[0004]本申请实施例提供一种文本替换方法、装置以及计算机可读存储介质。可提高字符匹配替换成功率,以及提高文本替换效率。
[0005]本申请实施例提供一种文本替换方法,包括:
[0006 ...
【技术保护点】
【技术特征摘要】
1.一种文本替换方法,其特征在于,包括:基于预设的服务语言环境,从显示页面中读取待替换文本数据;对所述待替换文本数据进行节点识别,得到多个节点对象;对所述多个节点对象中符合预设节点尺寸规则的目标节点对象进行节点信息替换,得到第一文本;当检测到所述多个节点对象中包含不符合预设节点尺寸规则的待处理节点对象时,获取所述待处理节点对象对应的待处理数据,并将所述待处理数据中符合预设字符串匹配规则的目标数据进行字符替换,得到第二文本;将所述第一文本及第二文本进行融合,得到待替换文本数据对应的目标替换文本。2.根据权利要求1所述的方法,其特征在于,所述对所述待替换文本数据进行节点识别,得到多个节点对象,包括:从所述待替换文本数据中读取多个元素节点数据;基于预设的文档信息查找语言,对每一元素节点数据进行解析,得到所述每一元素节点数据对应的节点对象;根据所述每一元素节点数据对应的节点对象,确定待替换的多个节点对象。3.根据权利要求1所述的方法,其特征在于,所述预设节点尺寸规则包含预设节点长度阈值,所述对所述多个节点对象中符合预设节点尺寸规则的目标节点对象进行节点信息替换,得到第一文本,包括:获取所述多个节点对象中每一节点对象对应的路径信息;根据所述路径信息确定所述每一节点对象的节点长度;将所述节点长度大于所述预设节点长度阈值的节点对象确定为目标节点对象,并对所述目标节点对象进行节点信息替换,得到第一文本。4.根据权利要求1所述的方法,其特征在于,所述将所述待处理数据中符合预设字符串匹配规则的目标数据进行字符替换,包括:获取所述待替换文本数据中的原文数据;将所述待处理数据与所述原文数据进行字符对比,得到字符对比结果;基于所述字符对比结果,确定所述待处理数据中符合预设字符串匹配规则的目标数据;对所述目标数据进行字符替换。5.根据权利要求4所述的方法,其特征在于,所述预设字符串匹配规则包含字符容错阈值及字符容错长度阈值,所述基于所述对比结果,确定所述待处理数据中符合预设字符串匹配规则的目标数据,包括:对所述字符对比结果进行解析,得到所述待处理数据与所述原文数据之间的字符匹配度;从所述待处理数据中提取所述字符匹配度大于或等于所述字符容错阈值的第一数据;获取所述第一数据中与所述原文数据匹配的第一子数据段,及获取所述第一数据中与所述原文数据不匹配的第二子数据段;将所述字符长度小于或等于所述字符容错长度阈值的第二子数据段确定为容错数据段,并将所述容错数据段与所述第一子数据段进行融合,得到目标数据。
6.根据...
【专利技术属性】
技术研发人员:李旦,普伟,陈红凌,陈千举,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。