【技术实现步骤摘要】
字串解析方法、系统及电子设备
本专利技术涉及字串提取解析
,尤其是涉及一种字串解析方法、系统及电子设备。
技术介绍
软件工程中,用户文档会包含代码内容,例如代码示例;字串文件中亦还有代码内容,尤其对于容器类文件格式(如xlsx、xliff、json)来说,其中包含的代码字串类型更为复杂多变。翻译这些文件时,需要识别这些代码内容,提取普通文本。现有技术中的CAT工具虽然具有对代码内容进行二次解析的功能,但不能满足任意类型的文件解析,且解析器的种类较少,字串解析的效果较差。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种字串解析方法、系统及电子设备,通过预设解析器队列中获取子串的目标解析器,并通过该目标解析器将包含代码内容的字串进行屏蔽,能够满足任意文件类型的字串进行提取,解决了现有技术中在对含有代码内容的文件解析时存在的支持类型有限且解析效果差的问题。第一方面,本专利技术实施例提供了一种字串解析方法,该方法包括:基于源文件的类型获取待译内容;获取待译内容中包括的至少一个字 ...
【技术保护点】
1.一种字串解析方法,其特征在于,所述方法包括:/n基于源文件的类型获取待译内容;/n获取所述待译内容中包括的至少一个字串;/n针对所述至少一个字串中的每一字串,基于该字串的字串类型,从解析器队列确定出与所述字串类型对应的目标解析器,使用所述目标解析器对该字串进行解析操作;将与该字串对应的句段标签字串以及内容字串作为解析结果;/n得到与所述源文件对应的至少一个解析结果。/n
【技术特征摘要】
1.一种字串解析方法,其特征在于,所述方法包括:
基于源文件的类型获取待译内容;
获取所述待译内容中包括的至少一个字串;
针对所述至少一个字串中的每一字串,基于该字串的字串类型,从解析器队列确定出与所述字串类型对应的目标解析器,使用所述目标解析器对该字串进行解析操作;将与该字串对应的句段标签字串以及内容字串作为解析结果;
得到与所述源文件对应的至少一个解析结果。
2.根据权利要求1所述的方法,其特征在于,针对所述至少一个字串中的每一字串,基于该字串的字串类型,从解析器队列确定出与所述字串类型对应的目标解析器,包括:
获取所述解析器队列;其中,所述解析器队列中包括至少一个目标解析器,每个目标解析器包含于所述字串类型对应的字串解析规则;所述字串解析规则用于获取所述字串的句段标签字串以及内容字串;
根据所述字串中的每一个字串的类型,遍历所述解析器队列中所有的目标解析器,从所述解析器队列中确定与所述字串的类型对应的目标解析器。
3.根据权利要求1所述的方法,其特征在于,使用所述目标解析器对该字串进行解析操作,包括:
根据所述解析器队列中的所述目标解析器的排列顺序,确定所述目标解析器的执行顺序;
将所述字串输入至所述解析器队列中第一执行顺序的所述目标解析器中进行解析,得到第一解析结果;
将所述第一解析结果输入至所述解析器队列中第二执行顺序的所述目标解析器中进行解析,并按照所述目标解析器的执行顺序依次进行解析,直至所述解析器队列中所有的所述目标解析器完成解析。
4.根据权利要求1所述的方法,其特征在于,将与该字串对应的句段标签字串以及内容字串作为解析结果之后,还包括:
根据预设的探测规则对所述解析结果进行探测,得到所述目标解析器的探测结果;其中,所述探测规则用于探测所述解析器是否可用;
若所述目标解析器的探测结果不满足所述探测规则,停止...
【专利技术属性】
技术研发人员:林怀谦,郭云辉,陈海燕,黄正文,
申请(专利权)人:文思海辉智科科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。