页面文案的处理方法及装置制造方法及图纸

技术编号:11731395 阅读:180 留言:0更新日期:2015-07-15 03:35
本申请提供一种页面文案的处理方法及装置。本申请实施例通过确定待处理的页面文案中所包括的至少一个词汇,进而获得每个词汇在所述页面文案所属第一语言版本系统中的当前密度值,使得能够根据所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个词汇在第二语言版本系统中的历史密度值中的至少一项,以及所述获得的每个词汇在所述第一语言版本系统中的当前密度值,确定所述页面文案是否存在异常现象,无需操作人员参与处理过程,操作简单,而且正确率高,从而提高了页面文案处理的效率和可靠性。

【技术实现步骤摘要】

本申请涉及页面文案技术,尤其涉及一种页面文案的处理方法及装置
技术介绍
页面文案,还可以称为文案,是一种利用语言文字进行信息表现的形式。随着全球化、国际化进程的加速,对于不同语言的用户群体,同一个系统需要提供不同语言版本的页面文案,这种系统可以称为多语言系统。例如,对于汉语的用户,提供一个汉语版本的页面文案,对于英语的用户,提供一个英语版本的页面文案等。现有技术中,需要由操作人员逐一对各种语言版本的页面文案进行查看,以发现该页面文案是否存在异常现象,例如,错翻、漏翻等。然而,现有的页面文案的处理操作时间长,而且容易出错,从而导致了页面文案处理的效率和可靠性的降低。
技术实现思路
本申请的多个方面提供一种页面文案的处理方法及装置,用以提高页面文案处理的效率和可靠性。本申请的一方面,提供一种页面文案的处理方法,包括:确定待处理的页面文案中所包括的至少一个词汇;获得每个词汇在所述页面文案所属第一语言版本系统中的当前密度值;根据所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个词汇在第二语言版本系统中的历史密度值中的至少一项,以及所述获得的每个词汇在所述第一语言版本系统中的当前密度值,确定所述页面文案是否存在异常现象;其中,所述第一语言版本系统与所述第二语言版本系统为属于同一个多语言系统的不同语言版本系统。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述页面文案包括邮件文案、文档文案或Web页面文案。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得每个词汇在所述第一语言版本系统中的当前密度值,包括:根据Di=(ti+ai)/(T+A),获得每个词汇在所述第一语言版本系统中的当前密度值;其中,i表示第i个词汇,取值为自然数;ti表示第i个词汇在所述页面文案中出现的次数;ai表示第i个词汇在所述第一语言版本系统中出现的历史次数;T表示所述页面文案中的词汇总量;A表示所述第一语言版本系统中的历史词汇总量;Di表示第i个词汇在所述第一语言版本系统中的当前密度值。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个词汇在第二语言版本系统中的历史密度值中的至少一项,以及所述获得的每个词汇在所述第一语言版本系统中的当前密度值,确定所述页面文案是否存在异常现象之前,还包括:获得所述每个词汇在所述第一语言版本系统中的历史密度值;和/或获得所述每个词汇在所述第二语言版本系统中的历史密度值。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个词汇在第二语言版本系统中的历史密度值中的至少一项,以及所述获得的每个词汇在所述第一语言版本系统中的当前密度值,确定所述页面文案是否存在异常现象,包括:若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第一语言版本系统中的历史密度值为0,确定所述页面文案是否存在异常现象;或者若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第二语言版本系统中部分系统中的历史密度值大于0,确定所述页面文案是否存在异常现象;或者若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第二语言版本系统中的历史密度值大于0,以及该词汇在所述第一语言版本系统中的当前密度值,与,该词汇在所述第二语言版本系统中的历史密度值,的差值,大于或等于预先设置的密度阈值,确定所述页面文案是否存在异常现象;或者若词汇在所述第一语言版本系统中的当前密度值为0,且该词汇在所述第二语言版本系统中全部系统中的历史密度值大于0,确定所述页面文案是否存在异常现象。本申请的另一方面,提供一种页面文案的处理装置,包括:确定单元,用于确定待处理的页面文案中所包括的至少一个词汇;获得单元,用于获得每个词汇在所述页面文案所属第一语言版本系统中的当前密度值;处理单元,用于根据所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个词汇在第二语言版本系统中的历史密度值中的至少一项,以及所述获得单元获得的每个词汇在所述第一语言版本系统中的当前密度值,确定所述页面文案是否存在异常现象;其中,所述第一语言版本系统与所述第二语言版本系统为属于同一个多语言系统的不同语言版本系统。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述页面文案包括邮件文案、文档文案或Web页面文案。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于根据Di=(ti+ai)/(T+A),获得每个词汇在所述第一语言版本系统中的当前密度值;其中,i表示第i个词汇,取值为自然数;ti表示第i个词汇在所述页面文案中出现的次数;ai表示第i个词汇在所述第一语言版本系统中出现的历史次数;T表示所述页面文案中的词汇总量;A表示所述第一语言版本系统中的历史词汇总量;Di表示第i个词汇在所述第一语言版本系统中的当前密度值。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,还用于获得所述每个词汇在所述第一语言版本系统中的历史密度值;和/或获得所述每个词汇在所述第二语言版本系统中的历史密度值。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述处理单元,具体用于若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第一语言版本系统中的历史密度值为0,确定所述页面文案是否存在异常现象;或者若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第二语言版本系统中部分系统中的历史密度值大于0,确定所述页面文案是否存在异常现象;或者若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第二语言版本系统中的历史密度值大于0,以及该词汇在所述第一语言版本系统中的当前密度值,与,该词汇在所述第二语言版本系统中的历史密度值,的差值,大于或等于预先设置的密度阈值,确定所述页面文案是否存在异常现象;或者若词汇在所述第一语言版本系统中的当前密度值为0,且该词汇在所述第二语言版本系统中全部系统中的历史密度值大于0,确定所述页面文案是否存在异常现象。由上述技术方案可知,本申请实施本文档来自技高网...
页面文案的处理方法及装置

【技术保护点】
一种页面文案的处理方法,其特征在于,包括:确定待处理的页面文案中所包括的至少一个词汇;获得每个词汇在所述页面文案所属第一语言版本系统中的当前密度值;根据所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个词汇在第二语言版本系统中的历史密度值中的至少一项,以及所述获得的每个词汇在所述第一语言版本系统中的当前密度值,确定所述页面文案是否存在异常现象;其中,所述第一语言版本系统与所述第二语言版本系统为属于同一个多语言系统的不同语言版本系统。

【技术特征摘要】
1.一种页面文案的处理方法,其特征在于,包括:
确定待处理的页面文案中所包括的至少一个词汇;
获得每个词汇在所述页面文案所属第一语言版本系统中的当前密度值;
根据所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个
词汇在第二语言版本系统中的历史密度值中的至少一项,以及所述获得的每
个词汇在所述第一语言版本系统中的当前密度值,确定所述页面文案是否存
在异常现象;其中,
所述第一语言版本系统与所述第二语言版本系统为属于同一个多语言系
统的不同语言版本系统。
2.根据权利要求1所述的方法,其特征在于,所述页面文案包括邮件文
案、文档文案或Web页面文案。
3.根据权利要求1所述的方法,其特征在于,所述获得每个词汇在所述
第一语言版本系统中的当前密度值,包括:
根据Di=(ti+ai)/(T+A),获得每个词汇在所述第一语言版本系统中的当前密
度值;
其中,
i表示第i个词汇,取值为自然数;
ti表示第i个词汇在所述页面文案中出现的次数;
ai表示第i个词汇在所述第一语言版本系统中出现的历史次数;
T表示所述页面文案中的词汇总量;
A表示所述第一语言版本系统中的历史词汇总量;
Di表示第i个词汇在所述第一语言版本系统中的当前密度值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述每个词汇在
所述第一语言版本系统中的历史密度值和所述每个词汇在第二语言版本系统
中的历史密度值中的至少一项,以及所述获得的每个词汇在所述第一语言版

\t本系统中的当前密度值,确定所述页面文案是否存在异常现象之前,还包括:
获得所述每个词汇在所述第一语言版本系统中的历史密度值;和/或
获得所述每个词汇在所述第二语言版本系统中的历史密度值。
5.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述根据
所述每个词汇在所述第一语言版本系统中的历史密度值和所述每个词汇在第
二语言版本系统中的历史密度值中的至少一项,以及所述获得的每个词汇在
所述第一语言版本系统中的当前密度值,确定所述页面文案是否存在异常现
象,包括:
若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第一语
言版本系统中的历史密度值为0,确定所述页面文案是否存在异常现象;或者
若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第二语
言版本系统中部分系统中的历史密度值大于0,确定所述页面文案是否存在异
常现象;或者
若词汇在所述第一语言版本系统中的当前密度值大于0,且在所述第二语
言版本系统中的历史密度值大于0,以及该词汇在所述第一语言版本系统中的
当前密度值,与,该词汇在所述第二语言版本系统中的历史密度值,的差值,
大于或等于预先设置的密度阈值,确定所述页面...

【专利技术属性】
技术研发人员:丁世远
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1