译员基因的选取方法、装置与电子设备制造方法及图纸

技术编号:20548189 阅读:21 留言:0更新日期:2019-03-09 20:46
本发明专利技术实施例提供一种译员基因的选取方法、装置与电子设备,该方法包括:分别选取多个译员基因组;对于每个译员基因组,获取多个匹配成功率样本,并据此计算该译员基因组对应的匹配成功率的均值和标准差;选取所有均值中的最大者对应的稿件基因组作为最大稿件基因组,并将其均值和标准差分别定义为最大均值和最大标准差;对于除最大稿件基因组之外的每个稿件基因组,基于其对应的均值和标准差,以及最大均值和最大标准差,计算其对应的Z值;基于每一个译员基因组对应的Z值,将满足设定条件的译员基因组中的基因和最大译员基因组中的基因合并,获取最终选取的译员基因。本发明专利技术实施例能够使得选取出的译员基因能够更好的体现译员间的差异性。

【技术实现步骤摘要】
译员基因的选取方法、装置与电子设备
本专利技术实施例涉及数据处理
,更具体地,涉及一种译员基因的选取方法、装置与电子设备。
技术介绍
信息时代和网络化使翻译工作方式发生了很大的变化。利用翻译流程管理平台,根据不同对象储存人才资料,以根据待翻译的稿件匹配出最适合的译员。不同的译员,其所包含的关键信息不尽相同,则根据这些关键信息,可以为译员匹配最适合的翻译稿件,从而有效提高翻译效率和翻译准确性。译员与稿件的基因匹配是指将稿件基因与译员基因在既定策略下通过匹配模型,实现为稿件找到最佳译员的过程。所选取的用于进行基因匹配的译员基因与其它译员基因相比,应该能够更好的体现译员的差异性,如此才能为待翻译稿件匹配到更适合的译员。译员基因主要指通过对译员特征属性进行分析计算、量化处理,所获取到的存在于特定译员的、区别于其他译员的、独一无二的关键信息组合。译员基因的来源渠道很多,在社交时代,译员的一举一动的所有数据均可以提取出基因来。译员基因存在于管理平台的所有译员中,不同译员具备不同的译员基因。由于具体应用的不同,目前存在的译员/文稿基因匹配算法在选择译员的待匹配基因进行匹配计算时,常根据经验来选择相应的基因组合。但是,在译员工作过程中,基因会随着能力的提升、时间的增加、知识的积累而发生相应的变化。即随着任务的处理、审校和QC的评价、历史语料的积累、社区活动的参与以及译员能力的测试等活动,译员基因将不断更新。因此,上述依据经验的译员基因选择方式会存在一定的局限性,导致选择出的译员基因不能很好的体现译员间的差异性。
技术实现思路
为了克服上述问题或者至少部分地解决上述问题,本专利技术实施例提供一种译员基因的选取方法、装置与电子设备,用以使得选取出的译员基因能够更好的体现译员间的差异性。第一方面,本专利技术实施例提供一种译员基因的选取方法,包括:从备选译员基因列表中,分别选取多组不同的基因,构成多个译员基因组;对于每一个所述译员基因组,进行多次匹配结果采样,获取多个匹配成功率样本,并基于所述多个匹配成功率样本,计算该译员基因组对应的匹配成功率的均值和标准差;选取所有所述均值中的最大者对应的译员基因组,定义为最大译员基因组,并将所述最大译员基因组的所述均值定义为最大均值,将所述最大译员基因组的所述标准差定义为最大标准差;对于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组,基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值;基于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值,从所有所述译员基因组中选取满足设定条件的译员基因组,并将所述满足设定条件的译员基因组中的基因和所述最大译员基因组中的基因合并,获取最终选取的译员基因;其中,所述Z值表示大样本差异性验证中Z值。第二方面,本专利技术实施例提供一种译员基因的选取装置,包括:初始基因选取模块,用于从备选译员基因列表中,分别选取多组不同的基因,构成多个译员基因组;第一计算模块,用于对于每一个所述译员基因组,进行多次匹配结果采样,获取多个匹配成功率样本,并基于所述多个匹配成功率样本,计算该译员基因组对应的匹配成功率的均值和标准差;最大基因组选取模块,用于选取所有所述均值中的最大者对应的译员基因组,定义为最大译员基因组,并将所述最大译员基因组的所述均值定义为最大均值,将所述最大译员基因组的所述标准差定义为最大标准差;第二计算模块,用于对于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组,基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值;最终基因选取模块,用于基于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值,从所有所述译员基因组中选取满足设定条件的译员基因组,并将所述满足设定条件的译员基因组中的基因和所述最大译员基因组中的基因合并,获取最终选取的译员基因;其中,所述Z值表示大样本差异性验证中Z值。第三方面,本专利技术实施例提供一种电子设备,包括:至少一个存储器、至少一个处理器、通信接口和总线;所述存储器、所述处理器和所述通信接口通过所述总线完成相互间的通信,所述通信接口用于所述电子设备与译员信息设备之间的信息传输;所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上第一方面所述的译员基因的选取方法。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上第一方面所述的译员基因的选取方法。本专利技术实施例提供的译员基因的选取方法、装置与电子设备,通过预先从所有译员的译员基因池中选取多组译员基因组,并通过计算这些译员基因组所对应的Z值,来选取Z值满足设定条件的译员基因组,以作为最终的选取结果,使得选取出的译员基因能够更好的体现译员间的差异性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的译员基因的选取方法的流程示意图;图2为根据本专利技术实施例提供的译员基因的选取方法中译员特征与译员基因的关系示意图;图3为本专利技术实施例提供的译员基因的选取装置的结构示意图;图4为本专利技术实施例提供的电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术实施例的一部分实施例,而不是全部的实施例。基于本专利技术实施例中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术实施例保护的范围。译员基因的来源渠道很多,在社交时代,译员的一举一动的所有数据均可以提取出基因来。由于具体应用的不同,目前存在的译员/文稿基因匹配算法在选择译员的待匹配基因进行匹配计算时,常根据经验来选择相应的基因组合。但是,传统方法具有一定的局限性,导致选择出的译员基因不能很好的体现译员的差异性。针对上述问题,本专利技术实施例通过预先从译员的译员基因池中选取多组译员基因组,并通过计算这些译员基因组所对应的Z值,来选取Z值满足设定条件的译员基因组,以作为最终的选取结果,使得选取出的译员基因能够更好的体现译员间的差异性。其中,Z值表示大样本差异性验证中Z值。作为本专利技术实施例的一个方面,本实施例提供一种译员基因的选取方法,参考图1,为本专利技术实施例提供的译员基因的选取方法的流程示意图,包括:S101,从备选译员基因列表中,分别选取多组不同的基因,构成多个译员基因组。可以理解为,在进行本实施例的译员基因选取之前,事先会根据译员的所有属性信息建立一个备选译员基因列表,该备选译员基因列表中可以包含与译员特定属性相关的所有基因。具体的,该备选译员基因列表可以认为是一个基因池,在该基因池中以基因为单位存放有从所有译员中提取的与译员信息相关的基因本文档来自技高网...

【技术保护点】
1.一种译员基因的选取方法,其特征在于,包括:从备选译员基因列表中,分别选取多组不同的基因,构成多个译员基因组;对于每一个所述译员基因组,进行多次匹配结果采样,获取多个匹配成功率样本,并基于所述多个匹配成功率样本,计算该译员基因组对应的匹配成功率的均值和标准差;选取所有所述均值中的最大者对应的译员基因组,定义为最大译员基因组,并将所述最大译员基因组的所述均值定义为最大均值,将所述最大译员基因组的所述标准差定义为最大标准差;对于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组,基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值;基于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值,从所有所述译员基因组中选取满足设定条件的译员基因组,并将所述满足设定条件的译员基因组中的基因和所述最大译员基因组中的基因合并,获取最终选取的译员基因;其中,所述Z值表示大样本差异性验证中Z值。

【技术特征摘要】
1.一种译员基因的选取方法,其特征在于,包括:从备选译员基因列表中,分别选取多组不同的基因,构成多个译员基因组;对于每一个所述译员基因组,进行多次匹配结果采样,获取多个匹配成功率样本,并基于所述多个匹配成功率样本,计算该译员基因组对应的匹配成功率的均值和标准差;选取所有所述均值中的最大者对应的译员基因组,定义为最大译员基因组,并将所述最大译员基因组的所述均值定义为最大均值,将所述最大译员基因组的所述标准差定义为最大标准差;对于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组,基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值;基于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值,从所有所述译员基因组中选取满足设定条件的译员基因组,并将所述满足设定条件的译员基因组中的基因和所述最大译员基因组中的基因合并,获取最终选取的译员基因;其中,所述Z值表示大样本差异性验证中Z值。2.根据权利要求1所述的方法,其特征在于,在所述从备选译员基因列表中,分别选取多组不同的基因的步骤之前,还包括:分别从译员的所有基础信息、能力信息、信用信息和经验信息中提取相应的基因,并对应形成译员的基础信息基因、能力信息基因、信用信息基因和经验信息基因;基于所述基础信息基因、能力信息基因、信用信息基因和经验信息基因,构成所述备选译员基因列表。3.根据权利要求1所述的方法,其特征在于,所述基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值的步骤进一步包括:利用如下计算公式,计算所有所述译员基因组中,除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值:式中,Zi表示第i个译员基因组对应的所述Z值,n表示每个译员基因组对应的所述匹配成功率样本的个数,Ei表示第i个译员基因组对应的所述均值,Si表示第i个译员基因组对应的所述标准差,Emax表示所述最大均值,Smax表示所述最大标准差。4.根据权利要求1所述的方法,其特征在于,所述进行多次匹配结果采样,获取多个匹配成功率样本的步骤进一步包括:对于任一轮所述多次匹配结果采样,执行如下处理流程:对所有所述译员基因组的匹配成功率的初始值进行初始设定;从所有所述译员基因组中随机选取一个所述译员基因组,对选取的该译员基因组进行匹配试验,并基于对该译员基因组本次匹配试验的匹配成功率结果与历史匹配成功率结果,更新该译员基因组当前的匹...

【专利技术属性】
技术研发人员:张芃
申请(专利权)人:语联网武汉信息技术有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1