【技术实现步骤摘要】
译员基因的选取方法、装置与电子设备
本专利技术实施例涉及数据处理
,更具体地,涉及一种译员基因的选取方法、装置与电子设备。
技术介绍
信息时代和网络化使翻译工作方式发生了很大的变化。利用翻译流程管理平台,根据不同对象储存人才资料,以根据待翻译的稿件匹配出最适合的译员。不同的译员,其所包含的关键信息不尽相同,则根据这些关键信息,可以为译员匹配最适合的翻译稿件,从而有效提高翻译效率和翻译准确性。译员与稿件的基因匹配是指将稿件基因与译员基因在既定策略下通过匹配模型,实现为稿件找到最佳译员的过程。所选取的用于进行基因匹配的译员基因与其它译员基因相比,应该能够更好的体现译员的差异性,如此才能为待翻译稿件匹配到更适合的译员。译员基因主要指通过对译员特征属性进行分析计算、量化处理,所获取到的存在于特定译员的、区别于其他译员的、独一无二的关键信息组合。译员基因的来源渠道很多,在社交时代,译员的一举一动的所有数据均可以提取出基因来。译员基因存在于管理平台的所有译员中,不同译员具备不同的译员基因。由于具体应用的不同,目前存在的译员/文稿基因匹配算法在选择译员的待匹配基因进行匹配计算时,常根据经验来选择相应的基因组合。但是,在译员工作过程中,基因会随着能力的提升、时间的增加、知识的积累而发生相应的变化。即随着任务的处理、审校和QC的评价、历史语料的积累、社区活动的参与以及译员能力的测试等活动,译员基因将不断更新。因此,上述依据经验的译员基因选择方式会存在一定的局限性,导致选择出的译员基因不能很好的体现译员间的差异性。
技术实现思路
为了克服上述问题或者至少部分地解决上述问题, ...
【技术保护点】
1.一种译员基因的选取方法,其特征在于,包括:从备选译员基因列表中,分别选取多组不同的基因,构成多个译员基因组;对于每一个所述译员基因组,进行多次匹配结果采样,获取多个匹配成功率样本,并基于所述多个匹配成功率样本,计算该译员基因组对应的匹配成功率的均值和标准差;选取所有所述均值中的最大者对应的译员基因组,定义为最大译员基因组,并将所述最大译员基因组的所述均值定义为最大均值,将所述最大译员基因组的所述标准差定义为最大标准差;对于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组,基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值;基于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值,从所有所述译员基因组中选取满足设定条件的译员基因组,并将所述满足设定条件的译员基因组中的基因和所述最大译员基因组中的基因合并,获取最终选取的译员基因;其中,所述Z值表示大样本差异性验证中Z值。
【技术特征摘要】
1.一种译员基因的选取方法,其特征在于,包括:从备选译员基因列表中,分别选取多组不同的基因,构成多个译员基因组;对于每一个所述译员基因组,进行多次匹配结果采样,获取多个匹配成功率样本,并基于所述多个匹配成功率样本,计算该译员基因组对应的匹配成功率的均值和标准差;选取所有所述均值中的最大者对应的译员基因组,定义为最大译员基因组,并将所述最大译员基因组的所述均值定义为最大均值,将所述最大译员基因组的所述标准差定义为最大标准差;对于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组,基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值;基于所有所述译员基因组中除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值,从所有所述译员基因组中选取满足设定条件的译员基因组,并将所述满足设定条件的译员基因组中的基因和所述最大译员基因组中的基因合并,获取最终选取的译员基因;其中,所述Z值表示大样本差异性验证中Z值。2.根据权利要求1所述的方法,其特征在于,在所述从备选译员基因列表中,分别选取多组不同的基因的步骤之前,还包括:分别从译员的所有基础信息、能力信息、信用信息和经验信息中提取相应的基因,并对应形成译员的基础信息基因、能力信息基因、信用信息基因和经验信息基因;基于所述基础信息基因、能力信息基因、信用信息基因和经验信息基因,构成所述备选译员基因列表。3.根据权利要求1所述的方法,其特征在于,所述基于该译员基因组对应的所述均值和所述标准差,以及所述最大均值和所述最大标准差,计算该译员基因组对应的Z值的步骤进一步包括:利用如下计算公式,计算所有所述译员基因组中,除所述最大译员基因组之外的每一个所述译员基因组对应的所述Z值:式中,Zi表示第i个译员基因组对应的所述Z值,n表示每个译员基因组对应的所述匹配成功率样本的个数,Ei表示第i个译员基因组对应的所述均值,Si表示第i个译员基因组对应的所述标准差,Emax表示所述最大均值,Smax表示所述最大标准差。4.根据权利要求1所述的方法,其特征在于,所述进行多次匹配结果采样,获取多个匹配成功率样本的步骤进一步包括:对于任一轮所述多次匹配结果采样,执行如下处理流程:对所有所述译员基因组的匹配成功率的初始值进行初始设定;从所有所述译员基因组中随机选取一个所述译员基因组,对选取的该译员基因组进行匹配试验,并基于对该译员基因组本次匹配试验的匹配成功率结果与历史匹配成功率结果,更新该译员基因组当前的匹...
【专利技术属性】
技术研发人员:张芃,
申请(专利权)人:语联网武汉信息技术有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。