一种将中国专家英文文献的英文署名转换为中文名的方法技术

技术编号:22218805 阅读:102 留言:0更新日期:2019-09-30 01:13
本发明专利技术公开了一种将中国专家英文文献的英文署名转换为中文名的方法,包括以下步骤:S1、从选定的英文文献库中挑选出h指数达到预设值的中国顶尖专家发表的论文,构建中国顶尖专家论文库;S2、以人工方式将中国顶尖专家的英文名翻译为中文名;S3、从选定的英文文献库中构建中国顶尖专家的英文文献合作网络库;S4、从选定的中文文献库中构建中国顶尖专家的中文文献合作网络库;S5、将所述英文文献合作网络库的其他英文署名与所述中文文献合作网络库的其他中文署名进行比对,得出其他英文署名对应的中文名。本发明专利技术在人工翻译的基础上,实现自动查找和核实合作者的中英文名信息,减少了查询相关科研人员科研信息所需耗费的时间。

A Method of Converting English Signatures of Chinese Experts'English Documents into Chinese Names

【技术实现步骤摘要】
一种将中国专家英文文献的英文署名转换为中文名的方法
本专利技术涉及数据挖掘,尤其涉及一种将中国专家英文文献的英文署名转换为中文名的方法。
技术介绍
科研人员一般都会在国内以及国际上发表研究成果,即包括中文文献和英文文献在内。如果是中国顶尖专家,则一般都比较容易找得到其所发表的中文文献和英文文献。但是如果不是中国顶尖专家的科研人员,则要找全其所发表的中文文献和英文文献,则存在困难,因为其公开的信息相对较少,不容易核实确认,且存在的重名的可能性。如果通过人工来查找和核实的话,会存在很大的障碍,增加了很多不必要的工作负担。
技术实现思路
为了解决查询中国非顶尖专家的科研人员发表科研成果信息困难的技术问题,本专利技术提出了一种将中国专家英文文献的英文署名转换为中文名的方法。一种将中国专家英文文献的英文署名转换为中文名的方法,包括以下步骤:S1、从选定的英文文献库中挑选出h指数达到预设值的中国顶尖专家发表的论文,构建中国顶尖专家论文库;S2、以人工方式将中国顶尖专家的英文名翻译为中文名;S3、从选定的英文文献库中构建中国顶尖专家的英文文献合作网络库;S4、从选定的中文文献库中构建中国顶尖专家的中文文献合作网络库;S5、将所述英文文献合作网络库的其他英文署名与所述中文文献合作网络库的其他中文署名进行比对,得出其他英文署名对应的中文名。较佳的,S1包括以下步骤:按照h指数为第一排序维度,发文量为第二排序维度,对中国顶尖专家进行排序,h指数越高,发文量越大,则排名越靠前。较佳的,S2包括以下步骤:按照排名的顺序人工翻译中国顶尖专家的英文名。较佳的,S3包括以下步骤:S31、按照排名的顺序选择中国顶尖专家;S32、通过选定的英文文献库提供的接口,抓取该中国顶尖专家发表的文章放入该中国顶尖专家的英文文献库中;S33、从该中国顶尖专家的英文文献库中提取合作者姓名,合作者每与该中国顶尖专家合作一篇文章,则合作次数加1;S34、按照与该中国顶尖专家的英文文献合作次数从多到少依次排序合作者。较佳的,S4包括以下步骤:S41、按照排名的顺序选择中国顶尖专家;S42、通过选定的中文文献库提供的接口,抓取该中国顶尖专家发表的文章放入该中国顶尖专家的中文文献库中;S43、从该中国顶尖专家的中文文献库中提取合作者姓名,合作者每与该中国顶尖专家合作一篇文章,则合作次数加1。较佳的,S5包括以下步骤:将中国顶尖专家的中文文献合作网络库的合作者的中文名翻译为英文名,按照与该中国顶尖专家的英文文献合作次数从多到少的顺序,将英文文献的合作者英文名与翻译好的中文文献的合作者的英文名进行对比,若相同,则实现中国专家英文名转换为中文名。与现有技术相比,本专利技术的有益效果是:本专利技术从中国顶尖专家作为突破口,构建英文文献合作网络库以及中文文献合作网络库,获得合作者中英文名信息,通过中英文署名的对比,得出合作者的确切的中英文名信息;本专利技术只需要对中国顶尖专家进行人工翻译,而利用文献计量学、图论、统计学以及计算机技术实现自动查找和核实中国顶尖专家的合作者的中英文名信息,大大减少了查找科研人员相关信息所需要耗费的时间。当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。附图说明图1为本专利技术的一种将中国专家英文文献的英文署名转换为中文名的方法的流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。如图1所示,一种将中国专家英文文献的英文署名转换为中文名的方法,包括以下步骤:S1、从选定的英文文献库中挑选出h指数达到预设值的中国顶尖专家发表的论文,构建中国顶尖专家论文库。以Elsevier的Scopus数据库为基础,以百家姓为规则,挑选中国顶尖专家和其论文,构建中国专家库。按照h指数为第一排序维度,发文量为第二排序维度,对中国专家进行排序。每500名专家分为一段,从高到低给每一段编号,依次为1号段、2号段、3号段……数字越小,其中的专家水平越顶尖。姓名翻译的顺序是按序号从高到底做。S2、以人工方式将中国顶尖专家的英文名翻译为中文名。按照排名的顺序人工翻译中国顶尖专家的英文名。这里以ZhaoDongyuan为例,其姓名为三个字,重名的概率低,同时其发文量为682篇,H指数为133。像这种三个字的顶尖专家重名的可能性微乎其微,可以忽略不计。中国顶尖专家的中文名翻译采用人工方式,因为中国顶尖专家的相关信息在互联网上是非常丰富的,比较容易找到。ZhaoDongyuan对应着复旦大学的赵东元院士。S3、从选定的英文文献库中构建中国顶尖专家的英文文献合作网络库。通过论文的合作关系构建中国顶尖专家的合作网络。以步骤S1的中国顶尖专家名单为基础,通过Elsevier提供的接口,抓取这些专家发表的文章放入中国顶尖专家的文章库中。从文章中提取合作者姓名,每合作一篇文章,则合作次数加1,存入到数据库中,从而形成了中国顶尖专家的英文文献合作网络库。其中,硬件采用普通PC服务器,开发语言为java,文件系统采用Hadoop分布式文件系统,数据库为HBase,算法是map-reduce。作为一种实施例,S3包括以下步骤:S31、按照排名的顺序选择中国顶尖专家;S32、通过选定的英文文献库提供的接口,抓取该中国顶尖专家发表的文章放入该中国顶尖专家的英文文献库中;S33、从该中国顶尖专家的英文文献库中提取合作者姓名,合作者每与该中国顶尖专家合作一篇文章,则合作次数加1;S34、按照与该中国顶尖专家的英文文献合作次数从多到少依次排序合作者。以赵东元的一篇论文《SynthesisofhighlyorderedmesoporouscrystallineWSandMoSviaahigh-temperaturereductivesulfurationroute》为例,署名作者为ShiYifeng,WanYing,LiuRuili,TuBo,ZhaoDongyuan,作者数量为5,仅考虑合作者与中国顶尖专家之间的合作,这篇文章的合作网络数据的数量为n-1,n为一篇文章的作者数量。将其所有论文形成的合作数据进行合并,形成其合作网络库,形式如表1所示,其中第一列为中国顶尖专家ZhaoDongyuan,第二列为合作者英文名,最后一类为中国顶尖专家与合作者之间的英文文献合作次数,合作次数按从大到小的顺序排列。表1S4、从选定的中文文献库中构建中国顶尖专家的中文文献合作网络库。作为一种实施例,步骤S4包括以下步骤:S41、按照排名的顺序选择中国顶尖专家;S42、通过选定的中文文献库提供的接口,抓取该中国顶尖专家发表的文章放入该中国顶尖专家的中文文献库中;S43、从该中国顶尖专家的中文文献库中提取合作者姓名,合作者每与该中国顶尖专家合作一篇文章,则合作次数加1。以专利号为CN1821182A的专利为例,专利名称为《一种介孔碳材料的制备方法》,专利技术人为:赵东元;刘瑞丽;孟岩;施益峰;张福强;顾栋;万颖;屠波。作者数量为8,仅考虑合作者与中国顶尖专家之间的合作,这篇文章的合作网络数据的数量为n-1,其中n为一篇中文文章或中文专利的作者数量。将所有中文论文或中文专利形成的合作数据进行合并,形成其合作网络库,形式如表2所示,其中第一列是中国顶尖专家中文名赵东元本文档来自技高网...

【技术保护点】
1.一种将中国专家英文文献的英文署名转换为中文名的方法,其特征在于,包括以下步骤:S1、从选定的英文文献库中挑选出h指数达到预设值的中国顶尖专家发表的论文,构建中国顶尖专家论文库;S2、以人工方式将中国顶尖专家的英文名翻译为中文名;S3、从选定的英文文献库中构建中国顶尖专家的英文文献合作网络库;S4、从选定的中文文献库中构建中国顶尖专家的中文文献合作网络库;S5、将所述英文文献合作网络库的其他英文署名与所述中文文献合作网络库的其他中文署名进行比对,得出其他英文署名对应的中文名。

【技术特征摘要】
1.一种将中国专家英文文献的英文署名转换为中文名的方法,其特征在于,包括以下步骤:S1、从选定的英文文献库中挑选出h指数达到预设值的中国顶尖专家发表的论文,构建中国顶尖专家论文库;S2、以人工方式将中国顶尖专家的英文名翻译为中文名;S3、从选定的英文文献库中构建中国顶尖专家的英文文献合作网络库;S4、从选定的中文文献库中构建中国顶尖专家的中文文献合作网络库;S5、将所述英文文献合作网络库的其他英文署名与所述中文文献合作网络库的其他中文署名进行比对,得出其他英文署名对应的中文名。2.根据权利要求1所述的一种将中国专家英文文献的英文署名转换为中文名的方法,其特征在于,S1包括以下步骤:按照h指数为第一排序维度,发文量为第二排序维度,对中国顶尖专家进行排序,h指数越高,发文量越大,则排名越靠前。3.根据权利要求2所述的一种将中国专家英文文献的英文署名转换为中文名的方法,其特征在于,S2包括以下步骤:按照排名的顺序人工翻译中国顶尖专家的英文名。4.根据权利要求3所述的一种将中国专家英文文献的英文署名转换为中文名的方法,其特征在于,S3包括以下步骤:S31、按照排名的顺序选择中...

【专利技术属性】
技术研发人员:刘慧伟胡俊松
申请(专利权)人:上海牵翼网络科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1