一种文献参数匹配方法、系统及服务装置制造方法及图纸

技术编号:23149286 阅读:21 留言:0更新日期:2020-01-18 13:33
本发明专利技术公开一种文献参数匹配方法,所述方法包括获取第一文献的第一参数集和第二文献的第二参数集,其中,所述第一文献的待匹配作者姓名与所述第二文献的待匹配作者姓名相同;基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集;基于所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集;对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取所述第一关联检索文献集和所述第二关联检索文献集之间的信息重合度数据集;根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者。利用本发明专利技术,可以较准确判定两篇文献中的同名作者是否为同一作者。

A method, system and service device of document parameter matching

【技术实现步骤摘要】
一种文献参数匹配方法、系统及服务装置
本专利技术涉及计算机
,特别涉及一种文献参数匹配方法、系统及服务装置。
技术介绍
现在很多论文期刊文献已经表明了期刊作者、包括作者机构信息,包括论文期刊文献的中图分类号等信息,这些技术已沉淀多年,在绝大部分情况下,可以很容易通过作者的基本情况(作者姓名、作者单位、作者研究领域)找到作者已发表的论文、期刊文献。但是还是有很多作者同名的情况下,即使是同一个机构下仍有可能出现同名作者并不是同一个作者。有时候可以通过研究领域很容易判断作者是否同一人,比如一作者研究的是计算机、一作者研究的是材料,这时候就很容易判断这两人不是同一人,有时候即使研究领域项目,但文献的差异较大,比如同是研究计算机,一个是研究计算机集成技术,一个是计算机算法,而且其作者姓名具有很大重名可能,这时候判断该两篇文章属于同一个人就比较难了。另外一个学者在跨度较长时间内研究方向是很可能发现变化,而且不同的基金支持方向也可能是不同的,而且期刊所记录的作者单位在这几年内名称很可能发生变化,作者的工作单位也可能发生变化,所以对应普通同名作者只进行机构进行判断容易出错。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种文献参数匹配方法、系统及服务装置,用于解决现有技术中两篇中文文献之间同名作者判定不够准确的技术问题。为实现上述目的及其他相关目的,本专利技术提供一种文献参数匹配方法,所述文献参数匹配方法包括:获取第一文献的第一参数集和第二文献的第二参数集,其中,所述第一文献的待匹配作者姓名与所述第二文献的待匹配作者姓名相同;基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集;基于所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集;对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取所述第一关联检索文献集和所述第二关联检索文献集之间的信息重合度数据集;根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者。在一实施例中,所述第一文献的期刊中图分类号和所述第二文献的期刊中图分类号相同。在一实施例中,所述第一参数集至少包括第一文献的待匹配作者姓名、期刊中图分类号、刊物名称、发表日期、待匹配作者单位、若干共同作者信息或若干文献基金。在一实施例中,所述第二参数集至少包括第二文献的待匹配作者姓名、期刊中图分类号、刊物名称、发表日期、待匹配作者单位、若干共同作者信息或若干文献基金。在一实施例中,所述基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集的步骤包括:选取所述第一参数集中的全部参数作为第一初始检索条件进行文献检索,并记录检索结果;逐步减少所述第一参数集中的参数个数,以此作为第一新检索条件进行文献检索,并分别记录检索结果;汇总所有的检索结果作为所述第一关联检索文献集;其中,所述第一新检索条件中,包括第一文献的待匹配作者姓名,期刊中图分类号,以及第一文献的刊物名称、待匹配作者单位、若干共同作者信息和若干文献基金所构成群组中的至少一个。在一实施例中,所述第一关联检索文献集中按照检索条件中检索参数个数不同和检索参数的不同分为若干层级。在一实施例中,所述基于所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集的步骤包括:选取所述第二参数集中的全部参数作为第二初始检索条件进行文献检索,并记录检索结果;逐步减少所述第二参数集中的参数个数,并以此作为第二新检索条件进行文献检索,并分别记录检索结果;汇总所有的检索结果作为所述第二关联检索文献集;其中,所述第二新检索条件中,至少包括第二文献的待匹配作者姓名,期刊中图分类号,以及第二文献的刊物名称、待匹配作者单位、若干共同作者信息或若干文献基金所构成群组中的至少一个。在一实施例中,所述第二联检索文献集中按照检索条件中检索参数个数不同和检索参数的不同分为若干层级。在一实施例中,所述对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取所述第一关联检索文献集和所述第二关联检索文献集之间的信息重合度数据集的步骤包括:将所述第一关联检索文献集中的任意一篇文献分别与所述第二关联检索文献集的每一篇文献进行关联比较参数的匹配,以获取信息重合度数据子集,其中,所述信息重合度数据子集中的每个数据分别对应所述第二关联检索文献集中一篇文献;遍历所述第一关联检索文献集中的所有文献,以获取所述信息重合度数据集。在一实施例中,所述根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者的步骤包括:获取所述信息重合度数据集中所有数据中的最大值,作为重合度最大值;选取所述第一文献的关联比较参数集的参数个数与所述第二文献的关联比较参数集的参数个数之间的最小值,作为参数最小值;根据所述重合度最大值与所述参数最小值之间的比值判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者。在一实施例中,所述第一文献的关联比较参数集和所述第二文献的关联比较参数集分别包括各自文献的刊物名称、发表日期、待匹配作者单位、若干共同作者信息和若干文献基金。为实现上述目的及其他相关目的,本专利技术还提供一种文献参数匹配系统,所述文献参数匹配系统包括:获取模块,用于获取第一文献的第一参数集和第二文献的第二参数集,其中,所述第一文献的待匹配作者的姓名与所述第二文献的待匹配作者的姓名相同;第一检索模块,用于基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集;第二检索模块,用于基于所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集;信息重合度获取模块,用于对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取两者的信息重合度数据集;确定模块,用于根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者。为实现上述目的及其他相关目的,本专利技术还提供一种所述服务装置,所述服务装置包括:存储器,用于存储计算机程序;处理器,连接所述存储器,用于运行所述计算机程序以执行上述中任意一项所述的文献参数匹配方法。为实现上述目的及其他相关目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序;所述计算机程序运行时执行上述中任意一项所述的文献参数匹配方法。利用本专利技术,可以准确判定出两篇文献之间的同名作者(待匹配作者)是否为同一作者。附图说明图1显示为本专利技术的文献参数匹配方法的流程示意图。图2显示为本专利技术的文献参数匹配方法中第一文献A的文献信息与第二文献B的文献信息的树形结构对比图。图3显示为本专利技术的文献参数匹配方法中基于第一参数集中的全本文档来自技高网...

【技术保护点】
1.一种文献参数匹配方法,其特征在于,包括:/n获取第一文献的第一参数集和第二文献的第二参数集,其中,所述第一文献的待匹配作者姓名与所述第二文献的待匹配作者姓名相同;/n基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集;/n基于所述所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集;/n对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取所述第一关联检索文献集和所述第二关联检索文献集之间的信息重合度数据集;/n根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者。/n

【技术特征摘要】
1.一种文献参数匹配方法,其特征在于,包括:
获取第一文献的第一参数集和第二文献的第二参数集,其中,所述第一文献的待匹配作者姓名与所述第二文献的待匹配作者姓名相同;
基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集;
基于所述所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集;
对所述第一关联检索文献集和所述第二关联检索文献集进行关联匹配,以获取所述第一关联检索文献集和所述第二关联检索文献集之间的信息重合度数据集;
根据所述信息重合度数据集判断所述第一文献的待匹配作者和所述第二文献的待匹配作者是否为同一作者。


2.根据权利要求1所述的文献参数匹配方法,其特征在于,所述第一文献的期刊中图分类号和所述第二文献的期刊中图分类号相同。


3.根据权利要求1所述的文献参数匹配方法,其特征在于,所述第一参数集至少包括第一文献的待匹配作者姓名、期刊中图分类号、刊物名称、发表日期、待匹配作者单位、若干共同作者信息或若干文献基金;所述第二参数集至少包括第二文献的待匹配作者姓名、期刊中图分类号、刊物名称、发表日期、待匹配作者单位、若干共同作者信息或若干文献基金。


4.根据权利要求1所述的文献参数匹配方法,其特征在于,所述基于所述第一参数集进行扩展检索,以获取所述第一文献的第一关联检索文献集的步骤包括:
选取所述第一参数集中的全部参数作为第一初始检索条件进行文献检索,并记录检索结果;
逐步减少所述第一参数集中的参数个数,以此作为第一新检索条件进行文献检索,并分别记录检索结果;
汇总所有的检索结果作为所述第一关联检索文献集。


5.根据权利要求1所述的文献参数匹配方法,其特征在于,所述基于所述第二参数集进行扩展检索,以获取所述第二文献的第二关联检索文献集的步骤包括:
选取所述第二参数集中的全部参数作为第二初始检索条件进行文献检索,并记录检索结果;
逐步减少所述第二参数集中的参数个数,并以此作为第二新检索条件进行文献检索,并分别记录检索结果;
汇总所有的检索结果作为所述第二关联检索文献集。


6.根据权利要求1所述的文献参数匹配方法,其特征在于,所述对所述第一关联检索文献集和所述...

【专利技术属性】
技术研发人员:耿树文王茜黄鹏胡寅骏孙虎
申请(专利权)人:上海科技发展有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1