一种专家人脉关系图谱绘制方法及系统技术方案

技术编号:24010840 阅读:23 留言:0更新日期:2020-05-02 01:41
本发明专利技术公开一种专家人脉关系图谱绘制方法及系统,涉及互联网技术领域,包括:针对每个专家,于网络中爬取专家关联的若干学术数据;根据第一预设规则对各学术数据进行分析得到专家的师生关系;根据第二预设规则对各学术数据进行分析得到专家的同门关系;根据第三预设规则对各学术数据进行分析得到专家的校友关系;根据第四预设规则对各学术数据进行分析得到专家的同学关系;根据师生关系、同门关系、校友关系和同学关系绘制得到专家的专家人脉关系图谱。本发明专利技术节省大量人力物力,提高资源利用率;高效准确推荐人才资源,为社会提供优质人才链;对数据采集主体影响微小,可为社会各领域提供研究价值。

A drawing method and system of expert relationship map

【技术实现步骤摘要】
一种专家人脉关系图谱绘制方法及系统
本专利技术涉及互联网
,具体涉及一种专家人脉关系图谱绘制方法及系统。
技术介绍
目前专家人脉关系图谱的采集技术局限于人工问卷调查、走访调查等形式,而现社会交通便利,人口流动性太强,导致数据采集普遍率低、采集效率低,存在数据缺失或者数据误判等情况。现有人脉图谱的来源仅限某些垄断部门(如公安部)专职负责,亲人关系可从户口登记处查看,关系安全保密性系数较高,获取困难且会有更新不及时、造假难防等情况。现阶段各种社交软件层出不穷,纷繁复杂,一人多应用,一人多账号,千人千面,用户登记信息不真实,多重身份难辨,给人际关系的采集和处理带来极大的困难。因人际关系涉及网络广,同一个人的人脉关系极其有限,覆盖率不全,信息收集量较少,不利于人脉关系图谱的绘制。
技术实现思路
本专利技术的目的在于提供一种专家人脉关系图谱绘制方法及系统。为达此目的,本专利技术采用以下技术方案:提供一种专家人脉关系图谱绘制方法,包括以下步骤:步骤S1,针对每个专家,于网络中爬取所述专家关联的若干学术数据;步骤S2,根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;步骤S3,根据第二预设规则对各所述学术数据进行分析得到所述专家的同门关系;步骤S4,根据第三预设规则对各所述学术数据进行分析得到所述专家的校友关系;步骤S5,根据第四预设规则对各所述学术数据进行分析得到所述专家的同学关系;步骤S6,根据所述师生关系、所述同门关系、所述校友关系和所述同学关系绘制得到所述专家的专家人脉关系图谱。作为专利技术的一种优选方案,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第一预设规则为通过导师与指导学生的所述对应关系分析得到所述专家的师生关系;和/或所述学术数据为所述专家关联的学术文章,则所述第一预设规则为通过将所述学术文章中的联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第一相似度,并在所述第一相似度大于预设的一第一相似度阈值时判定所述专家与对应的所述其他学术文章的作者为师生关系;和/或所述学术数据为所述专家关联的若干学术成果,则所述第一预设规则为统计各所述学术成果中关联的致谢人员名单,计算各所述致谢人员名单中每个致谢人员的姓名出现的频率,并在所述频率大于预设的第一频率阈值时判定所述专家与对应的所述致谢人员为师生关系;和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第一预设规则为计算所述出版社的出版内容与所述学术成果的第二相似度,并在所述第二相似度大于预设的第二相似度阈值时判定所述专家与所述出版内容的作者为师生关系;和/或所述学术数据为所述专家的网页浏览记录,则所述第一预设规则为获取所述专家的IP地址,并判定与所述IP地址处于同一局域网的具有相同所述网页浏览记录且浏览频率相同的人员和所述专家为师生关系;和/或所述学术数据为所述专家参加的学术交流活动的团队人员名单,则所述第一预设规则为通过所述团队人员名单分析得到所述专家的师生关系;和/或所述学术数据为所述专家关联的学位论文,则所述第一预设规则为通过所述学位论文中记录的作者及指导教师得到所述专家的师生关系。作为专利技术的一种优选方案,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第二预设规则为通过导师与指导学生的所述对应关系分析得到与所述专家具有同一导师的指导学生和所述专家为同门关系;和/或所述学术数据为所述专家关联的学术文章,则所述第二预设规则为通过获取所述学术文章的共同作者,并判定所述共同作者与所述专家为同门关系;和/或所述学术数据为所述专家关联的学术成果,则所述第二预设规则为将所述学术成果中与所述专家并列提及的作者判定为和所述专家为同门关系;和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第二预设规则为计算所述出版社的出版内容与所述学术成果的第三相似度,并在所述第三相似度大于预设的第三相似度阈值时判定所述专家与所述出版内容的作者为同门关系;和/或所述学术数据为所述专家关联的学术文章中的联系方式,则所述第二预设规则为将所述联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第四相似度,并在所述第四相似度大于预设的一第四相似度阈值时判定所述专家与对应的所述其他学术文章的作者为同门关系;和/或所述学术数据为所述专家的网页浏览记录,则所述第二预设规则为为获取所述专家的IP地址,并判定与所述IP地址处于同一局域网的具有相同所述网页浏览记录且浏览频率不同的人员和所述专家为同门关系;所述浏览频率小于第二频率阈值;和/或所述学术数据为所述专家参加的学术交流活动的团队人员名单,则所述第二预设规则为通过所述团队人员名单分析得到所述专家的同门关系;和/或所述学术数据为所述专家的学术文章,则所述第二预设规则为计算所述学术文章与网络中的其他学术文章之间的第五相似度,并在所述第五相似度大于预设的第五相似度阈值时判定所述专家与对应的所述其他学术文章的作者为同门关系。作为专利技术的一种优选方案,所述学术数据为所述专家参加的高校官网校园活动,则所述第三预设规则为通过获取所述高效官网校园活动的参与人员,并判定所述专家与所述参与人员为校友关系;和/或所述学术数据为所述专家的关联院校,则所述第三预设规则为获取各大公司官网的人才资源信息,并判定所述人才资源信息中具有相同所述关联院校的人员与所述专家为校友关系;和/或所述学术数据为所述专家的网页浏览记录,则所述第三预设规则为根据所述网页浏览记录关联的IP地址获取与所述IP地址相似的若干相似IP地址,计算所述IP地址与各所述相似IP地址之间的第六相似度,并在所述第六相似度大于预设的第六相似度阈值时判定所述专家与对应的所述相似IP地址的使用者为校友关系;和/或所述学术数据为所述专家的人才官网信息,则所述第三预设规则为根据所述人才官网信息提取所述专家的教育经历,并判定具有相同教育经历的人群与所述专家为校友关系;和/或所述学术数据为所述专家的学术文章,则所述第三预设规则为根据所述学术文章的出处,判定具有相同所述出处的其他学术文章的作者与所述专家为校友关系。作为专利技术的一种优选方案,所述学术数据为所述专家的学位论文,则所述第四预设规则为根据所述学位论文关联的毕业院校,和/或专业,和/或学历,和/或毕业时间分析得到所述专家的同学关系。一种专家人脉关系图谱绘制系统,应用以上任意一项所述的专家人脉关系图谱绘制方法,所述专家人脉关系图谱绘制系统具体包括:数据获取模块,用于针对每个专家,于网络中爬取所述专家关联的若干学术数据;第一处理模块,连接所述数据获取模块,用于根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;第二处理模块,连接所述数据获取模块,用于根据第二预设规则对各所述学术数据进行分析得到所述专家的同门本文档来自技高网...

【技术保护点】
1.一种专家人脉关系图谱绘制方法,其特征在于,包括以下步骤:/n步骤S1,针对每个专家,于网络中爬取所述专家关联的若干学术数据;/n步骤S2,根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;/n步骤S3,根据第二预设规则对各所述学术数据进行分析得到所述专家的同门关系;/n步骤S4,根据第三预设规则对各所述学术数据进行分析得到所述专家的校友关系;/n步骤S5,根据第四预设规则对各所述学术数据进行分析得到所述专家的同学关系;/n步骤S6,根据所述师生关系、所述同门关系、所述校友关系和所述同学关系绘制得到所述专家的专家人脉关系图谱。/n

【技术特征摘要】
1.一种专家人脉关系图谱绘制方法,其特征在于,包括以下步骤:
步骤S1,针对每个专家,于网络中爬取所述专家关联的若干学术数据;
步骤S2,根据第一预设规则对各所述学术数据进行分析得到所述专家的师生关系;
步骤S3,根据第二预设规则对各所述学术数据进行分析得到所述专家的同门关系;
步骤S4,根据第三预设规则对各所述学术数据进行分析得到所述专家的校友关系;
步骤S5,根据第四预设规则对各所述学术数据进行分析得到所述专家的同学关系;
步骤S6,根据所述师生关系、所述同门关系、所述校友关系和所述同学关系绘制得到所述专家的专家人脉关系图谱。


2.根据权利要求1所述的专家人脉关系图谱绘制方法,其特征在于,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第一预设规则为通过导师与指导学生的所述对应关系分析得到所述专家的师生关系;
和/或所述学术数据为所述专家关联的学术文章,则所述第一预设规则为通过将所述学术文章中的联系方式与网络中的其他学术文章中的联系方式进行匹配,计算匹配得到的第一相似度,并在所述第一相似度大于预设的一第一相似度阈值时判定所述专家与对应的所述其他学术文章的作者为师生关系;
和/或所述学术数据为所述专家关联的若干学术成果,则所述第一预设规则为统计各所述学术成果中关联的致谢人员名单,计算各所述致谢人员名单中每个致谢人员的姓名出现的频率,并在所述频率大于预设的第一频率阈值时判定所述专家与对应的所述致谢人员为师生关系;
和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第一预设规则为计算所述出版社的出版内容与所述学术成果的第二相似度,并在所述第二相似度大于预设的第二相似度阈值时判定所述专家与所述出版内容的作者为师生关系;
和/或所述学术数据为所述专家的网页浏览记录,则所述第一预设规则为获取所述专家的IP地址,并判定与所述IP地址处于同一局域网的具有相同所述网页浏览记录且浏览频率相同的人员和所述专家为师生关系;
和/或所述学术数据为所述专家参加的学术交流活动的团队人员名单,则所述第一预设规则为通过所述团队人员名单分析得到所述专家的师生关系;
和/或所述学术数据为所述专家关联的学位论文,则所述第一预设规则为通过所述学位论文中记录的作者及指导教师得到所述专家的师生关系。


3.根据权利要求1所述的专家人脉关系图谱绘制方法,其特征在于,所述学术数据为高校官网的科研人才团队模块中记录的导师与指导学生的对应关系,则所述第二预设规则为通过导师与指导学生的所述对应关系分析得到与所述专家具有同一导师的指导学生和所述专家为同门关系;
和/或所述学术数据为所述专家关联的学术文章,则所述第二预设规则为通过获取所述学术文章的共同作者,并判定所述共同作者与所述专家为同门关系;
和/或所述学术数据为所述专家关联的学术成果,则所述第二预设规则为将所述学术成果中与所述专家并列提及的作者判定为和所述专家为同门关系;
和/或所述学术数据为所述专家的所述学术成果发表的出版社,则所述第二预设规则为计算所述出版社的出版内容与所述学术成果的第三相似度,并在所述第三相似度大于预设的第三相似度阈值时判定所述专家与所述出版内容的作者为同门关系;
和/或所述学术数据为所述专家关联的学术文章中的联系方式,则所述第二预设规则为将所述联系方式与网络...

【专利技术属性】
技术研发人员:龚才春张发恩张婷
申请(专利权)人:创新奇智青岛科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1