The invention discloses a method and a device for the corresponding author e-mail and computer readable storage medium, including the corresponding method of the email Author: mailbox search procedure to find the author's works contain known file and email mailbox; the author appeared statistics statistics in steps, including known authors in the file, the number of known author and the common mailbox file, and email the author together; cooperation acquisition steps, to include known author to the mailbox files appear together in the works, the author get known of the author; collaborators appear together and mailbox statistics statistics in steps, including known authors file the number of collaborators, and common mailbox appears, which means that the author and the mailbox appear together; the process of association between the authors and the mailbox, the mailbox in common The mailbox is associated with the known author when the difference in the amount of occurrence and the common occurrence of the co authors and mailboxes is greater than the predetermined threshold.
【技术实现步骤摘要】
邮箱作者对应方法和装置及计算机可读存储介质
本专利技术涉及信息检索,尤其涉及作者信息的检索。
技术介绍
当检索出文章之后,可能需要和作者进行联系,这种联系可能需要邮箱、电话等方式。有的文章或许会列明一些电话和邮箱,但是通常并不指明是哪个作者的电话和邮箱,还是编辑部门的邮箱,如果检索出来的文章很多的情况,例如需要确定各个作者的邮箱供第三方使用时,更需要更准确的判断作者和邮箱的对应关系,提高对应的准确度。目前的现有技术还没有指示出这种需求,也没有提供相应的解决方案。
技术实现思路
本专利技术鉴于以上情况,提出用于缓解或消除现有技术中存在的一项或更多的缺点,至少提供一种有益的选择。为实现以上目的,根据本专利技术的一个方面,公开了一种邮箱作者对应方法,包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者和邮箱共同出现量统计步骤,统计在包含所述已知作者的作品的文件中,所述已知作者与所述邮箱共同出现的文件的数量,即作者和邮箱共同出现量;合作者获取步骤,针对所述已知作者与所述邮箱共同出现的文件中包含的作品,获得所述已知作者的各合作者;合作者和邮箱共同出现量统计步骤,统计在包含所述已知作者的作品的文件中,各合作者与所述邮箱共同出现的数量,即合作者和邮箱共同出现量;邮箱关联步骤,在所述作者和邮箱共同出现量与各合作者和邮箱共同出现量之差均大于预定阈值时,将所述邮箱与所述已知作者相关联。根据一种实施方式,所述方法还包括:作者和邮箱共同出现率统计步骤,统计所述已知作者与所述邮箱共同出现的文件在包含已知作者的作品的文件中所占的比率,即作者和邮箱共同出现率;合作者和邮箱共同出现 ...
【技术保护点】
一种邮箱作者对应方法,包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者和邮箱共同出现量统计步骤,统计在包含所述已知作者的作品的文件中,所述已知作者与所述邮箱共同出现的文件的数量,即作者和邮箱共同出现量;合作者获取步骤,针对所述已知作者与所述邮箱共同出现的文件中包含的作品,获得所述已知作者的各合作者;合作者和邮箱共同出现量统计步骤,统计在包含所述已知作者的作品的文件中,各合作者与所述邮箱共同出现的数量,即合作者和邮箱共同出现量;邮箱关联步骤,在所述作者和邮箱共同出现量与各合作者和邮箱共同出现量之差均大于预定阈值时,将所述邮箱与所述已知作者相关联。
【技术特征摘要】
1.一种邮箱作者对应方法,包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者和邮箱共同出现量统计步骤,统计在包含所述已知作者的作品的文件中,所述已知作者与所述邮箱共同出现的文件的数量,即作者和邮箱共同出现量;合作者获取步骤,针对所述已知作者与所述邮箱共同出现的文件中包含的作品,获得所述已知作者的各合作者;合作者和邮箱共同出现量统计步骤,统计在包含所述已知作者的作品的文件中,各合作者与所述邮箱共同出现的数量,即合作者和邮箱共同出现量;邮箱关联步骤,在所述作者和邮箱共同出现量与各合作者和邮箱共同出现量之差均大于预定阈值时,将所述邮箱与所述已知作者相关联。2.根据权利要求1所述的邮箱作者对应方法,其特征在于,所述方法还包括:作者和邮箱共同出现率统计步骤,统计所述已知作者与所述邮箱共同出现的文件在包含已知作者的作品的文件中所占的比率,即作者和邮箱共同出现率;合作者和邮箱共同出现率统计步骤,统计各所述合作者与所述邮箱共同出现的文件在包含各合作者的作品的文件中所占的比率,即合作者和邮箱共同出现率;在所述作者和邮箱共同出现量与所述合作者和邮箱共同出现量之差小于预定阈值时,如果所述作者和邮箱共同出现率与各所述合作者和邮箱共同出现率之差均大于预定阈值,则所述邮箱关联步骤将所述邮箱与所述已知作者相关联。3.根据权利要求2所述的邮箱作者对应方法,其特征在于,当所述作者和邮箱共同出现率低于预定阈值时,所述邮箱关联步骤不将所述邮箱与所述已知作者相关联。4.根据权利要求2所述的邮箱作者对应方法,其特征在于,在所述合作者和邮箱共同出现率统计步骤中,在包含各合作者的作品的文件中去除包含已知作者和所述合作者两者的合作作品的文件。5.根据权利要求2所述的邮箱作者对应方法,其特征在于,所述方法还包括:距离计算单元,计算在包括所述已知作者和所述合作者的合作作品的文件中,所述邮箱地址和所述已知作者之间的距离以及所述邮箱地址和所述合作者之间的距离;距离远近概率计算单元,确定所述邮箱地址和所述已知作者之间的距离小于所述邮箱地址和所述合作者之间的距离的概率;当所述邮箱地址和所述已知作者之间的距离小于所述邮箱地址和所述合作者之间的距离的概率大于预定阈值时,所述邮箱关联步骤将所述邮箱和所述已知作者相关联。6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述...
【专利技术属性】
技术研发人员:霍东云,
申请(专利权)人:北京赛时科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。