【技术实现步骤摘要】
【国外来华专利技术】识别组织中的专家和专业领域
技术介绍
一般而言,专家是一个在特定的研究领域具有超越普通人的知识或能力的人。通常,在组织中,员工受益于或需要组织中具有特定专业领域知识或能力的专家的帮助。然而,可能在特定主题中很难知道谁是专家,特别是在大型或分布式组织环境中。
技术实现思路
提供该
技术实现思路
以便以简化的形式来引入下面的具体实施方式中进一步描述的概念的选择。该
技术实现思路
不旨在确定所要求保护的主题的关键特征或主要特征,也不旨在作为用于限定所要求保护的主题的范围的辅助。本公开的方面涉及用于识别组织中的专家和专业领域的自动化系统和方法。专家和专业识别系统包括通信地附接到各种数据存储库的分析处理引擎,专家和专业识别系统从各种数据存储库取回数据,预处理数据,并且使用用于识别词语和短语的算法,从词语和短语中选择前若干个短语作为专业领域。分析处理引擎将选定的专业领域存储在图形结构中。一旦一个或多个专业领域被识别并存储在图形结构中,对于每个专业领域,分析处理引擎针对对一个或多个专业领域的专家的识别和排序而查询图形结构。在专业领域节点和对应的专业领域的专家之间增加了双向图边,以便启用目标查询和 ...
【技术保护点】
一种用于识别组织中的专家的计算机实现的方法,包括:识别专业领域;将所述专业领域作为节点存储在图形结构中;执行针对与所识别的专业领域相关联的信息项的查询;生成针对与所识别的专业领域相关联的每个信息项的每个作者的分数;将与所识别的专业领域相关联的作者排序;选择与所识别的专业领域相关联的排序靠前的作者的子集;确定与所识别的专业领域相关联的排序靠前的作者中的每个是否被表示为所述图形结构中的节点;如果与所识别的专业领域相关联的排序靠前的作者没有被表示为所述图形结构中的节点,则在所述图形结构中生成和存储表示所述排序靠前的作者的节点;以及在所述图形结构中生成和存储将表示所述排序靠前的作者 ...
【技术特征摘要】
【国外来华专利技术】2015.04.24 US 14/695,8221.一种用于识别组织中的专家的计算机实现的方法,包括:识别专业领域;将所述专业领域作为节点存储在图形结构中;执行针对与所识别的专业领域相关联的信息项的查询;生成针对与所识别的专业领域相关联的每个信息项的每个作者的分数;将与所识别的专业领域相关联的作者排序;选择与所识别的专业领域相关联的排序靠前的作者的子集;确定与所识别的专业领域相关联的排序靠前的作者中的每个是否被表示为所述图形结构中的节点;如果与所识别的专业领域相关联的排序靠前的作者没有被表示为所述图形结构中的节点,则在所述图形结构中生成和存储表示所述排序靠前的作者的节点;以及在所述图形结构中生成和存储将表示所述排序靠前的作者的节点中的每个节点与专业领域节点相连接的边。2.根据权利要求1所述的方法,其中,识别专业领域包括以下中之一:接收所述专业领域的手动输入;或者从信息项语料库自动识别所述专业领域。3.根据权利要求2所述的方法,其中,从所述信息项语料库自动识别所述专业领域包括:接收与所述信息项语料库相关联的文本数据;将所述文本数据转换成能够用作进一步处理的输入的一组术语;处理所述一组术语以生成一组排序的关键词或关键短语;以及将所述一组排序的关键词或关键短语的子集选择为一个或多个专业领域。4.根据权利要求3所述的方法,其中,将所述文本数据转换成能够用作进一步处理的输入的一组术语包括采用以下中的一个或多个:标记化;词形还原;以及停止词移除。5.根据权利要求3所述的方法,其中,处理所述一组术语以生成一组排序的关键词或关键短语包括:对所述信息项语料库的标题应用术语频率-逆文档频率算法和统计词共现算法;对所述信息项语料库的正文应用所述术语频率-逆文档频率算法和所述统计词共现算法;从由所述术语频率-逆文档频率算法确定的所述信息项语料库的标题生成一组关键词或关键短语,所述一组关键词或关键短语包括重要性等级;从由所述术语频率-逆文档频率算法确定的所述信息项语料库的正文生成一组关键词或关键短语,所述一组关键词或关键短语包括重要性等级;从由所述统计词共现算法确定的所述信息项语料库的标题生成一组关键词或关键短语,所述一组关键词或关键短语包括重要性等级;从由所述统计词共现算法确定的所述信息项语料库的正文生成一组关键词或关键短语,所述一组关键词或关键短语包括重要性等级;以及将各组关键词或关键短语合并成一组排序的关键词或关键短语。6.根据权利要求1所述的方法,其中,在所述图形结构中生成和存储将表示所述排序靠前的作者的节点中的每个节点与专业领域节点相连接的边包括生成和存储双向边。7.根据权利要求1所述的方法,还包括:接收针对以下中的一项的查询的指示:特定专业领域中的专家;或者特定人士所拥有的专业领域;查询与所述图形结构相关联的搜索索引,以用于取回与所述图形结构中的将表示所述排序靠前的作者的节点与专业领域节点相连接的边相关联的专家和专业信息;以及生成包括以下之一的响应:所述排序靠前的作者之一是所识别的专业领域中的专家;或者所述专业领域由所述排序靠前的作者中的一个或多个拥有。8.一种用于识别组织中的专家的系统,包括:一个或多个处理器,其用于执行编程指令的;存储器,耦合到所述一个或多个处理器,用于存储由所述计算机处理器执行的程序指令步骤;专家模块,用于生成专业领域的一组专家,所述专家模块包括:查询组件,其用于执行针对与所述专业领域相关联的信息项的查询;评分组件,用于:生成与所述专业领域相关联的每个信息项的每个作者的...
【专利技术属性】
技术研发人员:M·普拉塔基斯,C·马克里斯,T·T·利德,B·赫斯塔,S·托曼多,S·日特尼克,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。