【技术实现步骤摘要】
【国外来华专利技术】上下文敏感短语标识
技术介绍
世界各地的人们不断地向诸如社交媒体站点、博客、新闻来源等的各种站点贡献内容。然而,难以标识针对特定上下文的对话或内容的某些方面。上面的讨论仅被提供用于一般背景信息,而非旨在用于帮助确定所要求保护的主题的范围。
技术实现思路
提供了一种用于处理来自至少一个文本信息源的文本信息的计算设备。计算设备包括作为计算设备的功能部件并且被配置为执行用于处理文本信息的指令的处理器。侦听器部件被配置为从至少一个源接收文本信息。上下文分析器被耦合到侦听器部件,并且被配置为生成相对于文本信息的上下文信息。内容分析器被耦合到侦听器部件,并且被配置为从文本信息标识n元语法集合,并且通过使用概率数据结构去除至少一些n元语法来提供过滤后的内容,概率数据结构确定给定元素是否为集合的成员。索引部件被配置为对过滤后的内容进行索引。提供本
技术实现思路
以便以简化的形式介绍概念的选择,这些概念在下面的具体实施方式中进一步描述。本
技术实现思路
并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。所要求保护的主题不限于解决在
技术介绍
中指出的任何或所有 ...
【技术保护点】
一种用于处理来自至少一个文本信息源的文本信息的计算设备,所述计算设备包括:处理器,作为所述计算设备的功能部件并且被配置为执行用于处理所述文本信息的指令;侦听器部件,被配置为从所述至少一个源接收所述文本信息;上下文分析器,被耦合到所述侦听器部件并且被配置为生成相对于所述文本信息的上下文信息;内容分析器,被耦合到所述侦听器部件并且被配置为从所述文本信息中标识n元语法集合并且通过使用概率数据结构去除至少一些n元语法来提供过滤后的内容,所述概率数据结构确定给定元素是否为集合的成员;以及索引部件,被配置为对所述过滤后的内容进行索引。
【技术特征摘要】
【国外来华专利技术】2015.03.12 US 62/131,932;2015.08.26 US 14/836,3611.一种用于处理来自至少一个文本信息源的文本信息的计算设备,所述计算设备包括:处理器,作为所述计算设备的功能部件并且被配置为执行用于处理所述文本信息的指令;侦听器部件,被配置为从所述至少一个源接收所述文本信息;上下文分析器,被耦合到所述侦听器部件并且被配置为生成相对于所述文本信息的上下文信息;内容分析器,被耦合到所述侦听器部件并且被配置为从所述文本信息中标识n元语法集合并且通过使用概率数据结构去除至少一些n元语法来提供过滤后的内容,所述概率数据结构确定给定元素是否为集合的成员;以及索引部件,被配置为对所述过滤后的内容进行索引。2.根据权利要求1所述的计算设备,其中所述侦听器部件是社交侦听器部件并且其中所述至少一个文本信息源包括社交网络。3.根据权利要求1所述的计算设备,其中所述侦听器部件被配置为从所述至少一个文本信息源接收文本信息流。4.根据权利要求1所述的计算设备,其中所述概率数据结构包括布隆过滤器。5.根据权利要求4所述的计算设备,其中所述布隆过滤器包括多个层,其中第一层为对第二层的输入。6.根据权利要求4所述的计算设备,其中所述计算设备被配置为重置所述布隆过滤器。7.根...
【专利技术属性】
技术研发人员:T·卡普勒,B·凯夫尔,P·J·斯腾加德,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。