【技术实现步骤摘要】
【国外来华专利技术】
本公开一般地涉及通信领域,更具体地,涉及从网络数据中生成词汇。
技术介绍
在当今社会,通信领域变得越来越重要。尤其,有效率地收集、关联和组织信息的能力对于组件制造商、系统设计者以及网络操作者的造成显著障碍。该障碍由于过多的贫乏的语言模式、俚语和不适当的语法甚至变得更困难在当今公司环境中全部这些好像是普遍存在的。因为新的通信平台和技术变得可用,应当开发新的协议以便优化这些新兴的协议的使用。在内容(寻求智能地组织该内容)在网络中传播的数据监视情形中出现了ー些问题。附图说明为了提供本公开和特征以及它们的优势的更完整的理解,參考了与附图相结合的如下说明,其中相同的參考数字表示相同的部分,其中图I是依据一个实施例的用于从网络数据生成词汇的通信系统的简化的框图;图2是依据一个实施例的可以出现在通信系统中的示例提取的简化的框图;以及图3是图示了与通信系统相关联的一系列示例步骤的简化的流程图。具体实施方式概览在一个示例中提供了ー种方法,该方法包括接收在网络环境中传播的数据和将数据分离为ー个或者多个字段。评估这些字段中的至少ー些以便识别这些字段内的名词和名词短语。该方法还包括基于白名单和黑名单识别在名词和名词短语内所选择的单词。白名单包括要被加标记的多个指定的单词,并且黑名单包括将不被加标记的多个拒绝的单词。为所选择的被加标记的名词和名词短语而生成合成物。如果合成物被准许,则将合成物合并在白名单中。在更具体的实施例中,这些字段包括题目字段、概念字段、文本字段以及作者字段。该方法可以将与该数据相关联的文档分离为第一段和第二段,该第一段包括概念字段,该第二段包括其他字段。因此 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】2009.09.30 US 12/571,3901.ー种方法,包括 接收在网络环境中传播的数据; 将所述数据分离为ー个或者多个字段; 评估所述字段的至少ー些字段以便识别在所述字段中的名词和名词短语; 基于白名单和黑名单识别所述名词和名词短语中被选择的词,其中所述白名单包括要被加标记的多个指定的词,并且所述黑名单包括将不被加标记的多个拒绝的词; 生成被加标记的选择的名词和名词短语的合成物;以及 如果所述合成物被准许,则将所述合成物加入到所述白名单中。2.依据权利要求I所述的方法,其中,所述字段包括题目字段、概念字段、文本字段、以及作者字段。3.依据权利要求2所述的方法,还包括 将与所述数据相关联的文档分离为第一段和第二段,所述第一段包括所述概念字段,所述第二段包括除了所述概念字段之外的字段。4.依据权利要求I所述的方法,还包括 基于被配置的在所述数据中识别的停止单词的列表,移除所述数据中的ー个或者多个;ロO5.依据权利要求I所述的方法,还包括 基干与多个终端用户相关联的数据集合,建议将词包括在所述白名单或者所述黑名单中。6.依据权利要求I所述的方法,还包括 识别所述数据中的主题范围;以及 向管理实体提供所述主题范围用于包括在所述合成物中。7.依据权利要求I所述的方法,还包括 基干与所述数据相关联的文档类型过滤所述数据。8.ー种被编码在ー个或者多个有形介质中的逻辑,所述ー个或者多个有形介质包括用于执行的代码,所述代码当被处理器执行时可操作执行以下操作 接收在网络环境中传播的数据; 将所述数据分离为ー个或者多个字段; 评估所述字段的至少ー些字段以便识别在所述字段中的名词和名词短语; 基于白名单和黑名单识别所述名词和名词短语中被选择的词,其中所述白名单包括要被加标记的多个指定的词,并且所述黑名单包括将不被加标记的多个拒绝的词; 生成被加标记的选择的名词和名词短语的合成物;以及 如果所述合成物被准许,则将所述合成物加入到所述白名单中。9.依据权利要求8所述的逻辑,其中,所述字段包括题目字段、概念字段、文本字段、以及作者字段。10.依据权利要求9所述的逻辑,所述处理器进ー步可操作为执行以下操作 将与所述数据相关联的文档分离为第一段和第二段,所述第一段包括所述概念字段,所述第二段包括除了所述概念字段之外的字段。11.依据权利要求8所述的逻辑,所述处理器进ー步可操作为执行以下操作基于被配置的在所述数据中识别的停止单词的列表,移除所述数据中的ー个或者多个词。12.依据权利要求8所述的逻辑,所述处理器进ー步可操作为执行以下操作 基干与多个终端用户相关联的数据集合,建议将词包括在所述白名单或者所述黑名单中。13.依据权利要求8所述的逻辑,所述处理器进ー步可操作为执行以下操作 识别所述数据中的主题范围;以及 向管理实体提供所述主题范围用于包括在所述合成物中。14.依据权利要求8所述的逻辑,所述处理器进ー步可操作为执行以下操作 基干与所述数据相关联的文档类型过滤所述数据。15.ー种装置,包括 存储器元件; 可操作以执行指令的处理器;以及 被配置为与所述存储器元件和所述处理器相接ロ...
【专利技术属性】
技术研发人员:山格维鲁·阿木盖姆,萨蒂施·K·甘努,维吉尔·N·米哈罗维斯,阿舒拓史·A·马勒高恩卡,克利斯汀·波斯,索纳利·M·萨姆布斯,妮塔沙·瓦利亚,奎·张,
申请(专利权)人:思科技术公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。