【技术实现步骤摘要】
【技术保护点】
一种面向物联网的基于语义聚类的物资信息检索方法,其特征在于该检索方法包括语义分析、关键词提取、优先数分配、PML归一化、层次聚类模块,具体步骤为:步骤1)用户在Web应用平台上输入所要检索物资的相关信息;步骤2)语义分析的任务就是自动地、批量地对Web页面进行分析,并自动提取领域的语义信息,采用先对Web内容进行预处理,去除网页内的噪音的方法,以提高语义分析提取信息的速度和精度,具体的语义分析过程如下:步骤21:对Web页面输入的文本进行噪音清洗处理,就是去除与网页主题无关的内容;步骤22:对经过噪音清洗的Web页面进行预处理,把相关的内容文本进行短句、词性划分;步骤23:从经过预处理后的文本中识别出重点词,即文本中基本的信息元素,这些重点词识别依据是现存的人工参与制定的规则;步骤24:在整个文本中找出个体事实之间的引用和关联关系,通过分析同一事实在文本中不同部分的不同描述,合并相同的实体,整合出更大粒度的信息点,即下一步需要的关键词:???????????????????????????????????????????????;步骤3)为了减少不必要的重复聚类,进一步提高检索效率,根 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:叶宁,赵婷婷,王汝传,林巧民,王忠勤,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。