一种扩充实体库的方法及装置制造方法及图纸

技术编号:10547254 阅读:117 留言:1更新日期:2014-10-15 20:49
本发明专利技术实施例公开了一种扩充实体库的方法及装置,该方法包括:从资源库中获取结构化数据;从所述结构化数据的预置含义字段的字段内容中识别出实体词;对所述实体词按照预设规则进行筛选;如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库,能提高扩充实体库中实体词的准确性。

【技术实现步骤摘要】
【专利摘要】本专利技术实施例公开了一种扩充实体库的方法及装置,该方法包括:从资源库中获取结构化数据;从所述结构化数据的预置含义字段的字段内容中识别出实体词;对所述实体词按照预设规则进行筛选;如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库,能提高扩充实体库中实体词的准确性。【专利说明】一种扩充实体库的方法及装置
本专利技术涉及互联网信息处理
,具体涉及一种扩充实体库的方法及装置。
技术介绍
随着信息和网络技术的不断发展,人们越来越多地通过互联网进行各种知识和信 息的搜索。内容提供商在互联网提供内容使所有用户均能平等地浏览、创造、完善内容平 台。 例如百度百科、维基百科、互动百科等,能够让互联网用户通过百科网站即能找到 自己想要的全面、准确、客观的定义性信息,可供其他用户进行类似主题的查询和浏览,以 便提供相应的知识或者借鉴。例如,词条是百科网站所含内容的基础分割单位,一个词条具 有一个或多个单一的主题,用于阐述一件事物、一个人物、或者具备特定主题的组合等知识 内容。在百科网站中包括极大数量的词条,这些百科本文档来自技高网...
一种扩充实体库的方法及装置

【技术保护点】
一种扩充实体库的方法,其特征在于,包括:从资源库中获取结构化数据;从所述结构化数据的预置含义字段的字段内容中识别出实体词;对所述实体词按照预设规则进行筛选;如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。

【技术特征摘要】

【专利技术属性】
技术研发人员:梁爽
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有1条评论
  • 来自[北京市电信互联网数据中心] 2015年03月06日 01:13
    词语:充实
    0
1