【技术实现步骤摘要】
【专利摘要】本专利技术实施例公开了一种扩充实体库的方法及装置,该方法包括:从资源库中获取结构化数据;从所述结构化数据的预置含义字段的字段内容中识别出实体词;对所述实体词按照预设规则进行筛选;如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库,能提高扩充实体库中实体词的准确性。【专利说明】一种扩充实体库的方法及装置
本专利技术涉及互联网信息处理
,具体涉及一种扩充实体库的方法及装置。
技术介绍
随着信息和网络技术的不断发展,人们越来越多地通过互联网进行各种知识和信 息的搜索。内容提供商在互联网提供内容使所有用户均能平等地浏览、创造、完善内容平 台。 例如百度百科、维基百科、互动百科等,能够让互联网用户通过百科网站即能找到 自己想要的全面、准确、客观的定义性信息,可供其他用户进行类似主题的查询和浏览,以 便提供相应的知识或者借鉴。例如,词条是百科网站所含内容的基础分割单位,一个词条具 有一个或多个单一的主题,用于阐述一件事物、一个人物、或者具备特定主题的组合等知识 内容。在百科网站中包括极大 ...
【技术保护点】
一种扩充实体库的方法,其特征在于,包括:从资源库中获取结构化数据;从所述结构化数据的预置含义字段的字段内容中识别出实体词;对所述实体词按照预设规则进行筛选;如果筛选出的实体词未出现在实体库中,则将所述实体词添加到所述实体库中,以扩充所述实体库。
【技术特征摘要】
【专利技术属性】
技术研发人员:梁爽,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11