【技术实现步骤摘要】
【技术保护点】
一种开放领域新词发现的方法,其特征在于,包括以下步骤:接收待处理语料,并对所述语料进行格式转换和分词处理,以获得多个文本信息;提取所述多个文本信息的特征信息;判断所述多个文本信息中一部分文本信息的相邻的文本信息的组合是否为新词;如果是,则对所述相邻的文本信息进行新词边界标注;根据标注后的所述多个文本信息和特征信息估计条件随机场模型的参数;根据估计的所述条件随机场模型的参数对所述多个文本信息中剩余文本信息进行识别,以获得所述多个文本信息中剩余文本信息的新词。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈飞,刘奕群,马少平,张敏,金奕江,张阔,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。