【技术实现步骤摘要】
本专利技术属于互联网和搜索领域,尤其涉及一种人名的识别方法及系统。
技术介绍
随着互联网的发展,用户越来越多的通过互联网中搜索软件对中国的人名进行搜索。现有的人名的识别方法具体为从语料库(即存储数据库)中自动抽取角色信息,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。按照现有技术所提供的技术方案,发现现有技术中存在如下技术问题现有技术提供的技术方案的方法是对切词结果进行角色标注的,所以当切词结果出现错误时,容易对人名识别错误,识别错误率高。
技术实现思路
本专利技术实施例提供一种人名的识别方法,旨在解决现有技术的识别方法对切词结果出现错误时,容易对人名识别错误,识别错误率高的问题。本专利技术实施例是这样实现的,一种人名的识别方法,所述方法包括如下步骤将初始序列中识别出的人名以及该人名出现的次数存储在人名频率表中;根据该初始序列中的词条确定候选人名;如该候选人名出现在该人名频率表中,且出现次数超过预设次数阈值时,将该候选人名作为识别出的人名。本专利技术还提供一种人名的识别系统,所述系统包括存储单元,用于将初 ...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:罗长升,方高林,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。