一种含多音字的姓名拼音标注方法及系统技术方案

技术编号:40102957 阅读:19 留言:0更新日期:2024-01-23 17:59
本发明专利技术涉及一种含多音字的姓名拼音标注方法及系统,包括:获取姓名文本;将姓名文本拆分为姓文本与名文本;将名文本拆分为若干个汉字,一个汉字建立一个二级名文本;基于姓氏拼音库识别姓文本,获取姓文本的汉字拼音,为姓氏拼音文本;基于普通汉字多音字库识别名文本,获取名文本的汉字拼音,为名拼音文本;将获取的姓氏拼音文本与名拼音文本进行整合,获得姓名拼音文本。本发明专利技术所述方法及系统提供了完整的姓名拼音识别技术,可实现员工姓、名的多音字识别,提高姓名多音字识别的效率。实现在录入员工信息时,自动准确识别姓名拼音,避免人工核验,提高企业人力资源管理效率。

【技术实现步骤摘要】

本专利技术涉及汉字拼音标注,尤其涉及一种含多音字的姓名拼音标注方法及系统


技术介绍

1、企业人力资源管理系统中需要准确识别员工姓名的拼音,用于申请邮箱、企业内账号、身份标识等用途,拼音的准确识别对于企业员工数据的管理具有重要意义。

2、一般的多音字识别方法是预设多音字在不同词组中的读音,通过识别文本中的词组确定多音字的读音,这种方法需要大量的存储空间,且准确度较低。随着大数据、人工智能的发展,决策树、最大熵算法、专家知识、文本分析、语义分析也逐渐应用到多音拼音的识别和消歧中,在准确率和识别速度上都有了提升。

3、姓名类文本,由于具有文本短、上下文关联性不强等特点,使用上述方法都存在识别准确度低的问题。目前企业内员工姓名多音字识别方法,一般通过人工识别修改拼音,工作效率低下。亟需准确度较高的姓名中多音字标注方法。

4、目前已有的姓名拼音(含多音字)标注的技术方案存在如下问题:

5、相关技术中,均为针对普通文本的多音字拼音标注、消歧技术,没有涉及专门针对姓名的多音字识别。

6、对普通文本的多音字识别本文档来自技高网...

【技术保护点】

1.一种含多音字的姓名拼音标注方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述步骤S1之前还包括:

3.如权利要求2所述的方法,其特征在于,所述姓氏拼音库包括:编码、姓氏、拼音、是否为多音字、姓氏字数。

4.如权利要求2所述的方法,其特征在于,所述普通汉字多音字库为每个多音字的每个发音建立一条记录,记录信息包括:汉字、汉字拼音、汉字常用词组、汉字使用概率、汉字是否为姓名多用。

5.如权利要求1所述的方法,其特征在于,所述步骤S3包括分步骤:

6.一种含多音字的姓名拼音标注系统,其特征在于,包括:

...

【技术特征摘要】

1.一种含多音字的姓名拼音标注方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述步骤s1之前还包括:

3.如权利要求2所述的方法,其特征在于,所述姓氏拼音库包括:编码、姓氏、拼音、是否为多音字、姓氏字数。

4.如权利要求2所述的方法,其特征在于,所述普通汉字多音字库为每个多音字的每个发音建立一条记录,记录信息包括:汉字、汉字拼音、汉字常用词组、汉字使用概率、汉字是否为姓名多用。

5.如权利要求1所述的方法,其特征在于,所述步骤s3包括分步骤:

6...

【专利技术属性】
技术研发人员:周丽娟王晓旭
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1