一种含多音字的姓名拼音标注方法及系统技术方案

技术编号：40102957 阅读：19 留言：0更新日期：2024-01-23 17:59

本发明专利技术涉及一种含多音字的姓名拼音标注方法及系统，包括：获取姓名文本；将姓名文本拆分为姓文本与名文本；将名文本拆分为若干个汉字，一个汉字建立一个二级名文本；基于姓氏拼音库识别姓文本，获取姓文本的汉字拼音，为姓氏拼音文本；基于普通汉字多音字库识别名文本，获取名文本的汉字拼音，为名拼音文本；将获取的姓氏拼音文本与名拼音文本进行整合，获得姓名拼音文本。本发明专利技术所述方法及系统提供了完整的姓名拼音识别技术，可实现员工姓、名的多音字识别，提高姓名多音字识别的效率。实现在录入员工信息时，自动准确识别姓名拼音，避免人工核验，提高企业人力资源管理效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及汉字拼音标注，尤其涉及一种含多音字的姓名拼音标注方法及系统。

技术介绍

1、企业人力资源管理系统中需要准确识别员工姓名的拼音，用于申请邮箱、企业内账号、身份标识等用途，拼音的准确识别对于企业员工数据的管理具有重要意义。

2、一般的多音字识别方法是预设多音字在不同词组中的读音，通过识别文本中的词组确定多音字的读音，这种方法需要大量的存储空间，且准确度较低。随着大数据、人工智能的发展，决策树、最大熵算法、专家知识、文本分析、语义分析也逐渐应用到多音拼音的识别和消歧中，在准确率和识别速度上都有了提升。

3、姓名类文本，由于具有文本短、上下文关联性不强等特点，使用上述方法都存在识别准确度低的问题。目前企业内员工姓名多音字识别方法，一般通过人工识别修改拼音，工作效率低下。亟需准确度较高的姓名中多音字标注方法。

4、目前已有的姓名拼音(含多音字)标注的技术方案存在如下问题：

5、相关技术中，均为针对普通文本的多音字拼音标注、消歧技术，没有涉及专门针对姓名的多音字识别。

6、对...

【技术保护点】

1.一种含多音字的姓名拼音标注方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述步骤S1之前还包括：

3.如权利要求2所述的方法，其特征在于，所述姓氏拼音库包括：编码、姓氏、拼音、是否为多音字、姓氏字数。

4.如权利要求2所述的方法，其特征在于，所述普通汉字多音字库为每个多音字的每个发音建立一条记录，记录信息包括：汉字、汉字拼音、汉字常用词组、汉字使用概率、汉字是否为姓名多用。

5.如权利要求1所述的方法，其特征在于，所述步骤S3包括分步骤：

6.一种含多音字的姓名拼音标注系统，其特征在于，包括：

...

【技术特征摘要】

1.一种含多音字的姓名拼音标注方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述步骤s1之前还包括：

3.如权利要求2所述的方法，其特征在于，所述姓氏拼音库包括：编码、姓氏、拼音、是否为多音字、姓氏字数。

5.如权利要求1所述的方法，其特征在于，所述步骤s3包括分步骤：

6...

【专利技术属性】
技术研发人员：周丽娟，王晓旭，
申请(专利权)人：中信银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人