【技术实现步骤摘要】
本专利技术涉及汉字拼音标注,尤其涉及一种含多音字的姓名拼音标注方法及系统。
技术介绍
1、企业人力资源管理系统中需要准确识别员工姓名的拼音,用于申请邮箱、企业内账号、身份标识等用途,拼音的准确识别对于企业员工数据的管理具有重要意义。
2、一般的多音字识别方法是预设多音字在不同词组中的读音,通过识别文本中的词组确定多音字的读音,这种方法需要大量的存储空间,且准确度较低。随着大数据、人工智能的发展,决策树、最大熵算法、专家知识、文本分析、语义分析也逐渐应用到多音拼音的识别和消歧中,在准确率和识别速度上都有了提升。
3、姓名类文本,由于具有文本短、上下文关联性不强等特点,使用上述方法都存在识别准确度低的问题。目前企业内员工姓名多音字识别方法,一般通过人工识别修改拼音,工作效率低下。亟需准确度较高的姓名中多音字标注方法。
4、目前已有的姓名拼音(含多音字)标注的技术方案存在如下问题:
5、相关技术中,均为针对普通文本的多音字拼音标注、消歧技术,没有涉及专门针对姓名的多音字识别。
6、对
...【技术保护点】
1.一种含多音字的姓名拼音标注方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述步骤S1之前还包括:
3.如权利要求2所述的方法,其特征在于,所述姓氏拼音库包括:编码、姓氏、拼音、是否为多音字、姓氏字数。
4.如权利要求2所述的方法,其特征在于,所述普通汉字多音字库为每个多音字的每个发音建立一条记录,记录信息包括:汉字、汉字拼音、汉字常用词组、汉字使用概率、汉字是否为姓名多用。
5.如权利要求1所述的方法,其特征在于,所述步骤S3包括分步骤:
6.一种含多音字的姓名拼音标注系统,其特征在于
...
【技术特征摘要】
1.一种含多音字的姓名拼音标注方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述步骤s1之前还包括:
3.如权利要求2所述的方法,其特征在于,所述姓氏拼音库包括:编码、姓氏、拼音、是否为多音字、姓氏字数。
4.如权利要求2所述的方法,其特征在于,所述普通汉字多音字库为每个多音字的每个发音建立一条记录,记录信息包括:汉字、汉字拼音、汉字常用词组、汉字使用概率、汉字是否为姓名多用。
5.如权利要求1所述的方法,其特征在于,所述步骤s3包括分步骤:
6...
【专利技术属性】
技术研发人员:周丽娟,王晓旭,
申请(专利权)人:中信银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。