生成声母韵母向量的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33245850 阅读:24 留言:0更新日期:2022-04-27 17:57
本申请涉及一种生成声母韵母向量的方法、装置、电子设备及存储介质,方法包括:根据汉语中的尖字生成尖字音集和尖音团音集;将所述尖音团音集中的尖音和团音拆分为声母和韵母,并将拆分得到的声母和韵母分别添加到声母表和韵母表中;根据所述尖字音集和所述尖音团音集对汉字拼音集中的拼音进行修改,以将所述汉字拼音集中尖字对应汉字的拼音修改为尖音;根据修改好的所述拼音汉字拼音集汉字拼音集生成汉字声母韵母集;根据所述声母表、所述韵母表以及所述汉字声母韵母集计算各个汉字的声母向量、韵母向量,获得汉字的声母向量与韵母向量,考虑了汉字在发音方面的声母韵母关系,丰富了汉字向量表示的丰富度。富了汉字向量表示的丰富度。富了汉字向量表示的丰富度。

【技术实现步骤摘要】
生成声母韵母向量的方法、装置、电子设备及存储介质


[0001]本申请涉及深度学习
,尤其涉及一种生成声母韵母向量的方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机技术的发展,将汉字或词转化为向量表达形式,再将向量输入到各类神经网络中,完成各种具体任务(例如文本分类、文本摘要、文本生成、智能问答等)已成为当前自然语言处理领域主流的技术手段。但相关技术中,仅能根据汉字生成词向量、或是字向量。而相关技术中,只考虑汉字本身的特征,且设计的特征比较简单,因此,汉字生成的向量丰富度不够。

技术实现思路

[0003]本申请提供了一种生成声母韵母向量的方法、装置、电子设备及存储介质,以解决相关技术中,根据汉字生成的向量丰富度不够的问题。
[0004]第一方面,本申请提供了一种生成声母韵母向量的方法,所述生成声母韵母向量的方法,包括:根据汉语中的尖字生成尖字音集和尖音团音集,其中,所述尖字音集中包括尖字与尖音的对应关系,尖音团音集中包括尖音与团音的对应关系;将所述尖音团音集中的尖音和团音拆分为声母和韵母,并将拆分得本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种生成声母韵母向量的方法,其特征在于,所述生成声母韵母向量的方法,包括:根据汉语中的尖字生成尖字音集和尖音团音集,其中,所述尖字音集中包括尖字与尖音的对应关系,尖音团音集中包括尖音与团音的对应关系;将所述尖音团音集中的尖音和团音拆分为声母和韵母,并将拆分得到的声母和韵母分别添加到声母表和韵母表中,其中,所述声母表中包括汉语拼音的声母,所述韵母表中包括汉语拼音的韵母;根据所述尖字音集和所述尖音团音集对汉字拼音集中的拼音进行修改,以将所述汉字拼音集中尖字对应汉字的拼音修改为尖音,所述汉字拼音集中包括汉字与拼音的对应关系;根据修改好的所述汉字拼音集生成汉字声母韵母集,所述汉字声母韵母集的属性包括:汉字,拼音,声母,韵母;根据所述声母表、所述韵母表以及所述汉字声母韵母集计算各个汉字的声母向量、韵母向量。2.根据权利要求1所述的方法,其特征在于,所述根据汉语中的尖字生成尖字音集和尖音团音集,包括:获取汉语中的所述尖字,以及所述尖字对应的尖音、团音;根据所述尖字与其对应的尖音生成尖字音集,根据所述尖音和所述团音分别与尖字的对应关系生成尖音团音集。3.根据权利要求1所述的方法,其特征在于,所述根据所述尖字音集和所述尖音团音集对汉字拼音集中的拼音进行修改之前,所述方法还包括:读取汉字词典,根据所述汉字词典中的汉字生成汉字拼音集。4.根据权利要求1所述的方法,其特征在于,所述根据所述尖字音集和所述尖音团音集对汉字拼音集中的拼音进行修改,以将所述汉字拼音集中尖字对应汉字的拼音修改为尖音,包括:确定所述汉字拼音集中存在的尖字,根据所述尖字音集和所述尖音团音集对汉字拼音集中的拼音进行修改,以将所述汉字拼音集中尖字对应汉字的拼音修改为尖音。5.根据权利要求4所述的方法,其特征在于,所述确定所述汉字拼音集中存在的尖字,包括:在所述汉字拼音集中提取出在所述尖字音集中存在的汉字;获取提取出的汉字在所述尖字音集中对应的尖音;获取提取出的汉字的尖音在所述尖音团音集中对应的团音;当根据提取出的汉字获取的团音与所述提取出的汉字在汉字拼音集中的拼音对应时,判定提取出的汉字为尖字。6.根据权利要求1所述的方法,其特征在于,所述根据修改好的所述汉字拼音集生成汉字声...

【专利技术属性】
技术研发人员:梁吉光
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1