用于确定文本的拼音的方法、装置、系统和存储介质制造方法及图纸

技术编号：22387580 阅读：30 留言：0更新日期：2019-10-29 06:34

本发明专利技术实施例提供了用于确定文本的拼音的方法、装置、系统、存储介质以及语音合成方法。所述方法包括：确定所述文本中的多音字的候选拼音；至少根据所述文本中的多音字的候选拼音，确定所述文本的掩码；提取所述文本中的汉字的特征；基于所提取的特征，利用预测模型预测对应汉字的拼音；以及基于预测结果和所述文本的掩码确定所述文本的拼音。上述自动确定文本的拼音的技术方案中，无需人工手动操作，通过掩码来限制文本中汉字的候选拼音的范围，有效防止了将多音字的拼音预测错误的情况，提高了文本的拼音的预测准确率。

Method, device, system and storage medium for determining Pinyin of text

全部详细技术资料下载

【技术实现步骤摘要】
用于确定文本的拼音的方法、装置、系统和存储介质
本专利技术涉及语音分析和处理领域，更具体地涉及一种用于确定文本的拼音的方法、装置、系统、存储介质以及语音合成方法。
技术介绍
在语音分析和处理
中，汉字到拼音的转换直接影响着语音分析处理的准确度。具体例如，在语音合成技术中，其直接影响所合成的语音的可懂度。因此，提高汉字的拼音标注的准确率具有重要意义。目前，现有的汉字拼音标注方法大体基于以下内容来实现：规则库和神经网络。基于规则库的方法虽然准确度较高，但是需要耗费大量的人力和物力来构建规则库且人工构建的规则库更新周期较长。此外，当规则库达到一定规模后，容易出现规则冲突等问题，较难扩展和维护。基于神经网络的方法通常针对每个多音字单独进行建模。每个多音字都训练一个标注模型，显著增加了系统开销。此外，基于神经网络的方法准确率还难以满足需求，容易发生预测错误。总之，现有的用于确定文本的拼音的方法有待改善。
技术实现思路
考虑到上述问题而提出了本专利技术。根据本专利技术一个方面，提供了一种用于确定文本的拼音的方法。所述方法包括：确定所述文本中的多音字的候选拼音；至少根据所述文...

【技术保护点】
1.一种用于确定文本的拼音的方法，包括：确定所述文本中的多音字的候选拼音；至少根据所述文本中的多音字的候选拼音，确定所述文本的掩码；提取所述文本中的汉字的特征；基于所提取的特征利用预测模型预测对应汉字的拼音；以及基于预测结果和所述文本的掩码确定所述文本的拼音。

【技术特征摘要】
1.一种用于确定文本的拼音的方法，包括：确定所述文本中的多音字的候选拼音；至少根据所述文本中的多音字的候选拼音，确定所述文本的掩码；提取所述文本中的汉字的特征；基于所提取的特征利用预测模型预测对应汉字的拼音；以及基于预测结果和所述文本的掩码确定所述文本的拼音。2.如权利要求1所述的方法，其中，在确定所述文本的掩码之前，所述方法还包括：确定所述文本中的单音字的候选拼音；所述确定所述文本的掩码包括：根据所述文本中的每个汉字的候选拼音，确定每个汉字对应的掩码；根据所述每个汉字对应的掩码，确定所述文本的掩码。3.如权利要求1或2所述的方法，其中，对于所述文本中的每个汉字，该汉字的预测结果用预测向量表示，所述预测向量中的每个元素对应于该汉字发出对应拼音的概率；所述文本的掩码用掩码矩阵表示，所述掩码矩阵中的该汉字对应的掩码向量中的每个元素表示该汉字能否发出对应拼音；所述基于预测结果和所述文本的掩码确定所述文本的拼音包括：用所述预测向量中的元素乘以所述掩码向量中的对应元素，以确定所述文本中的该汉字的拼音。4.如权利要求1或2所述的方法，其中，所述提取所述文本中的汉字的特征包括：对于所述文本中的每个汉字，确定该汉字的字符级特征；将该汉字的字符级特征进行嵌入化处理；以及根据经嵌入化处理的字符级特征获得该汉字的特征。5.如权利要求4所述的方法，其中，所述确定该汉字的字符级特征包括：确定该汉字的多个字符级特征；所述根据经嵌入化处理的字符...

【专利技术属性】
技术研发人员：潘华山，李秀林，
申请(专利权)人：标贝深圳科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人