自学习平台制造技术

技术编号:28298110 阅读:31 留言:0更新日期:2021-04-30 16:24
本发明专利技术公开了一种自学习平台,包括上传模块、存储模块和模型微调模块;所述上传模块,用于供用户上传多音字的语料数据;所述存储模块,用于供用户对上传的语料数据进行存储;所述模型微调模块,用于供用户调取存储的语料数据对预设的多音字预测模型进行训练。本发明专利技术能够辅助用户更加便捷的收集多音字的语料数据,方便用户训练出所需的多音字模型。

【技术实现步骤摘要】
自学习平台
本专利技术属于自然语言处理
,尤其涉及一种自学习平台。
技术介绍
在现有的语音合成系统中,多音字的准确预测扮演着举足轻重的角色,多音字正确的发音会让语音合成系统的客户体验更加的完美,但当前语音合成系统中对于多音字的发音都有错误的现象,究其原因在于多音字语料数据太少,对多音字预测模型的训练不够。
技术实现思路
本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种自学习平台,能够辅助用户更加便捷的收集多音字的语料数据,方便用户训练出所需的多音字模型。为解决上述技术问题,本专利技术采用的技术方案是:一种自学习平台,包括上传模块、存储模块和模型微调模块;所述上传模块,用于供用户上传多音字的语料数据;所述存储模块,用于供用户对上传的语料数据进行存储;所述模型微调模块,用于供用户调取存储的语料数据对预设的多音字预测模型进行微调。进一步地,还包括数据筛选模块,所述数据筛选模块,用于去除用户上传的语料数据中重复的语料数据和格式错误的语料数据。进一步地,还包括分类本文档来自技高网...

【技术保护点】
1.一种自学习平台,其特征在于,包括:/n上传模块,用于上传多音字的语料数据;/n存储模块,用于对所述语料数据进行存储;/n模型微调模块,用于调取所述语料数据对预设的多音字预测模型进行微调。/n

【技术特征摘要】
1.一种自学习平台,其特征在于,包括:
上传模块,用于上传多音字的语料数据;
存储模块,用于对所述语料数据进行存储;
模型微调模块,用于调取所述语料数据对预设的多音字预测模型进行微调。


2.如权利要求1所述的自学习平台,其特征在于,还包括:
数据筛选模块,用于去除所述语料数据中重复的语料数据和格式错误的语料数据。


3.如权利要求1或2所述的自学习平台,其特征在于,还包括:
分类模块,用于对所述语料数据按需分类。


4.如权利要求3所述的自学习平台,其特征在于,
所述分类模块,还用于将所述语料数据输入预先训练好的分类模型中,并将所述分类模型对所述语料数据的分类结果发送至所述存储模块;所述分类模型的分类类别为根据用户所需预先设定。


5.如权利要求4所述的自学习平台,其特征在于,
所述模型微调模块,还用于选择一个或多个所述类别下的语料数据对预设的多音字预测模型进行微调。


6.如权利要求1所...

【专利技术属性】
技术研发人员:简仁贤黄怀鋐林长洲
申请(专利权)人:竹间智能科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1