一种基于大模型的数字读音判别校验方法及系统技术方案

技术编号:40316820 阅读:28 留言:0更新日期:2024-02-07 20:59
本发明专利技术提供的一种基于大模型的数字读音判别校验方法及系统,所述判别校验方法包括:输入人工标注数据;采用prompt+大模型进行数据增强,获得数据集;将所述数据集划分为训练集、测试集;采用LoRA方法对大模型进行有监督微调;大模型评估优化。不仅有效提高了数字读音的准确率,而且需要的高质量的带标签的训练数据量很少,就能够达到很好的效果,有效节省了大量的人力标注资源。

【技术实现步骤摘要】

本专利技术涉及语音合成领域,尤其涉及一种基于大模型的数字读音判别校验方法及系统


技术介绍

1、语音合成过程是指能将任意文字信息实时转化为标准流畅的语音朗读出来。语音合成技术已经从最初的统计学方法进入到深度学习阶段。在文本的预处理阶段,需要对大量的文本进行准确判定,其中主要包括多音字读音、数字读音。多音字读音是指多音字在文本中根据具体的词语、句子场景的不同会有不同的发音或音调。数字读音是指文本中包含的文本根据具体语境不同进行数字规范化。其中,多音字读音、数字读音有很多的应用场景,如语音助手、序数读音、电报读音。例如金融领域,2022年42家a股上市银行营业收入合计是100万亿元。2022读二零二二,42读四十二,100读一百,,说明数字在语境不同时读音也不相同。再例如:近20年股份制银行营业收入合计是多少;20年哪家股份制银行的印业收入最高。两个句子中的”20”,第一个读二十,第二个读二零。具体在什么样的语境下数字是什么样读音现在还未见到一个具体的研究方法。以往的判定方法大都是基于规则进行判别或者基础的深度学习算法,存在覆盖率低的问题,不能全面解决问题,准本文档来自技高网...

【技术保护点】

1.一种基于大模型的数字读音判别校验方法,其特征在于,所述判别校验方法包括:

2.根据权利要求1所述的一种基于大模型的数字读音判别校验方法,其特征在于,所述输入人工标注数据具体包括:

3.根据权利要求1所述的一种基于大模型的数字读音判别校验方法,其特征在于,所述采用prompt+大模型进行数据增强,获得数据集具体包括:

4.根据权利要求1所述的一种基于大模型的数字读音判别校验方法,其特征在于,所述将所述数据集划分为训练集、测试集具体包括:

5.根据权利要求1所述的一种基于大模型的数字读音判别校验方法,其特征在于,所述采用LoRA方法对大模型...

【技术特征摘要】

1.一种基于大模型的数字读音判别校验方法,其特征在于,所述判别校验方法包括:

2.根据权利要求1所述的一种基于大模型的数字读音判别校验方法,其特征在于,所述输入人工标注数据具体包括:

3.根据权利要求1所述的一种基于大模型的数字读音判别校验方法,其特征在于,所述采用prompt+大模型进行数据增强,获得数据集具体包括:

4.根据权利要求1所述的一种基于大模型的数字读音判别校验方法,其特征在于,所述将所述数据集...

【专利技术属性】
技术研发人员:张浩静
申请(专利权)人:北银金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1