System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开的示例性实现方式总体涉及文本处理,特别地涉及用于转换文本风格的方法、装置、设备和计算机可读存储介质。
技术介绍
1、机器学习技术已经被广泛地用于文本处理。例如,可以输入具有某个风格的文本,并且利用机器学习模型来将该文本转换至其他风格。然而,在利用机器学习技术构建转换模型的过程中需要大量人工标注工作,这导致难以在短时间内生成具有较高准确度的转换模型。此时,期望可以以更高的效率来构建更为准确的转换模型,进而利用该转换模型来执行转换文本风格任务。
技术实现思路
1、在本公开的第一方面,提供了一种用于转换文本风格的方法。在该方法中,从参考视频提取具有第一风格的第一文本。基于第一文本和参考提示词,利用机器学习模型来将第一文本转换至第二文本,第二文本具有不同于第一风格的第二风格。基于第一文本和第二文本,确定转换模型,转换模型描述具有第二风格的文本与具有第一风格的文本之间的关联关系。
2、在本公开的第二方面,提供了一种用于转换文本风格的装置。该装置包括:提取模块,被配置用于从参考视频提取具有第一风格的第一文本;转换模块,被配置用于基于第一文本和参考提示词,利用机器学习模型来将第一文本转换至第二文本,第二文本具有不同于第一风格的第二风格;以及确定模块,被配置用于基于第一文本和第二文本,确定转换模型,转换模型描述具有第二风格的文本与具有第一风格的文本之间的关联关系。
3、在本公开的第三方面,提供了一种电子设备。该电子设备包括:至少一个处理单元;以及至少一个存储器,至少一
4、在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时使处理器实现根据本公开第一方面的方法。
5、应当理解,本内容部分中所描述的内容并非旨在限定本公开的实现方式的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种用于转换文本风格的方法,包括:
2.根据权利要求1所述的方法,其中将所述第一文本转换至所述第二文本包括:
3.根据权利要求2所述的方法,其中所述校正提示词包括第一校正提示词,所述第一校正提示词用于基于所述参考视频的字幕来校正所述第一文本,以及所述方法包括:
4.根据权利要求3所述的方法,其中所述第一校正提示词进一步用于指示所述机器学习模型来提供所述第一文本和校正的所述第一文本之间的差异,以及所述方法进一步包括:基于所述第一校正提示词和所述机器学习模型,提供所述差异。
5.根据权利要求2所述的方法,其中所述校正提示词包括第二校正提示词,所述第二校正提示词用于将所述第一文本中的以语言表达的数字转换为阿拉伯数字,以及所述方法包括:基于所述第二校正提示词和所述机器学习模型,将所述第一文本中的以语言表达的所述数字转换为阿拉伯数字。
6.根据权利要求1所述的方法,进一步包括:
7.根据权利要求1所述的方法,其中所述参考提示词包括用于描述所述任务的任务部分以及用于描述执行所述任务的示例部分。
8.根据权
9.根据权利要求1所述的方法,进一步包括:响应于接收到具有所述第二风格的输入文本,利用所述转换模型将所述输入文本转换至具有所述第一风格的输出文本。
10.根据权利要求9所述的方法,其中所述转换模型是语言模型,以及将所述输入文本转换至所述输出文本包括:
11.根据权利要求1所述的方法,其中所述第一风格是口语风格,并且所述第二风格是书面风格。
12.一种用于转换文本风格的装置,包括:
13.一种电子设备,包括:
14.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时使所述处理器实现根据权利要求1至11中任一项所述的方法。
...【技术特征摘要】
1.一种用于转换文本风格的方法,包括:
2.根据权利要求1所述的方法,其中将所述第一文本转换至所述第二文本包括:
3.根据权利要求2所述的方法,其中所述校正提示词包括第一校正提示词,所述第一校正提示词用于基于所述参考视频的字幕来校正所述第一文本,以及所述方法包括:
4.根据权利要求3所述的方法,其中所述第一校正提示词进一步用于指示所述机器学习模型来提供所述第一文本和校正的所述第一文本之间的差异,以及所述方法进一步包括:基于所述第一校正提示词和所述机器学习模型,提供所述差异。
5.根据权利要求2所述的方法,其中所述校正提示词包括第二校正提示词,所述第二校正提示词用于将所述第一文本中的以语言表达的数字转换为阿拉伯数字,以及所述方法包括:基于所述第二校正提示词和所述机器学习模型,将所述第一文本中的以语言表达的所述数字转换为阿拉伯数字。
6.根据权利要求1所述的方法,进一步包括:
7.根据权...
【专利技术属性】
技术研发人员:吴昊,邱鑫,李辰,周高景,郭雨,易沐阳,杨成,
申请(专利权)人:抖音视界有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。