System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书实施方式关于自然语言处理领域,具体关于一种标签值的确定方法、装置、设备和存储介质。
技术介绍
1、为了描述一些对象,可以通过为一些对象附上表示对象的特征的标签项和标签值。例如,针对一些商品,可以为其附上描述该商品的特征的标签项和标签值,以便于用户选择购买符合需求的商品。
2、然而,现有技术中为对象标注标签项和标签值的效率较低。
技术实现思路
1、有鉴于此,本说明书多个实施方式致力于提供一种标签值的确定方法、装置、设备和存储介质,以在一定程度上提高标签项和标签值的标注效率。
2、本说明书的一个实施方式提供标签值的确定方法,所述方法包括:将与标签项对应的标签问题文本,在指定问题样例集中匹配得出与所述标签问题文本相对应的参考问题样例;其中,所述指定问题样例集中包括多个问题样例;其中,所述问题样例包括样例问题文本和对应的样例答案文本;基于所述标签问题文本、所述参考问题样例和指定语料构建的提示指令,调用大语言模型,以指示所述大语言模型采用所述参考问题样例中样例答案文本的形式,依照所述指定语料提供的信息为所述标签问题文本输出标签问题答案;根据所述大语言模型输出的标签问题答案,确定所述指定语料对应所述标签项的标签值。
3、本说明书的一个实施方式提供一种用户账户的分类方法,包括:获取多个用户账户针对同一个提问文本的回复文本;其中,所述提问文本对应有语义接近的标签问题文本和标签项;以回复文本形成对应用户账户的指定语料,使用上述任一项实施方式所述的标签值的确
4、本说明书的一个实施方式提供一种标签值的确定装置,所述装置包括:样例匹配模块,用于将与标签项对应的标签问题文本,在指定问题样例集中匹配得出与所述标签问题文本相对应的参考问题样例;其中,所述指定问题样例集中包括多个问题样例;其中,所述问题样例包括样例问题文本和对应的样例答案文本;大语言模型调用模块,用于基于所述标签问题文本、所述参考问题样例和指定语料构建的提示指令,调用大语言模型,以指示所述大语言模型采用所述参考问题样例中样例答案文本的形式,依照所述指定语料提供的信息为所述标签问题文本输出标签问题答案;标签值确定模块,用于根据所述大语言模型输出的标签问题答案,确定所述指定语料对应所述标签项的标签值。
5、本说明书的一个实施方式提供一种用户账户的分类装置,所述装置包括:获取模块,用于获取多个用户账户针对同一个提问文本的回复文本;其中,所述提问文本对应有语义接近的标签问题文本和标签项;确定模块,用于以回复文本形成对应用户账户的指定语料,使用如本说明书任一实施方式所述的标签值的确定方法,确定多个用户账户针对所述标签项的标签值;分类模块,用于依照所述标签项的标签值对所述多个用户账户进行分类;其中,相同标签值对应的用户账户被划分至同一类别。
6、本说明书实施方式提出一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述实施方式所述的方法。
7、本说明书实施方式提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序被处理器执行时实现上述实施方式所述的方法。
8、本说明书提供的多个实施方式,可以基于标签问题文本、参考问题样例和指定语料构建的提示指令,调用大语言模型,以指示所述大语言模型采用所述参考问题样例中样例答案文本的形式,依照所述指定语料提供的信息为所述标签问题文本输出标签问题答案。进一步的,通过标签问题答案可以确定指定语料对应所述标签项的标签值,在一定程度上提高了标签项的标签值确定的效率。
本文档来自技高网...【技术保护点】
1.一种标签值的确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述问题样例还包括所述样例问题文本对应的多个候选样例答案文本;所述样例答案文本取自所述多个候选样例答案文本;
3.根据权利要求2所述的方法,其特征在于,候选样例答案文本对应有以单个字符或词汇形成的答案文本选项;所述答案文本选项用于表征相应的候选样例答案文本;不同候选样例答案文本对应的答案文本选项不同;样例答案文本以答案文本选项的形式指出契合样例问题文本的候选样例答案文本;
4.根据权利要求2所述的方法,其特征在于,所述标签问题答案包括所述大语言模型针对所述多个候选答案文本的文本生成概率,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,样例问题文本对应有表征相应样例问题文本的样例问题特征向量;将与标签项对应的标签问题文本,在指定问题样例集中匹配得出与所述标签问题文本相对应的参考问题样例的步骤,包括:
6.根据权利要求1所述的方法,其特征在于,所述指定语料包括针对指定商品的提问文本,以及所述提问文本的回复文本;所述提问
7.一种用户账户的分类方法,其特征在于,包括:
8.一种标签值的确定装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。
...【技术特征摘要】
1.一种标签值的确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述问题样例还包括所述样例问题文本对应的多个候选样例答案文本;所述样例答案文本取自所述多个候选样例答案文本;
3.根据权利要求2所述的方法,其特征在于,候选样例答案文本对应有以单个字符或词汇形成的答案文本选项;所述答案文本选项用于表征相应的候选样例答案文本;不同候选样例答案文本对应的答案文本选项不同;样例答案文本以答案文本选项的形式指出契合样例问题文本的候选样例答案文本;
4.根据权利要求2所述的方法,其特征在于,所述标签问题答案包括所述大语言模型针对所述多个候选答案文本的文本生成概率,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,样例问题文本对应有表征相应样例问题文本的样例问题特征向量;将与标签项对应的标签问题文本...
【专利技术属性】
技术研发人员:习雨璇,刘克松,张磊,马呈芳,刘芳,侯政旭,
申请(专利权)人:阿里健康科技杭州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。