System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于即时通讯,具体而言,涉及一种即时通讯应用内用户分组方法、介质及系统。
技术介绍
1、随着互联网的发展,各类即时通讯软件已成为人们日常沟通交流的主要方式之一。在即时通讯软件中,用户可以通过文字、语音、图片等多种方式进行交流。同时,即时通讯软件也会创建一些讨论组或群组,以聚集有共同兴趣或存在共同问题的用户,进行讨论交流或问题求助;通常情况下,用户会在这类应用中输入自己的问题或是文本内容需求,应用会输出答案给用户。在现有的应用中,流程在此就结束了,或是额外增加一个是否满意的按钮,但用户如果反复提问仍得不到满意的答案时,问题并没有在此应用得到解决,转而通过其他渠道寻找答案。
2、然而,在现有的即时通讯应用中,讨论组或群组的建立主要依赖于用户主动找人组建,或者需要等管理员查看用户提交的申请后人工批准。这种人工操作耗时耗力,很难满足用户即时获取问题支持的需求。
3、也就是说,当前即时通讯应用中,存在无法自动根据用户的问题进行自动化建立讨论组的技术问题。
技术实现思路
1、有鉴于此,本专利技术提供一种即时通讯应用内用户分组方法、介质及系统用于解决当前即时通讯应用中,存在的无法自动根据用户的问题进行自动化建立讨论组的技术问题
2、本专利技术是这样实现的:
3、本专利技术的第一方面提供一种即时通讯应用内用户分组方法,其中,包括以下步骤:
4、s10、获取用户提交的问题文本,并利用知识库进行回答;
5、s20、对用户
6、s30、利用知识库根据标准问题文本建立至少一个问题标签,并设置所建立的问题标签和提交问题的用户的对应关系;
7、s40、将建立的至少一个问题标签分别在历史问题标签集内进行匹配,若存在不匹配的问题标签,则建立对应的讨论组;
8、s50、向与讨论组的问题标签存在对应关系的用户发送加入讨论组邀请;
9、s60、若用户接受邀请,则将用户添加到讨论组。
10、在上述技术方案的基础上,本专利技术的一种即时通讯应用内用户分组方法还可以做如下改进:
11、其中,所述对大语言模型进行微调的步骤,具体包括:
12、选择一个在大量语料上预训练的语言模型;
13、加载预训练模型的参数作为初始化参数;
14、在预训练模型基础上构建针对下游任务的网络结构,所述下游任务为根据用户提交的问题文本人工指定标准问题文本;
15、使用下游任务数据集作为训练集,并设置微调的训练目标;
16、使用优化算法训练模型参数;
17、训练结束后保存微调后的模型参数。
18、采用上述改进方案的有益效果为:通过加载预训练参数并在此基础上进行任务针对性微调,可以有效地迁移预训练模型中的语言知识,使其适应下游的问题标准化任务,达到更好的效果。微调策略的使用可以保证对预训练参数的扰动在可控范围。
19、其中,所述利用知识库根据标准问题文本建立至少一个问题标签的步骤,具体包括:
20、构建一个包含问题标签集和问题-标签映射表的知识库;
21、对输入的标准问题,在映射表中查找是否存在对应的问题标签;
22、如果存在对应的问题标签,则返回对应的问题标签;
23、如果不存在对应的问题标签,则新建问题标签并添加到映射表,并返回新建的问题标签。
24、采用上述改进方案的有益效果为:相比规则方法,这样可以利用人工知识库保证质量,同时持续完善映射关系,扩展到新问题,实现标准问题效果好、可靠的自动打标,为后续用户群建模奠定基础。
25、进一步的,所述设置所建立的问题标签和提交问题的用户的对应关系的步骤还包括:通过查映射表完成标准问题的标签标注,新建问题标签时扩展映射表,并记录用户-问题标签的对应关系。
26、进一步的,所述采用的预训练的语言模型为chatglm6b模型,所述知识库为本地知识库。
27、进一步的,所述采用的预训练的语言模型为bert模型。
28、进一步的,所述在预训练模型基础上构建针对下游任务的网络结构的方法具体是:在bert模型编码器基础上,添加一个全连接层作为问题标准化任务的输出层。
29、其中,所述将建立的至少一个问题标签分别在历史问题标签集内进行匹配的方法为使用问题标签的文字进行匹配。
30、其中,步骤s40具体包括:
31、输入本轮生成的一组新问题标签。
32、准备好已存在的历史问题标签集合。
33、对输入的每一个新标签,在历史标签集合中搜索是否存在。
34、如果新标签不在历史集合中,则是全新的标签。
35、对于那些新的标签,每个建立一个以该标签为特征的新讨论组。
36、将新建的讨论组添加到结果列表中返回。
37、通过这一系列步骤,可以找出输入中新增的问题标签,并对应建立特征讨论组,以便后续添加相关用户进行交流,使讨论组内容与新问题保持同步。
38、本专利技术的第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质内存储有程序指令,所述程序指令运行时,用于执行上述的即时通讯应用内用户分组方法。
39、本专利技术的第三方面提供一种即时通讯应用内用户分组系统,其中,包含上述的计算机可读存储介质。
40、与现有技术相比较,本专利技术提供的一种即时通讯应用内用户分组方法、介质及系统的有益效果是:本专利技术通过对问题标签的识别,实现对问题及时建立讨论组。并且通过持续记录用户-讨论组关系,可以在新组建立后第一时间邀请相关用户加入,实现动态群组建立。这比静态人工定义群组更能满足用户讨论与交流的实时需求。
41、另外的,本专利技术还具有如下技术效果:
42、1.实现了即时通讯应用内用户问题描述的自动标准化
43、本专利技术通过微调大语言模型实现了对用户自然语言问题的标准化转换。相比规则方法,该方法可以从大量数据中学习问题表达的各种变式,对新的未见过的问题描述也具有很强的泛化能力。用户只需以自然语言提出问题,不需要考虑标准表达,应用即可转换为标准问题文本。这简化了用户的操作,提高了问题提出的便利性。
44、2.构建知识库实现高质量的问题标签标注
45、本专利技术通过人工构建知识库并利用映射关系实现标准问题到标签的自动映射。这避免了自动方法标注错误的风险,可以生成高质量、可解释的问题标签。同时映射关系的持续扩展,也使标注系统可以不断优化,适应新问题。
46、3.提高了问题解决和信息传播的效率
47、通过将存在共同问题的用户聚集,提高了用户问题求助和讨论的效率,可以快速获得反馈。同时也可以减少重复讨论,用户只需查询已有讨论组的历史记录即可。减少了反复传播相同问题的时间成本。
4本文档来自技高网...
【技术保护点】
1.一种即时通讯应用内用户分组方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种即时通讯应用内用户分组方法,其特征在于,所述对大语言模型进行微调的步骤,具体包括:
3.根据权利要求1所述的一种即时通讯应用内用户分组方法,其特征在于,所述利用知识库根据标准问题文本建立至少一个问题标签的步骤,具体包括:
4.根据权利要求3所述的一种即时通讯应用内用户分组方法,其特征在于,所述设置所建立的问题标签和提交问题的用户的对应关系的步骤还包括:通过查映射表完成标准问题的标签标注,新建问题标签时扩展映射表,并记录用户-问题标签的对应关系。
5.根据权利要求2所述的一种即时通讯应用内用户分组方法,其特征在于,所述采用的预训练的语言模型为ChatGlm6B模型,所述知识库为本地知识库。
6.根据权利要求2所述的一种即时通讯应用内用户分组方法,其特征在于,所述采用的预训练的语言模型为BERT模型。
7.根据权利要求6所述的一种即时通讯应用内用户分组方法,其特征在于,所述在预训练模型基础上构建针对下游任务的网络结构的方法
8.根据权利要求1所述的一种即时通讯应用内用户分组方法,其特征在于,所述将建立的至少一个问题标签分别在历史问题标签集内进行匹配的方法为使用问题标签的文字进行匹配。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有程序指令,所述程序指令运行时,用于执行权利要求1-8任一项所述的即时通讯应用内用户分组方法。
10.一种即时通讯应用内用户分组系统,其特征在于,包含权利要求9所述的计算机可读存储介质。
...【技术特征摘要】
1.一种即时通讯应用内用户分组方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种即时通讯应用内用户分组方法,其特征在于,所述对大语言模型进行微调的步骤,具体包括:
3.根据权利要求1所述的一种即时通讯应用内用户分组方法,其特征在于,所述利用知识库根据标准问题文本建立至少一个问题标签的步骤,具体包括:
4.根据权利要求3所述的一种即时通讯应用内用户分组方法,其特征在于,所述设置所建立的问题标签和提交问题的用户的对应关系的步骤还包括:通过查映射表完成标准问题的标签标注,新建问题标签时扩展映射表,并记录用户-问题标签的对应关系。
5.根据权利要求2所述的一种即时通讯应用内用户分组方法,其特征在于,所述采用的预训练的语言模型为chatglm6b模型,所述知识库为本地知识库。
6.根据权利要求2...
【专利技术属性】
技术研发人员:彭晓彬,胡皓,周书田,
申请(专利权)人:青岛网信信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。