一种文本处理方法、装置、设备及介质制造方法及图纸

技术编号:26172153 阅读:23 留言:0更新日期:2020-10-31 13:48
本发明专利技术实施例公开了一种文本处理方法、装置、电子设备及存储介质,该方法包括:将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果;基于所述第一处理结果以及所述第二处理结果获取目标处理结果。本发明专利技术实施例的技术方案,改善了模型性能,提高了模型的文本处理精度。

【技术实现步骤摘要】
一种文本处理方法、装置、设备及介质
本专利技术实施例涉及计算机
,尤其涉及一种文本处理方法、装置、电子设备及存储介质。
技术介绍
文本处理包括对文本信息中的目标文本进行识别、对文本信息所表达的情感色彩进行识别等。在对话领域,具体的,例如客服接待场景,目前常用的文本处理方法包括基于语言模型对对话内容进行处理,获得处理结果。通常在一个对话场景仅通过一个语言模型对所有参与对话的用户的对话内容进行处理。但在对话场景中至少包括两个对话参与人,对话内容是至少两个对话参与人共同输出的,并不是同一个人的语言连续输出,因此会出现对话内容间断的问题,尤其是在转换话题时。而且在离线应用场景,需将所有对话人的对话内容全部输入同一语言模型进行处理,导致语言模型的输入非常庞大。综上所述,通过同一语言模型对所有参与对话的用户的对话内容进行处理的方法存在模型性能差,处理精度低的问题。
技术实现思路
本专利技术实施例提供一种文本处理方法、装置、电子设备及存储介质,提高了模型处理精度。第一方面,本专利技术实施例提供了一种文本处理方法,该方法包括:将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果;基于所述第一处理结果以及所述第二处理结果获取目标处理结果。第二方面,本专利技术实施例还提供了一种文本处理装置,该装置包括:第一处理模块,用于将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;第二处理模块,用于将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果;汇总模块,用于基于所述第一处理结果以及所述第二处理结果获取目标处理结果。第三方面,本专利技术实施例还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例任一所述的文本处理方法。第四方面,本专利技术实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本专利技术实施例任一所述的文本处理方法。本专利技术实施例提供的一种文本处理方法,通过将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果,基于所述第一处理结果以及所述第二处理结果获取目标处理结果的技术手段,实现了提高模型性能、提高模型处理精度的目的。附图说明结合附图并参考以下具体实施方式,本专利技术各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。图1为本专利技术实施例一所提供的一种文本处理方法流程示意图;图2为本专利技术实施例一所提供的另一种文本处理方法流程示意图;图3为本专利技术实施例二所提供的一种语言模型训练方法流程示意图;图4为本专利技术实施例三所提供的一种文本处理装置结构示意图;图5为本专利技术实施例四所提供的一种电子设备结构示意图。具体实施方式下面将参照附图更详细地描述本专利技术的实施例。虽然附图中显示了本专利技术的某些实施例,然而应当理解的是,本专利技术可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本专利技术。应当理解的是,本专利技术的附图及实施例仅用于示例性作用,并非用于限制本专利技术的保护范围。应当理解,本专利技术的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本专利技术的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本专利技术中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本专利技术中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。实施例一图1为本专利技术实施例一所提供的一种文本处理方法流程示意图。该方法适用于文本处理系统。所述方法可以由文本处理装置来执行,该装置可以通过软件和/或硬件的形式实现。如图1所述,本专利技术实施例提供的文本处理方法包括如下步骤:步骤110、将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果。其中,所述第一对话内容可以是第一对话用户在对话过程中实时发出的,也可以是第一对话用户的历史对话内容。可以理解的是,在将所述第一对话内容输入至所述第一语言模型之前,需要将所述第一对话内容进行预处理,以使其符合所述第一语言模型的输入格式要求。具体的,将所述第一对话内容中不能被系统识别的内容去掉,例如表情符号以及标点符号等。若所述第一对话用户连续发出多句第一对话内容,则将连续的多句第一对话内容合并成一句话,连续的多句第一对话内容中间通过连接符进行连接,然后基于设定文本字典查找每个字或词对应的数值ID,将全部文本转换为数值ID。进一步的,还可以限制每次输入至所述第一语言模型的文本长度,未达到所限制的文本长度的语句通过设定字符进行填充,超出的部分舍弃。若所述第一对话内容是从历史对话记录获取的,则基于对话用户将不同对话用户的发言拆开,按照原有时序将单个对话用户的发言排序,并进一步转换为所述第一语言模型可以识别的格式。步骤120、将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果。同样的,所述第二处理结果包括情感分析结果或者设定关键词识别结果。所述第二语言模型与所述第一语言模型的模型结构相同,无需针对不同的对话用户构建不同结构的语言模型,以保证方案的适应性。需要说明的是,所述第一语言模型与所述第二语言模型的结构虽然相同,但是两者的模型参数不同。在模型训练阶段需针对模型的应用场景,分别训练不同数量的语言模型,例如模型的应用场景为支本文档来自技高网...

【技术保护点】
1.一种文本处理方法,其特征在于,包括:/n将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;/n将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果;/n基于所述第一处理结果以及所述第二处理结果获取目标处理结果。/n

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:
将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;
将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果;
基于所述第一处理结果以及所述第二处理结果获取目标处理结果。


2.根据权利要求1所述的方法,其特征在于,所述获得第二处理结果之后,还包括:
将所述第一对话用户基于所述第二对话内容在第二时刻发出的第三对话内容、所述第一处理结果以及所述第二处理结果作为所述第一语言模型的第一输入信息,以使所述第一语言模型基于所述第一输入信息对所述第三对话内容进行处理,获得第三处理结果;
其中,所述第二时刻晚于所述第一时刻。


3.根据权利要求2所述的方法,其特征在于,所述获得第三处理结果之后,还包括:
将所述第二对话用户基于所述第三对话内容发出的第四对话内容、所述第二处理结果以及所述第三处理结果作为所述第二语言模型的第二输入信息,以使所述第二语言模型基于所述第二输入信息对所述第四对话内容进行处理,获得第四处理结果;
对应的,所述基于所述第一处理结果以及所述第二处理结果获取目标处理结果,包括:
基于所述第三处理结果以及所述第四处理结果获取目标处理结果。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一语言模型以及所述第二语言模型均包括自注意力self-attention模块,所述第一语言模型与所述第二语言模型的模型结构相同...

【专利技术属性】
技术研发人员:何耀平吴边柴鹏飞孟海忠任宇翔方成饶官军许红伟洪叶恩冯辉
申请(专利权)人:微医云杭州控股有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1