一种文本处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:40417271 阅读:17 留言:0更新日期:2024-02-20 22:34
本说明书公开了一种文本处理方法、装置、存储介质及电子设备,其中,方法包括:获取至少一个事件长文本,提取所述事件长文本的文本关键词集合,基于事件长文本和文本关键词集合采用文本表示模型进行长文本编码,得到文本表示向量。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种文本处理方法、装置、存储介质及电子设备


技术介绍

1、随着计算机技术的快速发展,诸如消费金融场景等相关场景下每天均会出现大量的事件,为了将事件的新闻报道、用户评论聚合到一起需要将新闻报道、用户评论等长文本表示为特定维度的文本表示向量。


技术实现思路

1、本说明书提供了一种文本处理方法、装置、存储介质及电子设备,所述技术方案如下:

2、第一方面,本说明书提供了一种文本处理方法,所述方法包括:

3、获取至少一个事件长文本,提取所述事件长文本的文本关键词集合;

4、基于所述事件长文本和所述文本关键词集合采用文本表示模型进行长文本编码,得到文本表示向量。

5、第二方面,本说明书提供了一种文本处理装置,所述装置包括:

6、数据处理模块,用于获取至少一个事件长文本,提取所述事件长文本的文本关键词集合;

7、文本编码模块,用于基于所述事件长文本和所述文本关键词集合采用文本表示模型进行长文本编码,得到文本表示向量。...

【技术保护点】

1.一种文本处理方法,所述方法包括:

2.根据权利要求1所述的方法,所述基于所述事件长文本和所述文本关键词集合采用文本表示模型进行长文本编码,得到文本表示向量,包括:

3.根据权利要求2所述的方法,所述通过所述文本表示模型确定所述事件长文本所包含的多个短文本对应的全局文本语义和确定所述文本关键词集合对应的关键词语义,对所述全局文本语义和所述关键词语义进行融合得到文本表示向量,包括:

4.根据权利要求1所述的方法,所述提取所述事件长文本的文本关键词集合,包括:

5.根据权利要求1所述的方法,所述至少一个事件长文本包括至少一组第一事件长文本和第...

【技术特征摘要】

1.一种文本处理方法,所述方法包括:

2.根据权利要求1所述的方法,所述基于所述事件长文本和所述文本关键词集合采用文本表示模型进行长文本编码,得到文本表示向量,包括:

3.根据权利要求2所述的方法,所述通过所述文本表示模型确定所述事件长文本所包含的多个短文本对应的全局文本语义和确定所述文本关键词集合对应的关键词语义,对所述全局文本语义和所述关键词语义进行融合得到文本表示向量,包括:

4.根据权利要求1所述的方法,所述提取所述事件长文本的文本关键词集合,包括:

5.根据权利要求1所述的方法,所述至少一个事件长文本包括至少一组第一事件长文本和第二事件长文本,

6.一种文本表示模型训练方法,所述方法包括:

7.根据权利要求6所述的方法,所述基于所述样本长文本和所述样本文本关键词集合对所述初始文本表示模型进行至少一轮模型对比学习训练,以确定针对所述初始文本表示模型的对比学习模型损失,包括:

8.根据权利要求7所述的方法,所述基于所述样本关键词语义和所述关键词类别向量确定关键对比综合损失,包括:

9...

【专利技术属性】
技术研发人员:张可尊邓俊豪林轩李松刘正勇徐文强王照国郑茂宗霍静静
申请(专利权)人:蚂蚁财富上海金融信息服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1