【技术实现步骤摘要】
文本处理方法、装置、设备及可读存储介质
[0001]本申请涉及人工智能领域,尤其涉及一种文本处理方法、装置、设备及可读存储介质。
技术介绍
[0002]在多种自然语言处理(Natural Language Processing,NLP)任务中,需要对目标词汇相关的文本进行分析,以获取对应的分析结果。
[0003]在相关技术中,当需要对目标词汇进行分析时,通常在网络中获取包含该目标词汇的文本,并对包含该目标词汇的文本进行分析。在实际应用过程中,很多词汇具有多种含义,当需要对具有某种特定含义的目标词汇进行分析时,按照上述方式获取到的文本中,目标词汇的含义可能为其它含义,导致获取的文本的准确性较低。例如,假设目标词汇为bank,bank的含义至少包括银行、河岸,当需要对含义为银行的bank词汇进行分析时,按照上述方式获取多条文本中,可能存在部分文本中的bank的含义为河岸,导致获取的文本的准确性较低。
[0004]由上可知,按照上述方法获取得到的文本的准确性较低。
技术实现思路
[0005]本申请提 ...
【技术保护点】
【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:根据目标分词获取M个文本,所述文本中包括所述目标分词,所述M为大于1的整数;确定所述目标分词在每个文本中的词向量,得到M个词向量,所述词向量包括多个维度特征;确定每个词向量的权重信息和二维词向量,所述权重信息包括每个维度特征的权重值;根据每个词向量的权重信息和二维词向量,在所述M个文本中确定目标文本,所述目标文本用于对所述目标分词对应的文本分析结果。2.根据权利要求1所述的方法,其特征在于,根据每个词向量的权重信息和二维词向量,在所述M个文本中确定目标文本,包括:根据每个词向量的权重信息,在所述M个词向量中确定多个待选词向量;根据所述多个待选词向量的二维词向量,在所述多个待选词向量中确定目标词向量;将所述目标词向量所在的文本确定为所述目标文本。3.根据权利要求2所述的方法,其特征在于,根据每个词向量的权重信息,在所述M个词向量中确定多个待选词向量,包括:确定所述目标分词的目标词性;确定所述目标词性对应的目标权重信息,所述目标权重信息中包括所述多个维度特征的目标权重值;根据每个词向量的权重信息和所述目标权重信息,在所述M个词向量中确定所述多个待选词向量。4.根据权利要求3所述的方法,其特征在于,根据每个词向量的权重信息和所述目标权重信息,在所述M个词向量中确定所述多个待选词向量,包括:获取每个词向量的权重信息与所述目标权重信息之间的匹配度;根据每个词向量的权重信息与所述目标权重信息之间的匹配度,在所述M个词向量中确定所述多个待选词向量,所述待选词向量的权重信息与所述目标权重信息之间的匹配度大于或等于预设阈值。5.根据权利要求2
‑
4任一项所述的方法,其特征在于,根据所述多个待选词向量的二维词向量,在所述多个待选词向量中确定目标词向量,包括:确定所述目标分词对应的目标二维词向量;将每个待选词向量的二维词向量、以及所述目标二维词向量映射至二维坐标,得到映射图;在所述映射图中,确定所述目标二维词向量的目标位置;根据每个待选词向量在所述映射图中的位置、以及所述目标位置,在所述多个待选词...
【专利技术属性】
技术研发人员:侯安,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。