一种文本处理方法、装置、可读介质及电子设备制造方法及图纸

技术编号:24207923 阅读:25 留言:0更新日期:2020-05-20 15:29
本发明专利技术公开了一种文本处理方法、装置、可读介质及电子设备,包括:从待处理文本中获取待处理词;基于所述待处理词,从所述待处理文本中识别得到相应的目标词;将所述待处理文本中的待处理词替换为所述目标词,以获得目标文本。获取省略了文本信息的待处理词,并通过待处理词确定目标词,进而根据目标词补充省略的文本信息,而确定目标文本;由此使得目标文本中不再存在文本信息的省略,可以通过NLP进行语义分析。

A text processing method, device, readable medium and electronic equipment

【技术实现步骤摘要】
一种文本处理方法、装置、可读介质及电子设备
本专利技术涉及计算机
,尤其涉及一种文本处理方法、装置、可读介质及电子设备。
技术介绍
自然语言处理(NaturalLanguageProsessing,简称NLP)是指计算机对人类语言(包括语音和文本)进行分析,以判断其含义。对于以文字形式记载的自然语言,很多情况下为了方便书写,都会出现省略词语,而目前基于NLP技术,无法准确的对这种省略词语分析。
技术实现思路
本专利技术提供一种文本处理方法、装置、可读介质及电子设备,通过找到省略词语对应的完整的文本信息并进行替换,以解决NLP技术无法分析识别省略词语的技术问题。第一方面,本专利技术提供了一种文本处理方法,包括:从待处理文本中获取待处理词;基于所述待处理词,从所述待处理文本中识别得到相应的目标词;将所述待处理文本中的待处理词替换为所述目标词,以获得目标文本。优选地,所述基于所述待处理词,从所述待处理文本中识别得到相应的目标词包括:确定所述待处理词对应的第一关联词;...

【技术保护点】
1.一种文本处理方法,其特征在于,包括:/n从待处理文本中获取待处理词;/n基于所述待处理词,从所述待处理文本中识别得到相应的目标词;/n根据所述目标词确定目标文本。/n

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:
从待处理文本中获取待处理词;
基于所述待处理词,从所述待处理文本中识别得到相应的目标词;
根据所述目标词确定目标文本。


2.根据权利要求1所述方法,其特征在于,所述基于所述待处理词,从所述待处理文本中识别得到相应的目标词包括:
确定所述待处理词对应的第一关联词;
从所述待处理文本中识别得到与所述第一关联词相关联的第二关联词;
获取所述第二关联词对应的文本信息,以作为所述目标词。


3.根据权利要求2所述方法,其特征在于,所述确定待处理词对应的第一关联词包括:
从所述待处理文本中,获取包括所述待处理词的第一文本段落;
从所述第一文本段落中,确定所述待处理词对应的第一关联词。


4.根据权利要求3所述方法,其特征在于,所述从所述待处理文本中识别得到与所述第一关联词相关联的第二关联词包括:
查询所述待处理文本中位于所述第一文本段落之前的第二文本段落,并从所述第二文本段落中识别得到所述第二关联词。


5.根据权利要求3所述方法,其特征在于,所述根据所述目标词确定目标文本包括:
在所述第一文本段落中,将所述待处理词替换为所述目标词;并将替换后的所述待处理文本确...

【专利技术属性】
技术研发人员:李红杰王义刘水清
申请(专利权)人:南京医渡云医学技术有限公司南京懿医云大数据科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1