【技术实现步骤摘要】
文本上下文处理方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
,尤其涉及一种文本上下文处理方法、装置、电子设备和存储介质。
技术介绍
[0002]自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
[0003]相关技术中,用户通过阅读文章训练语感进行语言学习,但是文章中通常采用较长的语句以表达丰富的含义,对于用户来说,过长的语句很难抓住重点,使得语言学习的难度增加。
技术实现思路
[0004]本公开提供一种文本上下文处理方法、装置、电子设备和存储介质,以至少解决相关技术中过长的语句用户难以抓住重点,语言学习的难度较高的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种文本上下文处理方法,包括:获取待处理文本;响应于用户精简文本的下文操作,将所述待处理文本输入至语法分析树统计模型,获取目标文本单元,删除所述待处理 ...
【技术保护点】
【技术特征摘要】
1.一种文本上下文处理方法,其特征在于,包括:获取待处理文本;响应于用户精简文本的下文操作,将所述待处理文本输入至语法分析树统计模型,获取目标文本单元,删除所述待处理文本中的目标文本单元,生成精简文本;其中,所述待处理文本中包括多个文本单元,所述文本单元为词语或短语;响应于用户新增文本的上文操作,获取新增文本单元,确定所述新增文本单元对应的在所述待处理文本中的目标位置,将所述新增文本单元添加至所述目标位置,生成新增文本。2.根据权利要求1所述的方法,其特征在于,所述响应于用户精简文本的下文操作,将所述待处理文本输入至语法分析树统计模型,获取目标文本单元,删除所述待处理文本中的目标文本单元,生成精简文本下文操作,包括:将所述待处理文本输入至语法分析树统计模型,获取与所述待处理文本匹配的目标语法规则;根据所述目标语法规则,获取所述待处理文本对应的多个文本单元,以及所述文本单元对应的权重等级;在根据所述权重等级,确定存在所述目标文本单元的情况下,响应于用户精简文本的下文操作,删除所述待处理文本中的所述目标文本单元,生成所述精简文本。3.根据权利要求2所述的方法,其特征在于,所述在根据所述权重等级,确定存在所述目标文本单元的情况下,响应于用户精简文本的下文操作,删除所述待处理文本中的所述目标文本单元,生成所述精简文本,包括:在根据所述权重等级,确定存在N个等级的文本单元的情况下,响应于用户第一次精简文本的下文操作,根据所述权重等级,确定所述待处理文本中的所述权重等级为第一等级的文本单元为目标文本单元,删除目标文本单元,生成第一精简文本;其中,N为大于3的整数;响应于用户第二次精简文本的下文操作,根据所述权重等级,确定所述第一精简文本中所述权重等级为第二等级的文本单元为目标文本单元,删除目标文本单元,生成第二精简文本;以此类推,直至响应于用户第N
‑
1次精简文本的下文操作,根据所述权重等级,确定所述第N
‑
2精简文本中所述权重等级为第N
‑
1等级的文本单元为目标文本单元,删除目标文本单元,生成所述精简文本。4.根据权利要求2所述的方法,其特征在于,所述方法,还包括:在根据所述权重等级,确定不存在所述目标文本单元的情况下,提示所述待处理文本为精简文本并退出。5.根据权利要求2所述的方法,其特征在于,所述方法,还包括:将所述精简文本输入至所述语法分析树统计模型,在存在匹配的语法规则的情况下,向用户提供所述精简文本;在不存在匹配的语法规则的情况下,提示精简文本错误并退出。6.根据权利要求1所述的方法,其特征在于,所述响应于用户新增文本的上文操作,获取新增文本单元,确定所述新增文本单元对应的在所述待处理文本中的目标位置,将所述
新增文本单元添加至所述目标位置,生成新增文本,包括:响应于用户新增文本的上文操作,将所述待处理文本按照预设条件划分为至少一个文本单元序列;将所述文本单元序列输入至训练好的词向量模型,预测得到新增文本单元;遍历所述待处理文本,确定所述新增文本单元对应的在所述待处理文本中的第一预留位置;将所述新增文本单元添加至所述待处理文本的所述第一预留位置,生成新增文本。7.根据权利要求6所述的方法,其特征在于,所述方法,还包括:将所述新增文本输入至所述语法分析树统计模型,在存在匹配的语法规则的情况下,向用户提供所述新增文本;在不存在匹配的语法规则的情况下,提示新增文本错误并退出。8.根据权利要求6所述的方法,其特征在于,所述方法,还包括:获取所述新增文本中包括的文本单元的第一数目;在所述第一数目大于第一预设阈值的情况下,响应于用户新增文本的上文操作,提示新增文本达上限并退出。9.根据权利要求1所述的方法,其特征在于,所述方法,还包括:响应于用户生成文本的第一操作,将待处理文本输入至语法分析树统计模型,获取所述待处理文本包括的语法规则;将所述语法规则匹配目标语句库进行目标约束,根据所述语法规则和所述目标语句库中的语句库语法规则,构建新增语法规则;其中,所述新增语法规则与所述语法规则构成父子关系或兄弟关系;根据所述新增语法规则,从专用词库中获取多个生成文本单元,以及确定所述生成文本单元对应在所述待处理文本中的第二预留位置;将所述生成文本单元添加至所述待处理文本的所述第二预留位置,获取多个生成文本;获取目标语句库中的多个目标语句;将所述生成文本分别与所述目标语句进行相似度计算,从多个所述生成文本中确定一个作为目标生成文本。10.根据权利要求9所述的方法,其特征在于,所述方法,还包括:获取语料数据;对所述语料数据进行处理,获取多个目标语句;对所述目标语句进行汇总,生成所述目标语句库;对所述目标语...
【专利技术属性】
技术研发人员:顾军,张志强,
申请(专利权)人:北京弗罗达教育科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。