文本处理方法、装置、计算机可读存储介质及电子设备制造方法及图纸

技术编号:28476575 阅读:14 留言:0更新日期:2021-05-15 21:45
本公开实施例公开了一种文本处理方法、装置、计算机可读存储介质及电子设备,其中,该方法包括:获取待处理文本;对待处理文本进行意图分类,得到意图信息序列;基于预设的统计语言模型,确定意图信息序列对应的权重集合;基于意图信息序列对应的权重集合,确定待处理文本对应的描述评分并输出描述评分。本公开实施例可以实现在评分时通过意图信息组合引入待处理文本中的各个句子的上下文信息,使生成的描述评分可以更准确地反映待处理文本的意图,从而有助于更准确地展示评估待处理文本的质量。同时在评分时通过自动设置意图信息组合的权重,实现了无监督地进行评分。实现了无监督地进行评分。实现了无监督地进行评分。

【技术实现步骤摘要】
文本处理方法、装置、计算机可读存储介质及电子设备


[0001]本公开涉及计算机
,尤其是一种文本处理方法、装置、计算机可读存储介质及电子设备。

技术介绍

[0002]目前在一些领域需要对文本进行评估,以确定文本对一些事物的描述是否准确。因此,可以通过对文本进行评分,用评分来衡量文本的质量。
[0003]例如,为了向用户推荐某种产品(例如房源),可以利用多媒体通过远程展示的方式,向用户讲解产品的基本信息。这对产品推荐人员的个人展示、讲解能力要求很高。通过专家评估发现:合理的展示辅助工具的使用,具备较好的逻辑性的讲解,有助于吸引用户的注意以及进一步地产品价值转化。
[0004]此外,通过对产品推荐人员的展示、讲解行为的评估,可以评判产品推荐人员的表现,进行奖励或惩罚。评估标准,可以通过行业专家经验的大量实践后进行总结得到,再通过语言描述传播给其他人。但该方式存在以下不足:业务场景变化迅速,某些业务场景下,行业专家不存在;专家总结可以定性描述,但是经验推理过程难以描述;专家经验难以对产品推荐人员的线上带看进行定量评估,不能在线对推荐行为进行指导。

技术实现思路

[0005]本公开的实施例提供了一种文本处理方法、装置、计算机可读存储介质及电子设备。
[0006]本公开的实施例提供了一种文本处理方法,该方法包括:获取待处理文本;对待处理文本进行意图分类,得到意图信息序列,其中,意图信息序列中的意图信息与待处理文本中的句子相对应;基于预设的统计语言模型,确定意图信息序列对应的权重集合,其中,权重集合中的权重对应于意图信息序列中的意图信息组合,用于表征对应的意图信息组合包括的意图信息的共现概率;基于意图信息序列对应的权重集合,确定待处理文本对应的描述评分并输出描述评分。
[0007]在一些实施例中,基于意图信息序列对应的权重集合,确定待处理文本对应的描述评分,包括:确定意图信息序列对应的权重集合的综合权重;基于综合权重,确定待处理文本对应的描述评分。
[0008]在一些实施例中,基于综合权重,确定待处理文本对应的描述评分,包括:基于综合权重和预先对预设文本集合中的文本的综合权重进行统计的统计数据,确定待处理文本的排名;基于排名,确定待处理文本的描述评分。
[0009]在一些实施例中,基于预设的统计语言模型,确定意图信息序列对应的权重集合,包括:提取预设的至少一个统计语言模型;将所述意图信息序列输入所述至少一个统计语
言模型,得到所述至少一个统计语言模型分别输出的权重集合,其中,所述权重集合中的权重分别对应于所述意图信息序列中的意图信息组合,且用于表征对应的意图信息组合包括的意图信息的共现概率;获取得到的至少一个权重集合分别对应的综合权重;基于得到的至少一个综合权重的大小,从至少一个综合权重中确定目标综合权重,并将目标综合权重对应的权重集合确定为意图信息序列对应的权重集合。
[0010]在一些实施例中,至少一个统计语言模型中的统计语言模型对应于预设的文本类别信息;方法还包括:将目标综合权重对应的文本类别信息确定为待处理文本的文本类别信息并输出待处理文本的文本类别信息。
[0011]在一些实施例中,在意图信息序列对应的权重集合之后,方法还包括:从意图信息序列对应的权重集合中,确定符合预设条件的权重;基于符合预设条件的权重对应的意图信息组合,从待处理文本中提取目标句子;基于提取的目标句子,生成待处理文本的摘要。
[0012]在一些实施例中,预设条件包括以下至少一项:大于或等于预设的权重阈值,按照权重的大小进行排序后所在的排位处于预设排位范围内。
[0013]根据本公开实施例的另一个方面,提供了一种文本处理装置,该装置包括:获取模块,用于获取待处理文本;分类模块,用于对待处理文本进行意图分类,得到意图信息序列,其中,意图信息序列中的意图信息与待处理文本中的句子相对应;第一确定模块,用于基于预设的统计语言模型,确定意图信息序列对应的权重集合,其中,权重集合中的权重对应于意图信息序列中的意图信息组合,且用于表征对应的意图信息组合包括的意图信息的共现概率;第二确定模块,用于基于意图信息序列对应的权重集合,确定待处理文本对应的描述评分并输出描述评分。
[0014]在一些实施例中,第二确定模块包括:第一确定单元,用于确定意图信息序列对应的权重集合的综合权重;第二确定单元,用于基于综合权重,确定待处理文本对应的描述评分。
[0015]在一些实施例中,第二确定单元包括:第一确定子单元,用于基于综合权重和预先对预设文本集合中的文本的综合权重进行统计的统计数据,确定待处理文本的排名;第二确定子单元,用于基于排名,确定待处理文本的描述评分。
[0016]在一些实施例中,第一确定模块包括:提取单元,用于提取预设的至少一个统计语言模型;第三确定单元,用于将所述意图信息序列输入所述至少一个统计语言模型,得到所述至少一个统计语言模型分别输出的权重集合,其中,所述权重集合中的权重分别对应于所述意图信息序列中的意图信息组合,且用于表征对应的意图信息组合包括的意图信息的共现概率;第四确定单元,用于获取得到的至少一个权重集合分别对应的综合权重;第五确定单元,用于基于得到的至少一个综合权重的大小,从至少一个综合权重中确定目标综合权重,并将目标综合权重对应的权重集合确定为意图信息序列对应的权重集合。
[0017]在一些实施例中,至少一个统计语言模型中的统计语言模型对应于预设的文本类别信息;装置还包括:第三确定模块,用于将目标综合权重对应的文本类别信息确定为待处理文本的文本类别信息并输出待处理文本的文本类别信息。
[0018]在一些实施例中,装置还包括:第四确定模块,用于从意图信息序列对应的权重集合中,确定符合预设条件的权重;提取模块,用于基于符合预设条件的权重对应的意图信息组合,从待处理文本中提取目标句子;生成模块,用于基于提取的目标句子,生成待处理文
本的摘要。
[0019]在一些实施例中,预设条件包括以下至少一项:大于或等于预设的权重阈值,按照权重的大小进行排序后所在的排位处于预设排位范围内。
[0020]根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述文本处理方法。
[0021]根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述文本处理方法。
[0022]基于本公开上述实施例提供的文本处理方法、装置、计算机可读存储介质及电子设备,通过对待处理文本进行意图分类,得到意图信息序列,然后基于预设的统计语言模型,确定意图信息序列对应的权重集合,最后基于权重集合,确定待处理文本对应的描述评分并输出描述评分。由于权重集合中的权重对应于意图信息组合,意图信息组合对应于待处理文本中的相邻的句子,因此,权重可以定量地表征待处理文本中的各个句子与上下文之间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,包括:获取待处理文本;对所述待处理文本进行意图分类,得到意图信息序列,其中,所述意图信息序列中的意图信息与所述待处理文本中的句子相对应;基于预设的统计语言模型,确定所述意图信息序列对应的权重集合,其中,所述权重集合中的权重对应于所述意图信息序列中的意图信息组合,用于表征对应的意图信息组合包括的意图信息的共现概率;基于所述意图信息序列对应的权重集合,确定所述待处理文本对应的描述评分并输出所述描述评分。2.根据权利要求1所述的方法,其中,所述基于所述意图信息序列对应的权重集合,确定所述待处理文本对应的描述评分,包括:确定所述意图信息序列对应的权重集合的综合权重;基于所述综合权重,确定所述待处理文本对应的描述评分。3.根据权利要求2所述的方法,其中,所述基于所述综合权重,确定所述待处理文本对应的描述评分,包括:基于所述综合权重和预先对预设文本集合中的文本的综合权重进行统计的统计数据,确定所述待处理文本的排名;基于所述排名,确定所述待处理文本的描述评分。4.根据权利要求1所述的方法,其中,所述基于预设的统计语言模型,确定所述意图信息序列对应的权重集合,包括:提取预设的至少一个统计语言模型;将所述意图信息序列输入所述至少一个统计语言模型,得到所述至少一个统计语言模型分别输出的权重集合,其中,所述权重集合中的权重分别对应于所述意图信息序列中的意图信息组合,用于表征对应的意图信息组合包括的意图信息的共现概率;获取得到的至少一个权重集合分别对应的综合权重;基于得到的至少一个综合权重的大小,从所述至少一个综合权重中确定目标综合权重,并将所述目标综合权重对应的权重集合确定为所述意图信息序列对应的权重集合。5.根据权利要求4所述的方法,其中,所述至少一个统计语...

【专利技术属性】
技术研发人员:郝梦圆柴鹰孙拔群王奇文
申请(专利权)人:贝壳找房北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1