一种数据处理方法、服务器及计算机可读介质技术

技术编号:19821916 阅读:23 留言:0更新日期:2018-12-19 14:45
本申请实施例公开了一种数据处理方法、服务器及计算机可读介质,其中,该方法包括:接收终端发送的原始数据;对所述原始数据进行处理得到至少一个关联实体,并对所述原始数据进行分词以得到至少一个关键词;利用所述至少一个关键词对所述至少一个关联实体进行筛选,得到第一关联实体集合;根据所述至少一个关键词以及所述第一关联实体集合从图数据库中检索出第二关联实体集合;所述第二关联实体集合中包括一个或多个预设关联实体;利用所述第二关联实体集合对所述原始数据进行信息修正,发送信息修正后的原始数据至所述终端。采用本申请,可以标准化原始数据,为设备提供标准化的输入。

【技术实现步骤摘要】
一种数据处理方法、服务器及计算机可读介质
本申请涉及计算机
,尤其涉及一种数据处理方法、服务器及计算机可读介质。
技术介绍
在进行人机交互时,用户在输入相关数据时容易出现错漏信息或缺失关键信息的情况,就会导致电子设备获取的信息不全或错误,导致对信息的处理结果与预期出现偏差,不够准确。
技术实现思路
本申请实施例提供了一种数据处理方法、服务器及计算机可读介质,能够标准化原始数据,为设备提供标准化的输入。第一方面,本申请实施例提供了一种数据处理方法,包括:接收终端发送的原始数据;对所述原始数据进行处理得到至少一个关联实体,并对所述原始数据进行分词以得到至少一个关键词;利用所述至少一个关键词对所述至少一个关联实体进行筛选,得到第一关联实体集合;根据所述至少一个关键词以及所述第一关联实体集合从图数据库中检索出第二关联实体集合;所述第二关联实体集合中包括一个或多个预设关联实体;利用所述第二关联实体集合对所述原始数据进行信息修正,发送信息修正后的原始数据至所述终端。可选地,所述对所述原始数据进行处理得到至少一个关联实体,包括:对所述原始数据进行同义词标准化处理,得到第一数据,和/或对所述原始数据进行谐音词标准化处理,得到第一数据;对所述第一数据进行命名实体识别处理,得到至少一个关联实体。可选地,所述利用所述至少一个关键词对所述至少一个关联实体进行筛选,得到第一关联实体集合,包括:计算所述至少一个关键词与所述至少一个关联实体中各个关联实体的相似度;根据计算得到的相似度从所述至少一个关联实体中选取第一关联实体以构成第一关联实体集合;其中,所述至少一个关键词与所述第一关联实体的相似度大于或等于第一预设值。可选地,所述计算所述至少一个关键词与所述至少一个关联实体中各个关联实体的相似度,包括:统计所述至少一个关键词中各个关键词的词频;根据所述各个关键词的词频计算得到第一向量,并从数据库中获取所述至少一个关联实体中各个关联实体各自对应的第二向量;根据所述第一向量和所述第二向量计算得到的值表征所述至少一个关键词与所述各个关联实体的相似度。可选地,所述利用所述第二关联实体集合对所述原始数据进行信息修正,包括:计算所述至少一个关键词和所述第二关联实体集合中各个关联实体的相似度;根据计算得到的相似度从所述第二关联实体集合中选取第三关联实体以构成第三关联实体集合;所述至少一个关键词与所述第三关联实体的相似度大于或等于第二预设值;利用所述第三关联实体集合中各个关联实体对所述原始数据进行信息修正。可选地,所述计算所述至少一个关键词和所述第二关联实体集合中各个关联实体的相似度,包括:获取根据所述第二关联实体集合中各个关联实体对应的第三向量;根据所述第一向量与所述第三向量计算得到的值表征所述至少一个关键词和所述第二关联实体集合中各个关联实体的相似度。第二方面,本申请实施例提供了一种服务器,包括:接收单元,用于接收终端发送的原始数据;处理单元,用于对所述原始数据进行处理得到至少一个关联实体,并对所述原始数据进行分词以得到至少一个关键词;筛选单元,用于利用所述至少一个关键词对所述至少一个关联实体进行筛选,得到第一关联实体集合;检索单元,用于根据所述至少一个关键词以及所述第一关联实体集合从图数据库中检索出第二关联实体集合;所述第二关联实体集合中包括一个或多个预设关联实体;修正单元,用于利用所述第二关联实体集合对所述原始数据进行信息修正;发送单元,用于发送信息修正后的原始数据至所述终端。可选地,所述处理单元,具体用于对所述原始数据进行同义词标准化处理,得到第一数据,和/或对所述原始数据进行谐音词标准化处理,得到第一数据;对所述第一数据进行命名实体识别处理,得到至少一个关联实体。可选地,所述筛选单元,具体用于计算所述至少一个关键词与所述至少一个关联实体中各个关联实体的相似度;根据计算得到的相似度从所述至少一个关联实体中选取第一关联实体以构成第一关联实体集合;其中,所述至少一个关键词与所述第一关联实体的相似度大于或等于第一预设值。可选地,所述筛选单元计算所述至少一个关键词与所述至少一个关联实体中各个关联实体的相似度,具体为统计所述至少一个关键词中各个关键词的词频;根据所述各个关键词的词频计算得到第一向量,并从数据库中获取所述至少一个关联实体中各个关联实体各自对应的第二向量;根据所述第一向量和所述第二向量计算得到的值表征所述至少一个关键词与所述各个关联实体的相似度。可选地,所述修正单元,具体用于计算所述至少一个关键词和所述第二关联实体集合中各个关联实体的相似度;根据计算得到的相似度从所述第二关联实体集合中选取第三关联实体以构成第三关联实体集合;所述至少一个关键词与所述第三关联实体的相似度大于或等于第二预设值;利用所述第三关联实体集合中各个关联实体对所述原始数据进行信息修正。可选地,所述修正单元计算所述至少一个关键词和所述第二关联实体集合中各个关联实体的相似度,具体为获取根据所述第二关联实体集合中各个关联实体对应的第三向量;根据所述第一向量与所述第三向量计算得到的值表征所述至少一个关键词和所述第二关联实体集合中各个关联实体的相似度。第三方面,本申请实施例还提供了一种服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面及其任一种可选方式所述的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面及其任一种可选方式所述的方法。综上所述,服务器可以接收终端发送的原始数据,并可以对该原始数据进行处理得到至少一个关联实体,并可以对该原始数据进行分词得到至少一个关键词,并利用该至少一个关键词对该至少一个关联实体进行筛选得到第一关联实体集合,以便根据该至少一个关键词以及该第一关联实体集合从图数据库中检索出第二关联实体集合来对原始数据进行修正,从而将修正后的原始数据发送至终端,使得返回终端的原始数据更加标准化。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种数据处理系统的架构示意图;图2是本申请实施例提供的一种数据处理方法的流程示意图;图3是本申请实施例提供的另一种数据处理方法的流程示意图;图4是本申请实施例提供的一种服务器的结构示意图;图5是本申请实施例提供的另一种服务器的结构示意图。具体实施方式下面将结合本申请实施例中的附图,描述本申请实施例中的技术方案。请参阅图1,为本申请实施例提供的一种数据处理系统的架构示意图。具体地,该数据处理系统可以包括终端10和服务器20。终端10可以与服务器20进行通信。其中,该终端10包括但不限于智能手机、平板电脑、智能机器人等具有图像处理功能、语音识别功能或文字处理功能等功能的设备。该服务器20可以为互联本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:接收终端发送的原始数据;对所述原始数据进行处理得到至少一个关联实体,并对所述原始数据进行分词以得到至少一个关键词;利用所述至少一个关键词对所述至少一个关联实体进行筛选,得到第一关联实体集合;根据所述至少一个关键词以及所述第一关联实体集合从图数据库中检索出第二关联实体集合;所述第二关联实体集合中包括一个或多个预设关联实体;利用所述第二关联实体集合对所述原始数据进行信息修正,发送信息修正后的原始数据至所述终端。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:接收终端发送的原始数据;对所述原始数据进行处理得到至少一个关联实体,并对所述原始数据进行分词以得到至少一个关键词;利用所述至少一个关键词对所述至少一个关联实体进行筛选,得到第一关联实体集合;根据所述至少一个关键词以及所述第一关联实体集合从图数据库中检索出第二关联实体集合;所述第二关联实体集合中包括一个或多个预设关联实体;利用所述第二关联实体集合对所述原始数据进行信息修正,发送信息修正后的原始数据至所述终端。2.根据权利要求1所述的方法,其特征在于,所述对所述原始数据进行处理得到至少一个关联实体,包括:对所述原始数据进行同义词标准化处理,得到第一数据,和/或对所述原始数据进行谐音词标准化处理,得到第一数据;对所述第一数据进行命名实体识别处理,得到至少一个关联实体。3.根据权利要求1所述的方法,其特征在于,所述利用所述至少一个关键词对所述至少一个关联实体进行筛选,得到第一关联实体集合,包括:计算所述至少一个关键词与所述至少一个关联实体中各个关联实体的相似度;根据计算得到的相似度从所述至少一个关联实体中选取第一关联实体以构成第一关联实体集合;其中,所述至少一个关键词与所述第一关联实体的相似度大于或等于第一预设值。4.根据权利要求3所述的方法,其特征在于,所述计算所述至少一个关键词与所述至少一个关联实体中各个关联实体的相似度,包括:统计所述至少一个关键词中各个关键词的词频;根据所述各个关键词的词频计算得到第一向量,并从数据库中获取所述至少一个关联实体中各个关联实体各自对应的第二向量;根据所述第一向量和所述第二向量计算得到的值表征所述至少一个关键词与所述各个关联实体的相似度。5.根据权利要求4所述的方法,其特征在于,所述利用所述第二关联实体集合对所述原始数据进行信息修正,包括:计算所述至少一个关键词和所述第二关联实体集合中各个关联实体的相似度;根据计算得到的相似度从所述第二关联实体集合中选取第...

【专利技术属性】
技术研发人员:刘均秦文礼
申请(专利权)人:深圳市元征科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1