一种数据处理方法、服务器及计算机可读介质技术

技术编号:19691943 阅读:26 留言:0更新日期:2018-12-08 11:12
本申请实施例公开了一种数据处理方法、服务器及计算机可读介质,其中,该方法可以包括:接收终端发送的原始数据;对所述原始数据进行分词,得到词序列;所述词序列包括一个或多个关键词;对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列;对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对;将与所述目标意向词对对应的关联信息发送至所述终端。采用本申请,可以为终端提供更准确的输入,有利于提高终端的数据识别速率和准确度。

【技术实现步骤摘要】
一种数据处理方法、服务器及计算机可读介质
本申请涉及计算机
,尤其涉及一种数据处理方法、服务器及计算机可读介质。
技术介绍
人机交互是指人与计算机之间信息交互的过程。随着人机交互技术的发展,终端可以自动化识别用户输入的控制指令等信息,并根据该控制指令等信息执行控制操作等操作。然而,在人机交互过程中,由于用户输入的控制指令等信息会随着用户习惯等因素呈现出多样化的特点,这就导致终端在识别用户输入的控制指令等信息的时候速率和准确率较低。
技术实现思路
本申请实施例提供了一种数据处理方法、服务器及计算机可读介质,可以为终端提供更准确的输入,有利于提高终端的数据识别速率和准确度。第一方面,本申请实施例提供了一种数据处理方法,包括:接收终端发送的原始数据;对所述原始数据进行分词,得到词序列;所述词序列包括一个或多个关键词;对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列;对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对;将与所述目标意向词对对应的关联信息发送至所述终端。可选地,所述对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列,包括:读取预设的序列模型,并利用所述序列模型对所述词序列进行词性识别处理以生成词性序列;组合所述词性序列与所述词序列以分别得到第一类词对序列和第二类词对序列。可选地,所述对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对,包括:对所述第一类词对序列中各个词对进行计算,得到一个或多个词对组合;根据所述词对组合确定出一个或多个为预设类别的实体;利用预设的词对匹配模型,对所述实体以及所述第二类词对序列进行处理,得到意向词对序列,并从所述意向词对序列中提取目标意向词对。可选地,所述从所述意向词对序列中提取目标意向词对序列,包括:获取所述意向词对序列中各个意向词对对应的概率;所述各个意向词对的概率是由所述词对匹配模型预先计算好的;根据所述各个意向词对的概率,从所述意向词对序列中确定出目标意向词对;所述目标意向词的概率是所述各个意向词对的概率中最大的。可选地,所述输出所述目标意向词对对应的关联信息之前,所述方法还包括:提取数据库模型;所述数据库模型中存储各个词对与各个关联信息的对应关系;其中,每一个词对对应一个或者多个关联信息;利用所述数据库模型对所述目标意向词对进行语义识别,以确定出与所述目标意向词对对应的关联信息。第二方面,本申请实施例提供了一种服务器,包括:接收单元,用于接收终端发送的原始数据;分词单元,用于对所述原始数据进行分词,得到词序列;所述词序列包括一个或多个关键词;处理单元,用于对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列;所述处理单元,还用于对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对;发送单元,用于将与所述目标意向词对对应的关联信息发送至所述终端。可选地,所述处理单元对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列,具体为读取预设的序列模型,并利用所述序列模型对所述词序列进行词性识别处理以生成词性序列;组合所述词性序列与所述词序列以分别得到第一类词对序列和第二类词对序列。可选地,所述处理单元对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对,具体为对所述第一类词对序列中各个词对进行计算,得到一个或多个词对组合;根据所述词对组合确定出一个或多个为预设类别的实体;利用预设的词对匹配模型,对所述实体以及所述第二类词对序列进行处理,得到意向词对序列,并从所述意向词对序列中提取目标意向词对。可选地,所述处理单元从所述意向词对序列中提取目标意向词对序列,具体为获取所述意向词对序列中各个意向词对对应的概率;所述各个意向词对的概率由所述词对匹配模型预先计算得出;将所述各个意向词对中概率最大的意向词对确定为目标意向词对。可选地,提取单元,用于在发送单元将与所述目标意向词对对应的关联信息发送至所述终端之前,提取数据库模型;所述数据库模型中存储各个词对与各个关联信息的对应关系;所述处理单元,还用于利用所述数据库模型对所述目标意向词对进行语义识别,以确定出与所述目标意向词对对应的关联信息。第三方面,本申请实施例还提供了一种服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面及其任一种可选方式所述的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面及其任一种可选方式所述的方法。综上所述,服务器可以接收终端发送的原始数据,并对该原始数据进行处理得到第一类词性序列和第二类词性序列,服务器可以对该第一类词对序列进行命名实体识别得到一个或者多个为预设类别的实体,并对该实体和该第二类词对序列进行处理得到目标意向词对,从而将与该目标词对对应的关联信息发送至该终端,可以为终端预测出重要的信息或解析出重要的信息,从而为终端提供更准确有效的输入,有利于终端提高数据识别速率和准确度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种数据处理系统的架构示意图;图2是本申请实施例提供的一种数据处理方法的流程示意图;图3是本申请实施例提供的另一种数据处理方法的流程示意图;图4是本申请实施例提供的一种服务器的结构示意图;图5是本申请实施例提供的另一种服务器的结构示意图。具体实施方式下面将结合本申请实施例中的附图,描述本申请实施例中的技术方案。请参阅图1,为本申请实施例提供的一种数据处理系统的架构示意图。其中,该数据处理系统包括终端10、服务器20。终端10与服务器20之间可以进行通信。其中,该终端10包括但不限于智能手机、平板电脑、智能机器人等信息处理功能(如图像处理功能、语音识别功能)的电子设备。该服务器20可以为互联网中一个单独的服务器或服务器集群。终端10可以接收用户输入的原始数据,并可以将该原始数据发送至服务器20进行语义识别处理,服务器20可以将根据该原始数据预测出的信息发送至终端10,和/或由服务器20将根据该原始数据解析出的信息发送终端10,从而为终端10提供更加准确有效的输入,以便终端10执行识别等操作。在一个实施例中,服务器20对原始数据进行语义识别处理,具体可以为:服务器20对该原始数据中的关键词进行词性标注以提取出不同类别的词对序列;该不同类别的词对序列至少包括第一类别词对序列和第本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:接收终端发送的原始数据;对所述原始数据进行分词,得到词序列;所述词序列包括一个或多个关键词;对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列;对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对;将与所述目标意向词对对应的关联信息发送至所述终端。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:接收终端发送的原始数据;对所述原始数据进行分词,得到词序列;所述词序列包括一个或多个关键词;对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列;对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对;将与所述目标意向词对对应的关联信息发送至所述终端。2.根据权利要求1所述的方法,其特征在于,所述对所述词序列进行词性识别处理,得到第一类词对序列和第二类词对序列,包括:读取预设的序列模型,并利用所述序列模型对所述词序列进行词性识别处理以生成词性序列;组合所述词性序列与所述词序列以分别得到第一类词对序列和第二类词对序列。3.根据权利要求1或2所述的方法,其特征在于,所述对所述第一类词对序列进行命名实体识别,得到一个或者多个为预设类别的实体,并对所述实体以及所述第二类词对序列进行处理,得到目标意向词对,包括:对所述第一类词对序列中各个词对进行计算,得到一个或多个词对组合;根据所述词对组合确定出一个或多个为预设类别的实体;利用预设的词对匹配模型,对所述实体以及所述第二类词对序列进行处理,得到意向词对序列,并从所述意向词对序列中提取目标意向词对。4.根据权利要求3所述的方法,其特征在于,所述从所述意向词对序列中提取目标意向词对序列,包括:获取所述意向词对序列中各个意向词对对应的概率;所述各个意向词对的概率由所述词对匹配模型预先计算得出;将所述各个意向词对中概率最大的意向词对确定为目标意向词对。5.根据权利要求1所述的方法,其特征在于,所述将与所述目标意向词对对应的关联信息发送至所述终端之前,所述方法还包括:提取数据库模型;所述数据库模型中存储各个词对与各个关联信息的对应关系;利用所述数据库模型对所述目标意向词对进行语义识别,以确定出与所述目标意向词对对应的关联信...

【专利技术属性】
技术研发人员:刘均秦文礼
申请(专利权)人:深圳市元征科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1