数据应答处理方法、装置及服务器制造方法及图纸

技术编号：17265293 阅读：38 留言：0更新日期：2018-02-14 12:45

本说明书实施例提供一种数据应答处理方法、装置及服务器。该方法包括：获取用户的提问数据；基于预设词向量集合确定该提问数据的词向量；计算该词向量与预设数量的索引词向量之间的匹配度，将与该词向量匹配度最小的索引词向量所对应的应答数据反馈给目标用户。

Data response processing methods, devices and servers

The specification embodiment provides a data response processing method, device and server. The method includes: obtaining user data questions; default word vector set the word vector based on the data of the question; and calculate the default word vector matching degree between index vector quantity, and the word vector matching corresponding to the minimum degree of the index vector according to the feedback responses to target users.

全部详细技术资料下载

【技术实现步骤摘要】
数据应答处理方法、装置及服务器
本说明书实施例涉及互联网
，特别涉及一种数据应答处理方法、装置及服务器。
技术介绍
在互联网时代，人们日常生活中的事务常常在互联网进行处理。用户在互联网业务系统使用产品或者服务的过程中，经常会有咨询问题、查询业务等获取数据的需求。业务系统往往会通过自动化应答的方式，来满足用户使用过程中获取数据的需求。现有技术中一般采用关键词识别匹配的方式来实现自动化数据应答处理，具体的，可以包括预先设置关键词识别组合规则以识别并组合提问数据中的关键词，然后，建立提问数据中的一个或多个关键词与应答数据之间的映射关系；接着，基于建立的映射关系匹配用户输入的提问数据中关键词与相应的应答数据；最后，将匹配到的应答数据反馈给用户，以达到为用户提供需求数据的目的。例如，建立的映射关系包括关键词“谢谢”和应答数据“不客气”相对应，相应的，当用户提问数据中包括关键词“谢谢”时，就可以匹配到应答数据“不客气”，将应答数据“不客气”反馈给用户。但是，在实际应用中，中文的同义词很多，且多个关键词组成的句子可以表达不同的意思。因此，现有技术中基于建立的关键词与应答数据之间的映射关系进行关键词识别匹配的方法存在匹配成功率低的问题，需要提供更可靠的方案。
技术实现思路
本说明书实施例的目的是提供一种数据应答处理方法、装置及服务器，可以提高对提问数据的识别成功率，快速准确的为用户提供需求的数据。本说明书实施例是这样实现的：一种数据应答处理方法，包括：获取目标提问数据；基于预设词向量集合确定所述目标提问数据的目标词向量；计算所述目标词向量与预设数量的索引词向量之间的匹配...
数据应答处理方法、装置及服务器

【技术保护点】
一种数据应答处理方法，包括：获取目标提问数据；基于预设词向量集合确定所述目标提问数据的目标词向量；计算所述目标词向量与预设数量的索引词向量之间的匹配度，将与所述目标词向量匹配度最小的索引词向量所对应的应答数据反馈给目标用户。

【技术特征摘要】
1.一种数据应答处理方法，包括：获取目标提问数据；基于预设词向量集合确定所述目标提问数据的目标词向量；计算所述目标词向量与预设数量的索引词向量之间的匹配度，将与所述目标词向量匹配度最小的索引词向量所对应的应答数据反馈给目标用户。2.根据权利要求1所述的方法，其中，所述基于预设词向量集合确定所述目标提问数据的目标词向量包括：对所述目标提问数据进行分词处理，得到多个分词；从所述预设词向量集合中查询所述多个分词的词向量；对查询到的分词的词向量进行加权平均计算，将计算得到的词向量作为所述目标提问数据的目标词向量；其中，所述预设词向量集合包括基于对预设语料数据进行训练得到的表征词语的语义关联度的词向量的集合。3.根据权利要求1所述的方法，其中，所述预设数量的索引词向量包括采用下述方法确定：获取预先建立的知识库中的索引数据，遍历所述预先建立的知识库中的每一索引数据，在遍历每一索引数据时执行下述确定索引数据的索引词向量的步骤：将索引数据进行分词处理，得到所述索引数据的多个分词；从所述预设词向量集合中查询所述多个分词的词向量；对查询到的分词的词向量进行加权平均计算，将计算得到的词向量作为所述索引数据的索引词向量；其中，所述预设词向量集合包括基于对预设语料数据进行训练得到的表征词语的语义关联度的词向量的集合。4.根据权利要求1所述的方法，其中，所述将与所述目标词向量匹配度最小的索引词向量所对应的应答数据反馈给目标用户包括：确定与所述目标词向量匹配度最小的索引词向量；查询预设映射关系表确定所述匹配度最小的索引词向量所对应的应答数据；将所述应答数据反馈给目标用户。5.根据权利要求1所述的方法，其中，所述匹配度至少包括下述之一：欧氏距离、余弦距离、曼哈顿距离。6.一种数据应答处理装置，包括：目标提问数据获取模块，用于获取目标提问数据；目标词向量确定模块，用于基于预设词向量集合确定所述目标提问数据的目标词向量；匹配度计算模块，用于计算所述目标词向量与预设数量的索引词向量之间的匹配度；应答数据反馈模块，用于将与所述目标词向量匹配度最小的索引词向量所对应的应答数据反馈给目标用户。7.根据权利要求6所述的装置，其中，所述目标词向量确定模块包括：分词处理单元，用于对所述目标提问数据进行分词处理，得到多个分词；查询单元，用于从所述预设词向量集合中查询所述多个分词的词向量；计算单元，用于对查询到的分词的词向量进行加权平均计算，将计算得到的词向量作为所述目标提问数据的目标词向量；其中，所述预设词向量集合包括基于对预设语料数据进行训练得到的表征词语的语义关联度的词向量的集合。8.根据权利要求6所述的装置，其中，所述预设数量的索引词向量包括采用下述方法确定：获取预先建立的知识库中的索引数据，遍历所述预先建立的知...

【专利技术属性】
技术研发人员：陈召群，崔恒斌，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人