【技术实现步骤摘要】
一种自然语言转化为结构化查询语言的处理方法及装置
[0001]本专利技术涉及自然语言处理
,具体涉及一种自然语言转化为结构化查询语言的处理方法及装置。
技术介绍
[0002]自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向,自然语言处理在机器翻译、观点提取、文本分类、问题回答、语音识别等方面得到了广泛的应用。
[0003]现有技术中,已经实现将自然语言转换为结构化查询语言(Structured Query Language,简称SQL)语句,当前对自然语言转化为SQL语句的算法研究主要是无值填充的方法,NL2SQL的值填充是一个比较难的问题,而将NL2SQL工业化需要进行值填充,如何实现NL2SQL的值填充是本领域需要解决的重要课题。
技术实现思路
[0004]针对现有技术中的问题,本专利技术实施例提供一种自然语言转化为结构化查询语言的处理方法及装置,能够至少部分地解决现有技术中存在的问题。
[0005]一方面, ...
【技术保护点】
【技术特征摘要】
1.一种自然语言转化为结构化查询语言的处理方法,其特征在于,包括:获取待处理中文语句,并对所述待处理中文语句进行结构化查询语言转化,获得所述待处理中文语句对应的第一结构化查询语句;对所述第一结构化查询语句进行表字段提取,获得所述第一结构化查询语句包括的表字段;根据实体与库表字段名称对应关系表以及所述第一结构化查询语句包括的表字段,构建所述第一结构化查询语句对应的第一实体键值对,所述第一实体键值对包括表字段和实体名;根据所述待处理中文语句以及键值对提取模型,获得所述待处理中文语句对应的第二实体键值对,所述第二实体键值对包括实体对象名称和实体名;其中,所述键值对提取模型是预先训练获得的;根据所述第一结构化查询语句对应的第一实体键值对和所述待处理中文语句对应的第二实体键值对进行实体名映射,获得相匹配的表字段和实体对象名称;根据所述第一结构化查询语句和相匹配的表字段和实体对象名称,获得所述待处理中文语句对应的第二结构化查询语句。2.根据权利要求1所述的方法,其特征在于,所述获取待处理中文语句包括:对原始中文语句进行实体名称提取,获得所述原始中文语句中的实体名称;根据所述原始中文语句中的每个实体名称以及标准化名称库,获得每个实体名称对应的标准化名称;根据每个实体名称对应的标准化名称对所述原始中文语句进行实体名称替换,获得所述待处理中文语句。3.根据权利要求1所述的方法,其特征在于,预先训练所述键值对提取模型的步骤包括:获取命名实体训练数据,所述命名实体训练数据包括各类实体对象名称和每类实体对象名称对应的实体名;根据各类实体对象名称、每类实体对象名称对应的实体名以及键值对初始模型,训练获得所述键值对提取模型。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一结构化查询语句对应的第一实体键值对和所述待处理中文语句对应的第二实体键值对进行实体名映射,获得相匹配的表字段和实体对象名称包括:若判断获知所述第二实体键值对包括的实体名与所述第一实体键值对包括的实体名相同,则确定所述第二实体键值对包括的实体对象名称和所述第一实体键值对包括的表字段匹配。5.根据权利要求1所述的方法,其特征在于,还包括:若判断获知所述第一结构化查询语句对应的第一实体键值对中的两个第一实体键值对包括相同的实体名,则对包括相同实体名的两个第一实体键值对分别添加角色分类。6.根据权利要求1至5任一项所述的方法,其特征在于,还包括:对所述第二结构化查询语句包括的实体对象名称进行名称转换,获得第三结构化查询语句。
7.一种自然语言转化为结构化查询语言的处理装置,其特征在于,包括:获取单元,用于获取待处理中文语句,并对所述待处理中文语句进行结构化查询语言转化,获得所述待处理中文语句对应的第一结构化查询...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:中国人民银行清算总中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。