使用自然语言输入生成查询制造技术

技术编号:31902095 阅读:46 留言:0更新日期:2022-01-15 12:38
本文描述了用于基于自然语言输入生成符合数据库模式的搜索查询的方法和系统。可以从计算设备接收自然语言输入。自然语言输入可以与对数据库的多个搜索请求相关联。可以将自然语言输入解析成多个段。多个段可以是例如文本串的一个或多个单词。多个段的至少一个标识符可以与一个或多个置信度值相关联。可以基于置信度值和/或基于一组规则将自然语言输入转换为单个搜索查询。可以针对数据库发起单个搜索查询。单个搜索查询可以比多个搜索请求更有效地获取内容。地获取内容。地获取内容。

【技术实现步骤摘要】
【国外来华专利技术】使用自然语言输入生成查询
[0001]相关申请的交叉引用
[0002]本申请要求于2019年7月24日提交的且题为“使用自然语言输入生成查询(Query Generation Using Natural Language Input)”的美国非临时申请第16/520,512号的优先权,其全部内容通过引用明确地并入本文。


[0003]本文描述的各方面总体上涉及计算机数据库、搜索查询、语言处理以及与其相关的硬件和软件。更具体地,本文描述的一个或多个方面提供了对计算机数据库的搜索查询的改进处理。

技术介绍

[0004]数据库用于各种商业和个人目的。随着存储变得更便宜和更容易获得,用户越来越多地以更复杂的方式存储更多的数据,这使得存储和检索这些数据的方法越来越重要。例如,许多公司现在为在远程数据库(通常称为云存储)的网络上存储内容的权利付费,因为这样的服务通常显着地更实惠和更具可扩展性。

技术实现思路

[0005]下文呈现本文描述的各个方面的简化概述。本概述不是广泛的概述,并且不旨在标识所需的或关键的元素或者描绘权利要求本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:由计算设备从客户端设备接收自然语言输入,其中所述自然语言输入包括文本串;由所述计算设备将所述文本串解析成多个段;由所述计算设备确定所述多个段的至少一个标识符,其中所述至少一个标识符与一个或多个置信度值相关联;响应于确定所述置信度值的至少一个子集等于或大于阈值,并且基于一组规则,由所述计算设备将所述自然语言输入转换为单个搜索查询;以及由所述计算设备并且响应于转换而发起所述单个搜索查询以从数据库获取内容,从而防止所述客户端设备响应于所述自然语言输入而传输多个搜索请求。2.根据权利要求1所述的方法,还包括:基于确定所述一个或多个置信度值中的第一置信度值满足第二阈值,丢弃所述多个段中的一个或多个。3.根据权利要求1所述的方法,还包括:由所述计算设备确定所述一个或多个置信度值。4.根据权利要求1所述的方法,其中将所述自然语言输入转换为所述单个搜索查询还基于,基于所述一组规则确定所述多个段中的一个或多个对应于搜索操作。5.根据权利要求1所述的方法,还包括:从所述文本串并基于停顿词列表移除一个或多个单词。6.根据权利要求1所述的方法,还包括:基于检测到所述数据库的变化而更新所述一组规则。7.根据权利要求1所述的方法,其中所述多个段的第一段与一个或多个属性相关联。8.根据权利要求1所述的方法,其中所述一个或多个置信度值对应于所述多个段中的两个或更多个,并且其中确定所述置信度值的至少所述子集等于或大于所述阈值是基于将所述一个或多个置信度值的组合值与所述阈值进行比较。9.一种装置,包括:一个或多个处理器;以及存储器,其存储指令,所述指令在由所述一个或多个处理器执行时使所述装置:从客户端设备接收自然语言输入,其中所述自然语言输入包括文本串;将所述文本串解析成多个段;确定所述多个段的至少一个标识符,其中所述至少一个标识符与一个或多个置信度值相关联;响应于确定所述置信度值的至少一个子集等于或大于阈值,并且基于一组规则,将所述自然语言输入转换为单个搜索查询;以及响应于转换而发起所述单个搜索查询以从数据库获取内容,从而防止所述客户端设备响应于所述自然语言输入而传输多个搜索请求。10.根据权利要求9所述的装置,其中所述指令在由所述一个或多个处理器执行时还使...

【专利技术属性】
技术研发人员:希夫
申请(专利权)人:思杰系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1