使用上下文针对负例的正则表达式生成制造技术

技术编号:30135721 阅读:35 留言:0更新日期:2021-09-23 14:42
公开了用于生成的正则表达式的技术。在一些实施例中,正则表达式生成器可以接收包括一个或多个字符序列的输入数据。正则表达式生成器可以将字符序列转换成正则表达式代码和/或跨度数据结构的集合。正则表达式生成器可以识别由正则表达式代码和/或跨度的集合共享的最长公共子序列,并且可以基于最长公共子序列生成正则表达式。可以使用负例来生成正则表达式。可以确定来自负例的上下文以生成正则表达式。式。式。

【技术实现步骤摘要】
【国外来华专利技术】使用上下文针对负例的正则表达式生成
[0001]相关申请的交叉引用
[0002]本申请是2019年6月11日提交的标题为“USER INTERFACE FOR REGULAR EXPRESSION GENERATION”的美国专利申请No.16/438,327的部分继续申请,该申请依据35 U.S.C.
§
119(e)要求2018年6月13日提交的标题为“AUTOMATED GENERATION OF REGULAR EXPRESSIONS”的美国临时专利申请No.62/684,498的优先权,并且依据35 U.S.C.
§
119(e)要求2018年10月22日提交的标题为“AUTOMATED GENERATION OF REGULAR EXPRESSIONS”的美国临时专利申请No.62/749,001的优先权。本申请还依据35 U.S.C.
§
119(e)要求2019年6月24日提交的标题为“AUTOMATED GENERATION OF REGULAR EXPRESSIONS”的美国临时专利申请No.62/86本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成正则表达式的方法,包括:由包括一个或多个处理器的正则表达式生成器接收包括一个或多个正字符序列的第一选择,所述一个或多个正字符序列中的每一个对应于与由正则表达式生成器生成的正则表达式匹配的正例;由正则表达式生成器生成第一正则表达式,其中第一正则表达式匹配所述正例;由正则表达式生成器接收包括一个或多个负字符序列的第二选择,所述一个或多个负字符序列中的每一个对应于不与由正则表达式生成器生成的正则表达式匹配的负例;响应于接收到第二选择,确定与所述负例对应的所述一个或多个负字符序列的上下文;以及基于所确定的一个或多个负字符序列的上下文更新第一正则表达式。2.根据权利要求1所述的方法,其中接收第一选择包括经由用户界面接收数据集的第一数据单元格中的所述一个或多个正字符序列的选择。3.根据权利要求2所述的方法,还包括由正则表达式生成器自动选择数据集中与包括一个或多个正字符序列的第一选择对应的多个数据单元格中的字符序列。4.根据权利要求3所述的方法,其中接收第二选择包括经由用户界面接收数据集的第二数据单元格中的所述一个或多个负字符序列的选择。5.根据权利要求4所述的方法,还包括由正则表达式生成器自动选择数据集中与包括一个或多个负字符序列的第二选择对应的所述多个数据单元格中的字符序列。6.根据权利要求3的方法,其中第一选择以第一突出显示格式突出显示,并且第二选择以与第一突出显示格式不同的第二突出显示格式突出显示。7.根据权利要求6所述的方法,其中确定与所述负例对应的所述一个或多个负字符序列的上下文包括:识别第二选择的嵌入突出显示位置;根据第二选择的嵌入突出显示位置左侧的数据确定上下文;以及根据突出显示的第二选择的嵌入突出显示位置右侧的数据确定上下文。8.根据权利要求7所述的方法,其中确定与所述负例对应的所述一个或多个负字符序列的上下文还包括:过滤数据集中与包括所述一个或多个负字符序列的第一选择对应的所述多个数据单元格中的字符序列,所述字符序列是基于根据嵌入突出显示位置左侧的数据所确定的上下文并基于根据嵌入突出显示位置右侧的数据所确定的上下文自动选择的;以及从数据集中与所选择的一个或多个负字符序列对应的所述多个数据单元格中的所选择的字符序列中移除过滤的字符序列。9.根据权利要求8所述的方法,其中根据嵌入突出显示位置左侧的数据确定上下文包括识别嵌入突出显示位置左侧的第一跨度;以及其中过滤数据集中与所选择的一个或多个负字符序列对应的所述多个数据单元格中的字符序列还包括识别与所选择的一个或多个负字符序列对应的所述多个数据单元格中的字符序列中不匹配嵌入突出显示位置左侧的第一跨度的跨度。10.根据权利要求9所述的方法,其中根据嵌入突出显示位置左侧的数据确定上下文还包括识别嵌入突出显示左侧的第二跨度;以及
其中过滤数据集中与所选择的一个或多个负字符序列对应的所述多个数据单元格中的字符序列还包括识别与所选择的一个或多个负字符序列对应的所述多个数据单元格中的字符序列中不匹配嵌入突出显示位置左侧的第二跨度的跨度。11.根据权利要求7所述的方法,其中根据嵌入突出显示位置右侧的数据确定上下文包括识别嵌入突出显示位置右侧的第一跨度;以及其中过滤数据集中与包括一个或多个负字符序列的第二选择对应的所述多个数据单元格中的字符序列还包括识别与包括一个或多个负字符序列的第二选择对应的所述多个数据单元格中的字符序列中不匹配嵌入突出显示位置右侧的第一跨度的跨度。12.一种正则表达式生成器服务器计算机,包括:处理器;存储器;耦合到所述处理器的计算机可读介质,所述计算机可读介质存储可由...

【专利技术属性】
技术研发人员:M
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1