规则库生成方法及装置制造方法及图纸

技术编号:27315121 阅读:62 留言:0更新日期:2021-02-10 09:45
公开了一种规则库生成方法及装置。该方法包括:接收请求文本;根据预设的相似度算法从请求文本库中查找与所述请求文本相似的多个历史请求文本;分别删除所述请求本文和所述多个历史请求文本中的停用词,生成多个参考请求文本;根据预设的训练模型对所述多个参考请求文本中的每一个参考请求文本进行训练,生成备选规则;确定所述备选规则的宽松度是否符合预设标准;如果所述备选规则的宽松度符合预设标准,则将所述备选规则添加至规则库中。则将所述备选规则添加至规则库中。则将所述备选规则添加至规则库中。

【技术实现步骤摘要】
规则库生成方法及装置


[0001]本申请涉及通信
,尤其涉及一种规则库生成方法及装置。

技术介绍

[0002]在目前的人机对话应用中(比如,智能机器人)存在大量的规则系统。因为规则系统有很高的准确率,召回率比较低的特点,所以现有人机对话系统需要大量依赖于规则系统,而规则系统需要基于建立规则库来实现。目前,规则库中的规则都是由人工编写,非常不自动化,而且人工编写非常容易出错,也容易造成规则之间的冲突,且维护起来十分复杂,会消耗大量的人力物力。

技术实现思路

[0003]为解决上述问题,本专利技术提供一种规则库生成方法及装置,可自动生成包含大量高精度规则的规则库,从而节省人力、物力。
[0004]为了实现上述目的,在第一方面,本专利技术实施例提供了一种规则生成方法,该方法包括:
[0005]接收请求文本;
[0006]根据预设的相似度算法从请求文本库中查找与所述请求文本相似的多个历史请求文本;
[0007]分别删除所述请求本文和所述多个历史请求文本中的停用词,生成多个参考请求文本;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种规则库生成方法,其特征在于,所述方法包括:接收请求文本;根据预设的相似度算法从请求文本库中查找与所述请求文本相似的多个历史请求文本;分别删除所述请求本文和所述多个历史请求文本中的停用词,生成多个参考请求文本;根据预设的训练模型对所述多个参考请求文本中的每一个参考请求文本进行训练,生成备选规则;确定所述备选规则的宽松度是否符合预设标准;如果所述备选规则的宽松度符合预设标准,则将所述备选规则添加至规则库中。2.根据权利要求1所述的方法,其特征在于,所述确定所述备选规则的宽松度是否符合预设标准,包括:将所述备选规则与垃圾请求文本集合中的垃圾请求文本进行匹配;如果匹配的垃圾请求文本数量大于第一预设数量,则确定所述备选规则的宽松度不符合预设标准;如果匹配的垃圾请求文本数量不大于第一预设数量,则确定所述备选规则的宽松度符合预设标准。3.根据权利要求1所述的方法,其特征在于,所述确定所述备选规则的宽松度是否符合预设标准,包括:将所述备选规则与多个不同领域的正常请求文本集合中的正常请求文本进行匹配;如果匹配的领域数量大于第二预设数量,则确定所述备选规则的宽松度不符合预设标准;如果匹配的领域数量不大于第二预设数量,则确定所述备选规则的宽松度符合预设标准。4.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:如果所述备选规则的宽松度不符合预设标准,则将所述备选规则丢弃。5.根据权利要求1-3任一所述的方法,其特征在于,所述预设的训练模型包括:CRF模型、BERT模型或SVM模型。6.一种规则库生成装置,其特征在于,所述装置包括:接收单元,用于接收请求文本;查找单元,用于根据预设的相似度算法从请求文本库中查找与所述请求文本相似的多个历史请求文本;删除单元,用于分别...

【专利技术属性】
技术研发人员:孟振南雷欣李志飞
申请(专利权)人:北京羽扇智信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1