一种基于大语言模型的智能警情打标方法、装置及介质制造方法及图纸

技术编号：40036353 阅读：3 留言：0更新日期：2024-01-16 19:02

本发明专利技术涉及一种基于大语言模型的智能警情打标方法、装置及介质，其中方法包括以下步骤：获取警情反馈文本；构建层次分类模型，以警情反馈文本作为输入，输出多层次警情标签结果；将多层次警情标签和警情反馈文本与警情常识规则库进行碰撞比对，如果比对成功，则返回所有命中的规则，并构建映射字典获取多层次警情标签结果的关联标签，组成备选标签，将警情反馈文本、命中规则和备选标签输入大语言模型，对模型的输出进行后处理得到警情标签预测结果，存入警情打标结果表；如果比对失败，则将多层次警情标签结果作为最终打标结果，存入警情打标结果表。与现有技术相比，本发明专利技术具有预测精度高、打标效率高等优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文本处理，尤其是涉及一种基于大语言模型的智能警情打标方法、装置及介质。

技术介绍

1、在公安情报指挥中心部门，每天都会产生大量的公安警情，这些警情需要进行分类和标注，以便更好地进行信息管理和资源调配。具体而言，基于警情标签分析最典型的三大应用包括：基础统计、风险预警和高发警情及部位洞察。

2、(1)基础统计：比如“纠纷”标签警情总量/同比/环比分析等；

3、(2)风险预警：比如“刑事案件”标签警情可能转为命案(民-刑-命)，需要及时预防化解；

4、(3)高发警情及部位洞察：如果某地区“纠纷”警情过多，就需要下发任务，

5、指导勤务。

6、目前在大部分的公安系统中，这项任务通常由工作人员进行人工打标，即根据警情的最终反馈内容进行分类和标签的分配。然而，随着警情数量的增加和信息处理的需求不断提高，人工打标的方式面临一些挑战和限制，包括：主观性和主观误差、人为错误和不一致性、工作负担和效率低下、专业知识限制等。因此，引入自动打标的方法和技术变得必要。

7、cn2023112457163提出了一种智能警情打标方法、装置及存储介质，但在该方法的自动打标过程中又遇到了一个新的问题：在进行警情打标时，一些民警熟知的警情规则，但模型却不知道，最终导致打标错误。

8、近年来，人工智能技术以其卓越的表现和应用潜力，在各个领域引起了广泛的关注和应用。在这股浪潮中，基于大型预训练语言模型的技术方案，如openai所推出的gpt系列模型，成为了人工智能领域的

技术实现思路

1、本专利技术的目的是为了提供一种基于大语言模型的智能警情打标方法、装置及介质，将警情规则输入给大模型，并给出备选标签，利用大模型的推理能力给出预测标签，从而减少了将警情规则下发给具体警务人员的流程，减少人工理解成本，提高了整体打标效率和精度。

2、本专利技术的目的可以通过以下技术方案来实现：

3、一种基于大语言模型的智能警情打标方法，包括以下步骤：

4、s1、获取警情反馈文本；

5、s2、基于分类的智能打标：构建层次分类模型，以警情反馈文本作为输入，输出多层次警情标签结果；

6、s3、将s2预测得到的警情标签和警情反馈文本与警情常识规则库进行碰撞比对，如果比对成功，则返回所有命中的规则，并执行步骤s5；如果比对失败，则执行步骤s4；

7、s4、将多层次警情标签结果作为最终打标结果，存入警情打标结果表；

8、s5、构建映射字典获取多层次警情标签结果的关联标签，结合多层次警情标签组成备选标签，将警情反馈文本、命中规则和备选标签输入大语言模型，对模型的输出进行后处理得到最终的警情标签预测结果，存入警情打标结果表。

9、所述将s2预测得到的警情标签和警情反馈文本与警情常识规则库进行碰撞比对具体为：将多层次警情标签和警情反馈文本作为查询，在警情常识规则库中进行检索，若输入的查询与警情常识规则库中规则的匹配度大于预设匹配度阈值，则表明命中规则，比对成功；反之则未命中规则，比对失败。

10、所述构建映射字典获取多层次警情标签结果的关联标签具体为：

11、基于手动方法和自动方法分别构建映射字典，根据多层次警情标签结果与两种方法构建的映射字典的匹配结果，获取关联标签。

12、所述手动方法为基于警情规则手动整理存在规则关联性的相关标签，构建映射字典。

13、所述自动方法为通过多层次警情标签预测结果与真实标签的对比，总结不同警情标签被预测为其他错误标签的频次，对每一标签的预测错误标签按照频次从高到低排序，并基于排名前n的错误标签构建映射字典，其中，n为预设的标签个数。

14、所述大语言模型采用chatglm-6b。

15、所述后处理方法为：将模型返回的结果和所有备选标签进行字符匹配，映射到最相似的一个标签，作为最终的警情标签预测结果。

16、一种基于大语言模型的智能警情打标装置，包括：

17、文本获取模块，用于获取警情反馈文本；

18、基于分类的智能打标模块，用于构建层次分类模型，以警情反馈文本作为输入，输出多层次警情标签结果；

19、碰撞比对模块，用于将基于分类的智能打标模块预测得到的警情标签和警情反馈文本与警情常识规则库进行碰撞比对，如果比对成功，则返回所有命中的规则，并调用基于大模型的打标模块输出警情标签预测结果；如果比对失败，则直接将基于分类的智能打标模块预测得到的多层次警情标签结果作为最终打标结果，存入警情打标结果表；

20、基于大模型的打标模块，用于构建映射字典获取多层次警情标签结果的关联标签，结合多层次警情标签组成备选标签，将警情反馈文本、命中规则和备选标签输入大语言模型，输出最终的警情标签预测结果，存入警情打标结果表。

21、一种基于大语言模型的智能警情打标装置，包括存储器、处理器，以及存储于所述存储器中的程序，所述处理器执行所述程序时实现如上述所述的方法。

22、一种存储介质，其上存储有程序，所述程序被执行时实现如上述所述的方法。

23、与现有技术相比，本专利技术具有以下有益效果：

24、(1)本专利技术在公安警情领域实现了自动打标，可以辅助人工进行警情打标工作，相比纯手工打标提升了效率。

25、(2)本专利技术使用了分类和大模型预测两种方案进行打标，根据警情常识规则，对于未命中规则的警情直接使用分类的方法，实现打标；对于命中规则的警情使用基于大模型的链路，让警情规则来辅助机器实现更精准的打标，从而提高打标精度。

26、(3)本专利技术通过输入警情常识规则库给大模型进行判断，可以自动给出打标结果，即使是非专业人员也能得到准确的打标结果，进一步释放了人力，提高了打标效率。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的智能警情打标方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述将S2预测得到的警情标签和警情反馈文本与警情常识规则库进行碰撞比对具体为：将多层次警情标签和警情反馈文本作为查询，在警情常识规则库中进行检索，若输入的查询与警情常识规则库中规则的匹配度大于预设匹配度阈值，则表明命中规则，比对成功；反之则未命中规则，比对失败。

3.根据权利要求1所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述构建映射字典获取多层次警情标签结果的关联标签具体为：

4.根据权利要求3所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述手动方法为基于警情规则手动整理存在规则关联性的相关标签，构建映射字典。

5.根据权利要求3所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述自动方法为通过多层次警情标签预测结果与真实标签的对比，总结不同警情标签被预测为其他错误标签的频次，对每一标签的预测错误标签按照频次从高到低排序，并基于排名前N的错误标签构建映射字

6.根据权利要求1所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述大语言模型采用ChatGLM-6B。

7.根据权利要求1所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述后处理方法为：将模型返回的结果和所有备选标签进行字符匹配，映射到最相似的一个标签，作为最终的警情标签预测结果。

8.一种基于大语言模型的智能警情打标装置，其特征在于，包括：

9.一种基于大语言模型的智能警情打标装置，包括存储器、处理器，以及存储于所述存储器中的程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一所述的方法。

10.一种存储介质，其上存储有程序，其特征在于，所述程序被执行时实现如权利要求1-7中任一所述的方法。

...

【技术特征摘要】

1.一种基于大语言模型的智能警情打标方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述将s2预测得到的警情标签和警情反馈文本与警情常识规则库进行碰撞比对具体为：将多层次警情标签和警情反馈文本作为查询，在警情常识规则库中进行检索，若输入的查询与警情常识规则库中规则的匹配度大于预设匹配度阈值，则表明命中规则，比对成功；反之则未命中规则，比对失败。

3.根据权利要求1所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述构建映射字典获取多层次警情标签结果的关联标签具体为：

5.根据权利要求3所述的一种基于大语言模型的智能警情打标方法，其特征在于，所述自动方法为通过多层次警情标签预测结果与真实标签...

【专利技术属性】
技术研发人员：李坤，黄泰峰，邵研，段曼妮，郑高山，王佳玮，金雄男，王永恒，李博康，王智，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人