基于多维度报警信息文本相似度分析的推荐方法技术

技术编号:24169015 阅读:47 留言:0更新日期:2020-05-16 02:20
本发明专利技术公开了一种基于多维度报警信息文本相似度分析的推荐方法,包括:非结构化公安文本是案情中涉及的报警信息文本,采用NLP技术对其格式进行预处理,输出为结构化公安文本格式;场景相关的多重深层语义相似度分析网络获取公安文本,输出为该文本不同级别的语义嵌入向量;基于多维度文本语义相似度的文本分析网络获取公安文本和不同级别的语义嵌入向量,输出为可抽取的多种实体特征;结合用户特征的报警信息文本推荐系统获取公安文本不同级别的语义嵌入向量和被抽取出的多种实体特征,输出为不同报警信息文本之间的相似度及相似报警信息推荐;相似文本推荐获取算法模型自动筛选生成综合的推荐列表,完成智能推送。

【技术实现步骤摘要】
基于多维度报警信息文本相似度分析的推荐方法
本专利技术属于公安专用场景下的人工智能
,具体涉及一种基于多维度报警信息文本相似度分析的推荐方法。
技术介绍
现阶段我国的报警信息推荐系统分为两种,一种是基于用户的推荐,根据某用户的特性推荐相关信息;另一种是根据文本内容推荐,推荐与文本信息相似的内容,本申请采用的报警信息文本推荐主要是第二种,通常是基于报警信息文本相似度的推荐,文本相似度计算的发展可大体分为三个阶段:从最开始的字面匹配近似,到第二阶段的词汇匹配相似,再到第三阶段的语义相似。一种常见的处理方式是:首先将文本数字化,并且数字化后还能保持文本的基本信息,即将文本向量化,可以使用文本分词得到的标记向量化,也可以使用TF-IDF方法,后者可以保留词在文档中的权重信息,即相当于保留了文本信息,其次,当文本获得向量化表达之后,就可以表述成向量空间的一个点,然后通过计算两个向量之间的相似度,即可表示原来文本之间的相似度。常用的向量相似度计算方法可以使用欧几里得距离、曼哈顿距离、切比雪夫距离、余弦相似度距离和海明距离等。最后,当获得文本之本文档来自技高网...

【技术保护点】
1.一种基于多维度报警信息文本相似度分析的推荐方法,其特征在于,包括如下步骤:/nS1非结构化公安文本是案情中涉及的报警信息文本;/n采用NLP技术将非结构化公安文本进行格式预处理,融合多粒度深层次文本语义和公安领域知识的文本嵌入向量后输出给场景相关的深层语义相似度分析网络;/nS2结构化公安文本是根据公安文本数据库提取的报警信息;/n运用已经构建的统一数据视图的数据库系统,执行相应操作自动提取相对应的数据,融合多粒度深层次文本语义和公安领域知识的文本嵌入向量后输出给场景相关的深层语义相似度分析网络;/nS3场景相关的深层语义相似度分析网络获取结构化报警信息文本;/n采用 BiLSTM+CRF...

【技术特征摘要】
1.一种基于多维度报警信息文本相似度分析的推荐方法,其特征在于,包括如下步骤:
S1非结构化公安文本是案情中涉及的报警信息文本;
采用NLP技术将非结构化公安文本进行格式预处理,融合多粒度深层次文本语义和公安领域知识的文本嵌入向量后输出给场景相关的深层语义相似度分析网络;
S2结构化公安文本是根据公安文本数据库提取的报警信息;
运用已经构建的统一数据视图的数据库系统,执行相应操作自动提取相对应的数据,融合多粒度深层次文本语义和公安领域知识的文本嵌入向量后输出给场景相关的深层语义相似度分析网络;
S3场景相关的深层语义相似度分析网络获取结构化报警信息文本;
采用BiLSTM+CRF模型转化报警信息文本成准确的公安文本信息,综合理解多粒度文本信息,分析并甄别刑事侦查细分的关注点、语义相似性数据集,输出为不同级别的语义嵌入向量;
S4基于多维度文本语义相似度的文本分析网络获取准确的公安文本和不同级别的语义嵌入向量,融入文本的多重深层语义特征,抽取得到实体链接信息归属和作案手法识别的实体特征;
S5结合用户特征的报警信息文本推荐系统获取公安文本不同级别的语义嵌入向量和被抽取出的多种实体特征,结合多维信息网络合理分配各维度权重的报警信息文本进行相似度分析,生成合理且全面兼顾广度和深度的报警信息文本的相似推荐;
S6相似文本推荐获取公安报警信息文本和用户特征结合公安领域知识,运用海量警报数据库和算法模型自动筛选生成综合的推荐列表,完成智能推送,极大的节省了出警前的甄别时间。


2.根据权利要求1所述基于多维度报警信息文本相似度分析的推荐方法,其特征在于,
S1所述非结构...

【专利技术属性】
技术研发人员:朱沐尧王全修杨培文吴培辛
申请(专利权)人:北京睿企信息科技有限公司日照睿安信息科技有限公司南京清月智能科技研发有限公司上海清月人工智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1