【技术实现步骤摘要】
基于违法广告案例的广告领域知识图谱构建方法
[0001]本专利技术涉及知识图谱构建
,具体为一种基于违法广告案例的广告领域知识图谱构建方法。
技术介绍
[0002]在人工智能推动下的司法改革当中,以法学知识为中心的认知智能是当前人工智能发展的重要方向;知识图谱是存储知识的数据库,知识图谱是由谷歌公司在2012年正式提出的概念,它的主要目的是在面对互联网高速发展,网络数据爆炸增长的时代,增强搜索效率,完善用户体验。知识图谱凭借其卓越的语义处理技术和互联性,为信息智能应用建立了基础,广泛运用于搜索、问答、情报分析等方面,促进信息技术从信息服务向知识服务发展。近几年,各行各业都在研究将知识图谱应用于专业领域,更好的服务特定领域;
[0003]在现有技术中,目前知识图谱的构建采用人工建立的方式进行,其在实际使用的过程中,未采用自动构建流程的方式,其不能对相似案例进行检索,类案在整理过程中不能进行精准推动,裁判文书需要人工的对其进行制作和核对,导致整体构建的流程繁琐且效率低;鉴于此,我们提出了一种基于违法广告案例的广告领 ...
【技术保护点】
【技术特征摘要】
1.一种基于违法广告案例的广告领域知识图谱构建方法,其特征在于:所述知识图谱构建方法包括以下步骤:S1、广告命名实体获取,对于法律文书的语料,采用BIO序列标注格式,在序列标注中,序列指的是一个句子,元素指的是句子中的一个词,信息提取问题可以转换成序列标注问题,BIO标注格式将每个元素标注为“B
‑
XX”、“I
‑
XX”或者“O”;S2、实体定义;S3、采用Bi
‑
LSTM
‑
CRF模型实现命名实体的抽取,所述实体抽取模型分为词嵌入层、Bi
‑
LSTM特征学习层和CRF实体识别层;S4、提取体系作为法律文书的关系;S5、关系抽取模型的建立;S6、基于GRU和Attention机制实现实体关系抽取。2.根据权利要求1所述的基于违法广告案例的广告领域知识图谱构建方法,其特征在于:所述S2进一步的包括:提取“广告发布者”、“广告内容”、“违法条例”、“宣发平台”、“惩罚类型”、“监管部门”、“广告类型”、“处罚时间”、“违法原因”作为法律文书的实体名称。3.根据权利要求1所述的基于违法广告案例的广告领域知识图谱构建方法,其特征在于:所述B
‑
XX代表此元素在自定义实体中属于X类型,并且位于此元素片段的开头,I
‑
XX表示此元素所在片段属于X类型并且此元素在片段的中间位置,O表示不...
【专利技术属性】
技术研发人员:赵华,曾庆田,张培信,毕丽君,倪维健,张峰,
申请(专利权)人:山东科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。