一种基于神经网络的自学习语义检测方法及系统技术方案

技术编号：10135658 阅读：178 留言：0更新日期：2014-06-16 15:02

本发明专利技术公开了一种基于神经网络的自学习语义检测方法及系统，所述方法包含：步骤101）导入字典库对待识别的文件名分词，获得文件名中的关键词，基于贝叶斯算法计算每个关键词的概率项；且所述概率项基于对文件名良或不良的判断结果的分析获取；步骤102）获取所有关键词对应的在良语义字符串名中出现的概率之积与良语义字符串名的先验概率的乘积；和所有关键词对应的在不良语义字符串名中出现的概率之积与不良语义字符串名的先验概率的乘积；步骤103）比较上述两个乘积，如果良语义字符串的乘积项大于不良语义字符串的乘积项，则该字符串是良语义的，反之则是不良语义的，将判决结果存入到存储介质中。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于神经网络的自学习语义检测方法及系统，所述方法包含：步骤101）导入字典库对待识别的文件名分词，获得文件名中的关键词，基于贝叶斯算法计算每个关键词的概率项；且所述概率项基于对文件名良或不良的判断结果的分析获取；步骤102）获取所有关键词对应的在良语义字符串名中出现的概率之积与良语义字符串名的先验概率的乘积；和所有关键词对应的在不良语义字符串名中出现的概率之积与不良语义字符串名的先验概率的乘积；步骤103）比较上述两个乘积，如果良语义字符串的乘积项大于不良语义字符串的乘积项，则该字符串是良语义的，反之则是不良语义的，将判决结果存入到存储介质中。【专利说明】—种基于神经网络的自学习语义检测方法及系统
本专利技术属于网络信息处理与分析领域，尤其涉及到文字信息内容性质与倾向性的自动判定领域，具体涉及一种基于神经网络的自学习语义检测方法及系统。
技术介绍
网络信息的自动处理与分析技术是实现网络内容的分析、检测与管理的重要组成部分，对于网络内容处理与安全系统的构建具有重要意义。由于网络技术的不断发展和运营商提供的带宽不断的提高，用户可以很方便的访问下载网络上的各种信息，其中，带宽的提升为信息传递提供了更宽广的舞台的同时，也给不良信息传播提供了新便利。近年来，网络上的淫秽、色情和反动等有害信息传播盛行，传统网络信息处理方案对于这些有害信息的识别往往需要很大的人力和物力，受客观条件的限制，对于网络不良信息的发现与处理远不能满足现实需要。互联网就像由许多河流交汇组成的庞大水系，里面高速地流动着各种各样的内容信息，网络用户通过到河里取...

【技术保护点】
一种基于神经网络的自学习语义检测方法，所述方法包含：步骤101）导入字典库对待识别的文件名分词，获得文件名中的关键词，基于贝叶斯算法计算每个关键词的概率项；且所述概率项基于对文件名良或不良的判断结果的分析获取；步骤102）获取所有关键词对应的在良语义字符串名中出现的概率之积和良语义字符串名的先验概率，并将上述两个参量值相乘得到第一乘积；并获取所有关键词对应的在不良语义字符串名中出现的概率之积和不良语义字符串名的先验概率，并将两个参量相乘得到第二与的乘积；步骤103）比较第一乘积与第二乘积的大小，如果第一乘积项大于第二乘积项，则该字符串是良语义的，反之则是不良语义的，将判决结果存入到存储介质中。

【技术特征摘要】

【专利技术属性】
技术研发人员：苏青，苗光胜，牛温佳，唐晖，慈松，谭红艳，
申请(专利权)人：中国科学院声学研究所，华数传媒网络有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人