【技术实现步骤摘要】
一种基于知识图谱的语义识别系统
[0001]本专利技术属于语义识别领域,涉及识别技术,具体是一种基于知识图谱的语义识别系统。
技术介绍
[0002]语言所蕴含的意义就是语义。简单地说,符号是语言的载体。符号本身没有任何意义,只有被赋予含义的符号才能够被使用,这时候语言就转化为了信息,而语言的含义就是语义。语义可以简单地看作是数据所对应的现实世界中的事物所代表的概念的含义,以及这些含义之间的关系,是数据在某个领域上的解释和逻辑表示。
[0003]现有技术中,对于语句含义需要解释时,将语句输入框后即可直接的到相应的语音,没有对语句进行初步筛选和过滤,同时,语句检索语义常常会出现众多解释和链接,导致查询人员无法知晓语句的正确语义,为此,我们提出一种基于知识图谱的语义识别系统。
技术实现思路
[0004]针对现有技术存在的不足,本专利技术目的是提供一种基于知识图谱的语义识别系统。
[0005]本专利技术所要解决的技术问题为:
[0006]如何对语句进行初步筛选并识别得到正确语句的语义。 >[0007]本专利本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱的语义识别系统,其特征在于,包括数据采集模块、敏感字库、数据初筛模块、特征提取模块、映射识别模块、数据库、数据更新模块、用户终端以及服务器,所述服务器连接有数据库和敏感字库,所述数据库与映射识别模块数据连接,所述敏感字库与数据初筛模块数据连接,数据库和敏感字库是基于知识图谱进行构建的,敏感字库中存储有若干个敏感字,数据库存储有若干个预设语句的语句词义以及对应的识别码;所述用户终端用于使用人员输入待译语句,并将待译语句发送至服务器;所述数据采集模块用于采集待译语句的语句信息,并将待译语句的语句信息发送至服务器,所述服务器将待译语句的语句信息发送至数据初筛模块,所述数据初筛模块用于对待译语句进行初步筛选,工作得到初筛通过信号或初筛不通过信号反馈至服务器,若服务器接收到初筛通过信号,则将对应待译语句的语句信息发送至特征提取模块;若服务器接收到初筛不通过信号,则将对应待译语句进行剔除并反馈至重新输入信号至用户终端;所述服务器将初筛通过的待译语句的语句信息发送至特征提取模块,所述特征提取模块用于对初筛通过待译语句进行特征提取,依据待译语句中每个字符的笔画数,并按照字符的输入顺序建立待译语句的特征码并反馈至服务器,所述服务器将待译语句的特征码发送至映射识别模块,映射识别模块结合特征码将待译语句进行映射识别,工作得到语句语义或语义浏览页将发送至服务器,所述服务器将待译语句的语句语义或语义浏览页反馈至相应的用户终端。2.根据权利要求1所述的一种基于知识图谱的语义识别系统,其特征在于,语句信息包括待译语句的字符数以及每个字符的笔画数。3.根据权利要求2所述的一种基于知识图谱的语义识别系统,其特征在于,所述数据初筛模块用于对待译语句进行初步筛选,工作过程具体如下:步骤一:将待译语句标记为u,u=1,2,
……
,z,z为正整数;步骤二:获取待译语句中的每个字符,统计待译语句中每个字符的笔画数,并将笔画数标记为BHui,i=1,2,
……
,x,x为正整数;步骤三:获取敏感库中的敏感字,统计敏感字的笔画数得到敏感笔画BHo,o=1,2,
……
,v,v为正整数,o代表敏感库中敏感字的编号;步骤四:若BHui=BHo,则将敏感字设定为字符对应的待定敏感字;若BHui≠BHo,则不进行任何操作;步骤五:将待译语句中每个字符与对应的待定敏感字进行形体比对;步骤六:若待译语句中每个字符均不为敏感字,则生成初筛通过信号;若待译语句中任意字符为敏感字,则生成初筛不通过信号;所述数据初筛模块将初筛通过信号或初筛不通过信号反馈至服务器,若服务器接收到初筛通过信号,则将对应待译语句的语句信息发...
【专利技术属性】
技术研发人员:梁斌,秦谦,
申请(专利权)人:江苏名通信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。