一种文字语义分析方法、文字语义分析终端及存储介质技术

技术编号:17304442 阅读:79 留言:0更新日期:2018-02-18 22:28
本发明专利技术提供了一种文字语义分析方法、文字语义分析终端及存储介质,通过接收用户输入的文字信息,将所述文字信息中包含的字符串分隔成独立的单词,得到单词序列;对分隔出的单词序列进行语法分析,判断所述单词序列中是否存在语法错误;将单词序列中含有的单词转化成相对应的元数据,计算各个元数据之间的语义相似度和特征项权重,并提取所述单词序列的关键词特征项,得到各个单词所对应的语义标记文本,建立文本数据库,按照单词序列中各个单词的排列顺序,依次从文本数据库中匹配出语义标记文本,并将排序后合成的文本信息输出显示。本发明专利技术通过元数据的格式反馈给用户,从而方便用户获取语义分析终端反馈过来的信息,正确理解和使用信息。

A word semantic analysis method, a word semantic analysis terminal and a storage medium

The present invention provides a method of text semantic analysis, semantic analysis and text terminal storage medium by receiving user input text information, the string containing the text information is divided into individual words, get the word sequence; word sequence of divided into syntax analysis, to determine whether there is a syntax error in the in the sequence of words; containing the words in the word sequence into the corresponding metadata, calculating various metadata similarity and feature weight, and extract the keywords feature the word sequence, get text corresponding to each word semantic markup, a text database, according to the sequence of words in the sequence of words in turn, to match the semantic markup text from a text database, and sorted text information output display. The invention is fed back to the user through the format of metadata, so that users can get information from the feedback from the semantic analysis terminal and correctly understand and use the information.

【技术实现步骤摘要】
一种文字语义分析方法、文字语义分析终端及存储介质
本专利技术涉及语义分析
,尤其涉及一种文字语义分析方法、文字语义分析终端及存储介质。
技术介绍
目前人机之间的交互方式还是采用文字对话方式,信息采集和过滤达不到预期想要的目的,无法准确识别出当前用户所说出话的含义,比如说“后海可以吗?”,但机器却可以理解为“后海不在家”这样的意思,而我们用户的意思是说“我们去后海那边吃饭可以吗?”,虽然采用的都是文字类型的会话,但人类所表达的意义可以是千变万化的,这种文字会话的语义分析方法存在以下诸多不便:首先,一般情况下,用户所表达的含义富含人类独特的情感在里面,如果采用这种简单的文字会话语义分析方法,机器是没法做到识别出用户真正想表达的意思;其实,即使机器可能识别出了用户的大部分意思,但是通过机器一转述,可能表达的意思又不一样;第三,如果人机之间的会话都是这种简单的文字会话,没有对数据进行加密、抽样分析、输出加密,则信息的安全性得不到保障,很容易别有心思的人或黑客破解获取,不利于数据信息的传递。因此,现有技术需要进一步的改进。
技术实现思路
针对上述技术问题,本专利技术实施例提供了一种文字语义分本文档来自技高网...
一种文字语义分析方法、文字语义分析终端及存储介质

【技术保护点】
一种文字语义分析方法,其特征在于,包括以下步骤:接收用户输入的文字信息,并对输入的所述文字信息进行词法分析,将所述文字信息中包含的字符串分隔成独立的单词,得到单词序列;对分隔出的单词序列进行语法分析,判断所述单词序列中是否存在语法错误,并将存在语法错误的单词或相邻单词组成的词组过滤掉;将单词序列中含有的单词转化成相对应的元数据,计算各个元数据之间的语义相似度和特征项权重,并根据计算出的语义相似度和特征项权重提取所述单词序列的关键词特征项,并根据所述关键词特征项得到各个单词所对应的语义标记文本,并将所述语义标记文本存储在文本数据库;按照单词序列中各个单词的排列顺序,依次从所述文本数据库中匹配出对...

【技术特征摘要】
1.一种文字语义分析方法,其特征在于,包括以下步骤:接收用户输入的文字信息,并对输入的所述文字信息进行词法分析,将所述文字信息中包含的字符串分隔成独立的单词,得到单词序列;对分隔出的单词序列进行语法分析,判断所述单词序列中是否存在语法错误,并将存在语法错误的单词或相邻单词组成的词组过滤掉;将单词序列中含有的单词转化成相对应的元数据,计算各个元数据之间的语义相似度和特征项权重,并根据计算出的语义相似度和特征项权重提取所述单词序列的关键词特征项,并根据所述关键词特征项得到各个单词所对应的语义标记文本,并将所述语义标记文本存储在文本数据库;按照单词序列中各个单词的排列顺序,依次从所述文本数据库中匹配出对应的语义标记文本,并将排序后合成的文本信息输出显示。2.根据权利要求1所述的文字语义分析方法,其特征在于,所述用户输入的文字信息包括:用户的身份信息和用户输入的问题信息;所述用户的身份信息包括:用户ID信息字节、用户姓名字节、手机号码字节。3.根据权利要求2所述的文字语义分析方法,其特征在于,所述将所述文字信息中包含的字符串分隔成独立的单词的步骤包括:使用空格作为分隔符,将所述文字信息中包含的字符串分隔成独立的单词,并为每个单词设置唯一对应的编号标识和下一个元数据的指向标识。4.根据权利要求3所述的文字语义分析方法,其特征在于,所述接收用户输入的文字信息之前,还包括步骤:创建用于存储元数据的元数据库,并且建立单词目录与元数据库中所含元数据之间的关联关系;在所述将单词序列中含有的单词转化成相对应的元数据的步骤中,通过所述关联关系,查找出所述单词所对应的元数据。5.根据权利要求4所述的文字语义分析方法,其特征在于,所述计算各个元数据之间的语义相似度和特征项权重,并根据计算出的语义相似度和特征项权重提取所述单词序列的关键词特征项的步骤包括:采用基于语料库的词语相似度分析法和基于词语向量空间模型,计算各个元数据之间的语义相似度和特征项权重。6.一种文字语义分析终端,其特征...

【专利技术属性】
技术研发人员:胡明灯
申请(专利权)人:深圳市前海众兴电子商务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1