【技术实现步骤摘要】
一种自然语言处理的算法
本专利技术涉及信息处理
,特别涉及一种自然语言处理的算法。
技术介绍
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学,如何将自然语言有效的与计算机系统结合起来,是目前智能发展的热点话题,目前的自然语言处理在对词句的理解上容易出现偏差,无法准确理解自然语言中的含义,导致输出的结论出现很大的错误。
技术实现思路
本专利技术要解决的技术问题是克服现有技术的缺陷,提供一种自然语言处理的算法,解决目前自然语言处理过程中无法准确理解自然语言中的含义,导致无法正确输出表达文本中的内容的问题。为了解决上述技术问题,本专利技术提供了如下的技术方案:本专利技术一种自然语言处理的算法,包括以下步骤:S1:获取需要处理的自然语言文本;S2:将自然语言文本中的字符串转化为词向量;S3:根据待处理中自然语言文本的词向量,可以查找出 ...
【技术保护点】
1.一种自然语言处理的算法,其特征在于,包括以下步骤:/nS1:获取需要处理的自然语言文本;/nS2:将自然语言文本中的字符串转化为词向量;/nS3:根据待处理中自然语言文本的词向量,可以查找出数据库中具有相同词向量的训练文本;/nS4:对每一个词向量,计算其属于数据库中具有相同词向量的训练文本的哪一类,对每一类训练文本,计算其类的质心,并进行收敛;/nS5:从最接近类别中获得该词向量所代表的含义,并重复S1-S4步骤,直到将待处理的自然语言文本中所有词向量的含义表示出来。/n
【技术特征摘要】
1.一种自然语言处理的算法,其特征在于,包括以下步骤:
S1:获取需要处理的自然语言文本;
S2:将自然语言文本中的字符串转化为词向量;
S3:根据待处理中自然语言文本的词向量,可以查找出数据库中具有相同词向量的训练文本;
S4:对每一个词向量,计算其属于数据库中具有相同词向量的训练文本的哪一类,对每一类训练文本,计算其类的质心,并进行收敛;
S5:从最接近类别中获得该词向量所代表的含义,并重复S1-S4步骤,直到将待处理的自然语言文本中所有词向量的含义表示出来。
2.根据权利要求1所述的一种自然语言处理的算法,其特征在于,所述步骤S4中计算其属于数据库中具有相同词向量的训练文本的哪一类的计算公式为
对于每一类训练文本,计算该类的质心的计算公式为
其中,m...
【专利技术属性】
技术研发人员:孙践知,蔡添,刘瑞军,王向上,
申请(专利权)人:北京工商大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。