多系统相结合的自然语言处理方法及装置制造方法及图纸

技术编号:19635005 阅读:31 留言:0更新日期:2018-12-01 15:44
本发明专利技术提出一种多系统相结合的自然语言处理方法,所述方法包括:提取接收的文本信息中的特征词;根据所述特征词与预存的关键词的匹配程度计算所述文本信息在依据所述关键词而进行分类的各组别中第一权重值;从多个第三方系统分别获取对应于所述文本信息的检索结果,并依据各检索结果、各组别在自身所从属的第三方系统中的第二权重值以及各组别对应的第一权重值分别计算各检索结果的评分,取评分最高的检索结果为所述文本信息对应的输出结果。本发明专利技术能够将多种单一自然语言处理系统结合使用,由多个系统投票产生最终答案,从而使系统返回的结果更精准,解决了现有的自然语言处理系统存在的结果单一、知识面不足、问题与答案匹配度太低的问题。

Natural Language Processing Method and Device Based on Multi-system Combination

The invention provides a multi-system combined natural language processing method, which includes: extracting feature words from received text information; calculating the first weight value of the text information in each group classified according to the matching degree between the feature words and the existing keywords; and extracting the first weight value from multiple groups according to the keywords. The third-party system obtains the retrieval results corresponding to the text information respectively, and calculates the score of each retrieval result according to the retrieval results, the second weight value of each group in the third-party system to which each group belongs and the first weight value corresponding to each group. The retrieval result with the highest score is taken as the text information pair. The corresponding output results. The invention can combine multiple single natural language processing systems to produce final answers by voting of multiple systems, thus making the results returned by the system more accurate, and solving the problems of single results, insufficient knowledge and low matching degree between questions and answers existing in the existing natural language processing systems.

【技术实现步骤摘要】
多系统相结合的自然语言处理方法及装置
本专利技术涉及保险金融领域,尤其涉及多系统相结合的自然语言处理方法及装置。
技术介绍
现有的人机对话解决方案,通常按照分词、替换、匹配等步骤实现结果返回,如科大讯飞、图灵机器人等自然语言处理系统,通常的实现方式是提前维护词条知识库,查询阶段先对问题进行同义词、停用词等替换,再对文本进行分词和匹配,最终返回数据库中匹配度最高的一个词条。对于部分系统,还能从与用户问答过程中,学习新的词语、句式,并更新在知识库中。这种方式实现的人机对话,机器人只能从已有知识库中匹配结果,回答质量很大程度上取决于知识库数量,而且非常容易出现回答与问题不符合的情况。因此,现有的技术方案中,处理结果单一、知识面不足、问题与答案匹配度太低,处理结果不够精准。
技术实现思路
本专利技术提供一种多系统相结合的自然语言处理方法及相应的装置、计算机设备及可读存储介质,其主要目的在于通过将多种单一自然语言处理系统结合使用,由多个系统投票产生最终输出结果,从而使系统返回的结果越来越准确。本专利技术还提供一种用于执行本专利技术的多系统相结合的自然语言处理方法的计算机设备及可读存储介质。为解决上本文档来自技高网...

【技术保护点】
1.多系统相结合的自然语言处理方法,其特征在于,所述方法包括:提取接收的文本信息中的特征词;根据所述特征词与预存的关键词的匹配程度计算所述文本信息在依据所述关键词而进行分类的各组别中第一权重值;从多个第三方系统分别获取对应于所述文本信息的检索结果,并依据各检索结果、各组别在自身所从属的第三方系统中的第二权重值以及各组别对应的第一权重值分别计算各检索结果的评分,取评分最高的检索结果为所述文本信息对应的输出结果。

【技术特征摘要】
1.多系统相结合的自然语言处理方法,其特征在于,所述方法包括:提取接收的文本信息中的特征词;根据所述特征词与预存的关键词的匹配程度计算所述文本信息在依据所述关键词而进行分类的各组别中第一权重值;从多个第三方系统分别获取对应于所述文本信息的检索结果,并依据各检索结果、各组别在自身所从属的第三方系统中的第二权重值以及各组别对应的第一权重值分别计算各检索结果的评分,取评分最高的检索结果为所述文本信息对应的输出结果。2.根据权利要求1所述的多系统相结合的自然语言处理方法,其特征在于,所述根据所述特征词与预存的关键词的匹配程度计算所述文本信息在依据所述关键词而进行分类的各组别中第一权重值,具体包括:依据词频及逆向文件频率TF-IDF算法计算所述特征词在所述文本信息中的第一重要度;依据TF-IDF算法计算所述特征词在指定组别中的第二重要度;计算所述文本信息中各特征词在指定组别中的所述第一重要度与所述第二重要度的乘积的总和,以得到所述文本信息在指定组别中的所述第一权重值。3.根据权利要求2所述的多系统相结合的自然语言处理方法,其特征在于,所述文本信息在指定组别中的所述第一权重值Scategory-k通过如下公式计算:其中,aij-k为第ji-k个所述特征词,TIaij-k为所述aij-k的第一重要度,Iaij-k为所述aij-k的第二重要度。4.根据权利要求1所述的多系统相结合的自然语言处理方法,其特征在于,所述根据所述特征词与预存的关键词的匹配程度计算所述文本信息在依据所述关键词而进行分类的各组别中第一权重值之后,还包括:对所述第一权重值进行归一化处理,以使得归一化后的第一权重值均在预设的阈值范围内;所述归一化后的第一权重值S′Category-k通过如下公式计算:其中,Scategory为所述第一权重值归一化前的值,max(Scategory)为各所述第一权重值中最大的值,min(Scategory)为各所述第一权重值中最小的值。5.根据权利要求1所述的多系统相结合的自然语言处理方法,其特征在于,所述向多个第三方系统分别获取对应于所述文本信息的检索结果,并依据各检索结果、各所述组别在其所从属的第三方系统中的第二权重值以及对应的第一权重值计算各检索结果的评分,具体包括:计算各检索结果与其他检索结果的相似度之和以得到第一中间量;计算指定系统中各组别在自身所属的第三方系统中的所述第二权重值;计算指定系统中各组别对应的...

【专利技术属性】
技术研发人员:祖新星周宝王健宗肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1