一种实现智能问答的信息处理方法及其装置制造方法及图纸

技术编号:16427792 阅读:30 留言:0更新日期:2017-10-21 22:31
本发明专利技术涉及人机交互技术领域,公开了一种实现智能问答的信息处理方法及其装置。本发明专利技术所提供的信息处理方法,其核心思路是先对问题文本信息进行分句处理,获取用户问句,然后基于问句相似度在QA问答库中找到与用户问句最相似的标准问句及对应的答复信息,由此相比较于现有基于关键词检索的问答方法,无需要求用户具有关键词分解的能力,全程自动化,大幅度提升用户体验,并提高搜索效果、反馈答案的针对性和有效性。同时通过句模分析、词法分析和词义扩展等自然语言理解技术的融合,以及进行多维度相似性的综合计算,可极大地提高最终问句相似度在汉语自动问答过程中的准确性,使汉语系的智能问答系统成为可能。

Information processing method and device for realizing intelligent question and answer

The invention relates to the field of human-computer interaction technology, and discloses an information processing method and device for realizing intelligent question answering. Information processing method provided by the invention, the core idea is to issue the text information clauses processing, obtaining user questions, then ask questions to find the similarity standard and the most similar user's questions and the corresponding library information in reply based on QA, which compared with the existing question answering method based on keyword search, there is no requirement the user has the keyword decomposition ability, full automation, greatly enhance the user experience, and improve the pertinence and effectiveness of the search results and feedback the answer. At the same time by sentence model analysis, lexical analysis and semantic extension of natural language understanding technology integration, and multi-dimensional comprehensive calculation of similarity, can greatly improve the accuracy of the final sentence similarity in question answering in Chinese, the Chinese Department of intelligent question answering system become possible.

【技术实现步骤摘要】
一种实现智能问答的信息处理方法及其装置
本专利技术涉及人机交互
,具体地,涉及一种实现智能问答的信息处理方法及其装置。
技术介绍
人机交互是一门研究系统与用户之间交互关系的科学,其中的系统可以是各种各样的机器,也可以是计算机化的系统或软件。例如,通过人机交互可以实现诸如智能客户系统、语音控制系统等各种人工智能系统。智能问答系统是人机交互的一种典型应用:当用户提出问题后,由智能问答系统给出该问题的答案,由此需在系统中配置一套QA问答库,并在该QA问答库中存储有大量的标准问题和对应的答案。目前,国内外很多研究机构都对智能问答系统展开了深入的研究,并在教育、政府、医院和银行等领域得到了广泛的应用。但是大多数的智能问答系统仍然存在一些不容忽视的弊端:(1)采用关键词检索,搜索效果不理想且要求用户具有关键词分解的能力;(2)反馈答案的针对性和有效性较差。
技术实现思路
针对前述现有大多数智能问答系统仍然存在的一些弊端问题,本专利技术提供了一种新的实现智能问答的信息处理方法及其装置。本专利技术采用的技术方案,一方面提供了一种实现智能问答的信息处理方法,包括步骤如下:S101.接收问题文本信息;S102.对所述问题文本信息进行分句处理,获取用户问句;S103.分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;S104.从所述QA问答库中读取与所述最相似标准问句对应的答复信息;S105.反馈所述答复信息。优化的,在计算所述用户问句与在QA问答库中各项标准问句的问句相似度的步骤中,包括步骤如下:S201.分别对所述用户问句和所述标准问句进行分词预处理,获取对应的关键词集;S202.根据所述用户问句和所述标准问句的关键词集,计算所述用户问句与所述标准问句的问句相似度。进一步优化的,在所述步骤S201中,包括步骤如下:S301.将问句与在句模库中的各项句模进行模式匹配,将匹配率最高的句模作为与所述问句对应的最匹配句模,所述问句为用户问句或标准问句;S302.根据所述最匹配句模去掉所述问句中的疑问词和问句特征词,实现对所述问句的切分,得到语句片断;S303.对所述语句片断进行分词处理,然后去除分词结果中的所有辅助词,得到核心语义词;S304.将所有的核心语义词作为关键词加载到所述问句的关键词集中。详细优化的,在所述步骤S304之后,还包括如下步骤:S305.根据所述核心语义词收集对应的同义词,然后将所有的同义词也作为关键词加载到所述问句的关键词集中。详细优化的,在所述步骤S304之后,还包括如下步骤:S306.读取与所述最匹配句模对应的特定辅助词表,然后将在所述特定辅助词表中的所有特定辅助词也作为关键词加载到所述问句的关键词集中。详细优化的,在对所述语句片断进行分词处理的步骤中,包括步骤如下:S401.分别应用正向最大匹配算法和逆向最大匹配算法对所述语句片断进行分词处理,若两种分词处理的分词结果一致,则将任意一种分词结果作为最终的分词结果,否则比较两种分词结果的切分出现概率,将切分出现概率最高的分词结果作为最终的分词结果。进一步详细优化的,按照如下公式计算分词结果的切分出现概率q:q=q(W1)·q(W2)·q(W3)·····q(Wn)式中,W1,W2,W3,…Wn为所述分词结果中的各个词,n为所述分词结果中的词数,q(W)为词W的词频。进一步优化的,在所述步骤S202中,包括步骤如下:S501.按照如下公式分别计算用户问句QU与标准问句QA的词形相似度WordSim(QU,QA)、句长相似度LenSim(QU,QA)、词序相似度OrderSim(QU,QA)和距离相似度DisSim(QU,QA):式中,Len(QU)为在用户问句QU的关键词集中关键词个数,Len(QA)为在标准问句QA的关键词集中关键词个数,SameWc(QU,QA)为在用户问句QU和标准问句QA的关键词集中相同关键词的个数,OnceWs(QU,QA)表示在用户问句QU和标准问句QA中都出现且只出现一次的关键词的集合,|OnceWs(QU,QA)|为在OnceWs(QU,QA)集合中关键词的个数,Pfirst(QU,QA)表示OnceWs(QU,QA)集合中的关键词在用户问句QU中的位置序号构成的向量,Psecond(QU,QA)表示Pfirst(QU,QA)中的分量按对应关键词在标准问句QA中的次序排序生成的向量,RevOrd(QU,QA)为在Psecond(QU,QA)中各相邻分量的逆序数,Dis(QU,QA)为应用标准语句QA中的关键词集将用户问句QU变成标准问句QA所需的最小编辑操作次数,k为利用领域内的相似问句进行训练得到的且在距离相似度DisSim(QU,QA)为0.5时的词语距离值,Max()为取最大值函数,Abs()为取绝对值函数;S502.按照如下公式计算用户问句QU与标准问句QA的问句相似度Sim(QU,QA):Sim(QU,QA)=α1·WordSim(QU,QA)+α2·LenSim(QU,QA)+α3·OrderSim(QU,QA)+α4·DisSim(QU,QA)式中,α1为词形相似度WordSim(QU,QA)的权重系数,α2为句长相似度LenSim(QU,QA)的权重系数,α3为词序相似度OrderSim(QU,QA)的权重系数,α4为距离相似度DisSim(QU,QA)的权重系数,所有的权重系数满足:α1+α2+α3+α4=1。本专利技术采用的技术方案,另一方面提供了一种实现前述的实现智能问答的信息处理方法的装置,包括收发单元、问句获取单元、问句相似度对比单元、答案获取单元和QA问答库;所述收发单元通信连接所述问句获取单元,用于接收问题文本信息和反馈答复信息;所述问句获取单元通信连接所述问句相似度对比单元,用于对所述问题文本信息进行分句处理,获取用户问句;所述问句相似度对比单元分别通信连接所述答案获取单元和所述QA问答库,用于分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;所述答案获取单元分别通信连接所述QA问答库和所述收发单元,用于从所述QA问答库中读取与所述最相似标准问句对应的答复信息;所述QA问答库用于存储各项标准问句和对应的答复信息。综上,采用本专利技术所提供的一种实现智能问答的信息处理方法及其装置,具有如下有益效果:(1)本专利技术所提供的信息处理方法,其核心思路是先对问题文本信息进行分句处理,获取用户问句,然后基于问句相似度在QA问答库中找到与用户问句最相似的标准问句及对应的答复信息,由此相比较于现有基于关键词检索的问答方法,无需要求用户具有关键词分解的能力,全程自动化,大幅度提升用户体验,并提高搜索效果、反馈答案的针对性和有效性;(2)在问句相似度的计算过程中,实现了句模分析、词法分析和词义扩展等自然语言理解技术的融合,并通过进行多维度相似性的综合计算,极大地提高了最终问句相似度在汉语自动问答过程中的准确性,从而可解决因中文固有的复杂性特点而难以实现汉语智能问答的问题,使汉语系的智能问答系统成为可能;(3)本专利技术提供的实现智能问答的信息处理方法及其装置本文档来自技高网...
一种实现智能问答的信息处理方法及其装置

【技术保护点】
一种实现智能问答的信息处理方法,其特征在于,包括步骤如下:S101.接收问题文本信息;S102.对所述问题文本信息进行分句处理,获取用户问句;S103.分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;S104.从所述QA问答库中读取与所述最相似标准问句对应的答复信息;S105.反馈所述答复信息。

【技术特征摘要】
1.一种实现智能问答的信息处理方法,其特征在于,包括步骤如下:S101.接收问题文本信息;S102.对所述问题文本信息进行分句处理,获取用户问句;S103.分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;S104.从所述QA问答库中读取与所述最相似标准问句对应的答复信息;S105.反馈所述答复信息。2.如权利要求1所述的一种实现智能问答的信息处理方法,其特征在于,在计算所述用户问句与在QA问答库中各项标准问句的问句相似度的步骤中,包括步骤如下:S201.分别对所述用户问句和所述标准问句进行分词预处理,获取对应的关键词集;S202.根据所述用户问句和所述标准问句的关键词集,计算所述用户问句与所述标准问句的问句相似度。3.如权利要求2所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S201中,包括步骤如下:S301.将问句与在句模库中的各项句模进行模式匹配,将匹配率最高的句模作为与所述问句对应的最匹配句模,所述问句为用户问句或标准问句;S302.根据所述最匹配句模去掉所述问句中的疑问词和问句特征词,实现对所述问句的切分,得到语句片断;S303.对所述语句片断进行分词处理,然后去除分词结果中的所有辅助词,得到核心语义词;S304.将所有的核心语义词作为关键词加载到所述问句的关键词集中。4.如权利要求3所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S304之后,还包括如下步骤:S305.根据所述核心语义词收集对应的同义词,然后将所有的同义词也作为关键词加载到所述问句的关键词集中。5.如权利要求4所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S304之后,还包括如下步骤:S306.读取与所述最匹配句模对应的特定辅助词表,然后将在所述特定辅助词表中的所有特定辅助词也作为关键词加载到所述问句的关键词集中。6.如权利要求3所述的一种实现智能问答的信息处理方法,其特征在于,在对所述语句片断进行分词处理的步骤中,包括步骤如下:S401.分别应用正向最大匹配算法和逆向最大匹配算法对所述语句片断进行分词处理,若两种分词处理的分词结果一致,则将任意一种分词结果作为最终的分词结果,否则比较两种分词结果的切分出现概率,将切分出现概率最高的分词结果作为最终的分词结果。7.如权利要求6所述的一种实现智能问答的信息处理方法,其特征在于,按照如下公式计算分词结果的切分出现概率q:q=q(W1)·q(W2)·q(W3)·…·q(Wn)式中,W1,W2,W3,…Wn为所述分词结果中的各个词,n为所述分词结果中的词数,q(W)为词W的词频。8.如权利要求2所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S202中,包括步骤如下:S501.按照如下公式分别计算用户问句QU与标准问句QA的词形相似度WordSim(QU,QA)、句长相似度LenSim(QU,QA)、词序相似度OrderSim(QU,QA)...

【专利技术属性】
技术研发人员:张峰谢俊武吴海波刘奕湘刘丽萍陈碧莹曹威林泽曦
申请(专利权)人:广东电网有限责任公司江门供电局
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1