一种基于表单内容实现多轮人机智能交互的方法技术

技术编号:20622527 阅读:22 留言:0更新日期:2019-03-20 14:24
本发明专利技术提供了一种基于表单内容实现多轮人机智能交互的方法;本发明专利技术分为三个模块如图1所示,分别为表单内容处理模块、数据存储模块、多轮交互模块;表单由表单标题、属性内容构成,标题内容表明表单的内容主题,属性包含该主题包含的各项内容;表单的标题和属性内容结合句法,形成交互内容,存储于数据库中;识别用户对话,比对数据库中表单标题;匹配相同则调用所述表单生成的交互内容,实现人机多轮交互;与现有技术相比,本发明专利技术的方法极大减少了人工录入交互内容的工作量,且实现多轮交互,提高人机交互的效率和体验。

A Method of Realizing Multi-Round Human-Computer Intelligent Interaction Based on Form Content

The invention provides a method for realizing multi-round human-computer intelligent interaction based on form content; the invention is divided into three modules as shown in Figure 1, which are form content processing module, data storage module and multi-round interaction module; the form is composed of form title and attribute content, the title content indicates the content theme of the form, and the attribute contains the contents of the subject; Question and attribute content are combined with syntax to form interactive content and stored in database; user dialogue is identified and form titles are compared in database; interactive content generated by the form is invoked to achieve multi-round human-computer interaction if matching is the same; compared with the existing technology, the method of the present invention greatly reduces the workload of manual input of interactive content, realizes multi-round interaction and improves human-computer interaction. Efficiency and experience of interaction.

【技术实现步骤摘要】
一种基于表单内容实现多轮人机智能交互的方法
本专利技术涉及人工智能领域领域,尤其涉及一种实现人机多轮交互的方法。
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、命令控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。识别文字形式的用户问题,然后再通过上述语义解析过程理解用户的问题,并给出相应的答案。基于此传统设计方式,将需要识别的语料写入语法,生成语言模型,再将需要理解的语料分好类,生成语义模型。语义模型是用来理解该文字形式的用户输入的含义,以确定后续流程。写语义模型的人需要约定语义分类tag.才能继续进行,增加了沟通成本。每次增删改流程,都需要在系统中重新载入语言模型、语义模型和vxml,不能实时生效。比如账单查询的分类tag为:bill。vxml中需要写明,当识别语义解析结果为bill时,则走对应的流程,比如接下来的话术为:“你想查询哪个月的账单?”然后等待用户输入再识别,识别为“当月”,当月的分类tag为month.继续往下走对应的流程。目前应用普遍的人机对话交互系统的现状存在下面问题:知识点创建多为人工逐个录入,效率低下,需要耗费大量人力;对于人机多轮对话,实现方式是:后台开发固定的交互流程模型,一个流程模型只可使用一种人机对话情境,应用程度低,研发成本高。且人机交互顺序必须依据语言模型,用户对话不符合模型流程则无法执行该语言模型,导致人机交互缺少灵活性,使用率低。为了解决上述问题,我们专利技术了一种基于表单内容实现多轮人机智能交互的方法。
技术实现思路
本专利技术提供了表单内容处理模块,一种导入表单快速建立人机交互内容的方法。本专利技术提供了多轮智能交互模块,一种基于表单内容实现多轮人机智能交互的方法。本专利技术还提供了数据存储模块,一种计算机可读存储介质,具有能够便于实施下述任何一种方法的特点。根据本专利技术提供的表单内容处理模块,一种导入表单并快速生成交互内容的计算的方法,包括表单自定义、表单解析、智能信息抽取、信息存储;表单自定义即指用户定义表单内容;表单包括:表单标题、属性内容两部分,是文字形式;其中表单标题指所述表单的内容主题,属性内容是指该主题中包含的各项内容;如图2所示;将表单表格导入本方法,启动表单解析功能;按照行遍历表单,获取配置文件中用户给出的字段列表;第一行存储表单的属性名称,将第一行字段分别保存;读取其他行,即表格文件中用户给出的字段列表,即每一行是一个表单,其中第一列是表单标题,之后是每列对应属性的内容;表格格式解析完成后,进行对表单内容的智能信息抽取功能;通过分词处理和语义分析表单标题,得到所述内容主题的信息,包含但不限于:人物、机构、场所、时间、地点、目的、事件;属性内容中包含属性名称和该属性对应的内容,对属性名称进行分词处理,形成核心词词序列,成为匹配对话内容的依据;该属性对应的内容成为匹配后机器的话术;基于Trie数结构(前缀词典)实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);采用动态规划查找最大概率路径,找出基于词频的最大的切分组合;对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法;通过以上步骤训练了分词模型,可以通过该分词模型,对长文本,短语等进行分词通过上述方法,将表单信息转变为人机交互使用的信息。数据存储模块,将表单信息及处理后的信息,存储在相应的数据表项中。根据本专利技术提供了多轮智能交互模块,一种基于表单内容实现多轮人机智能交互的方法,包括:语义识别、匹配表单、多轮交互;多轮智能交互模块的主要功能是根据前面的交互状态决策采取的最优动作(如:提供结果,询问特定限制条件,澄清或确认需求等)从而最有效的提供人机多轮交互方案;系统根据语义识别功能,理解用户交互内容,与数据库中核心词匹配,匹配成功,表示所述内容机器可以应答,则机器响应,返回数据库中对应的内容;详述如下:根据匹配表单的功能,确定人机交互内容使用所述表单,表单标题是进入所述表单主题的入口;系统识别用户交互内容,与表单标题分词得到的核心词匹配,匹配成功则进入所述主题;进入所述表单主题,表明人机对话围绕所述主题的可能性最高;系统优先匹配所述表单主题内的交互信息;交互内容与所述表单属性的核心词词序列匹配,匹配成功,机器回复所述属性对应的内容,完成交互;其中,匹配是指通过相似度算法,确定词与词、句子与句子之间是否匹配。相似度算法有三部分组成,句子间的词形相似度,语义相似度,以及长度相似度。句子的语义相似度syn_sim(A,B)是指两个句子A,B的语义的相似程度,通过词向量组合来计算。利用训练出来的词向量,将句子中每个词的词向量相加合成一个向量,将得到的向量作为句子的向量,通过这个步骤,即可将句子表征成向量的形式,依次计算用户问句向量与知识库中每个问题向量的余弦值作为两个句子的语义相似度。其中,n为向量的维数,Ai为第一个向量第i维的值,Bi为第二个向量第i维的值。句子的词形相似度word_sim(A,B)是指两个句子中相同的词语共现频率,通常是根据句子中的词语信息进行统计分析,计算出两个句子的词形相似度。设len(S)表示句子S中包含的词语个数,same(A,B)表示两个句子A和B中同时出现的词语的个数,当某个词语在句子A和B中出现次数不同时,以出现次数少的计算。句子A和B的词形相似度可以这样计算句子的长度相似度len_sim(A,B)是指两个句子A,B的长度的相似程度。可以这样计算len(A)表示句子A的长度,len(B)表示句子B的长度。在计算了两个句子间的词形相似度,语义相似度,以及长度相似度以后,将句子三类特征综合利用起来。可以根据以下公式对根据三类特征在句子相似度计算过程中的重要程度,进行加权综合,进而求出句子相似度。sentence_sim(A,B)=λ1×syn_sim(A,B)+λ2×word_sim(A,B)+λ3×len_sim(A,B)多轮对话功能是指根据主题信息、上文信息,提供交互决策。详述如下:进入所述主题后,表单标题的信息作为已知信息,在人机对话交互过程中,系统无需重复询问所述信息;记忆上下文信息,识别用户语义,根据语义分析多个交互内容可以选择,则机器优先匹配此次交互中未被使用过的交互内容;交互内容未与所述表单属性匹配成功,表明用户的交互内容不再围绕所述表单主题,则再次匹配数据库中表单标题,寻找符合交互的表单;表单属性包含了此主题下的所有交互内容,即实现围绕此主题的人机多轮交互。与多次单轮交互不同,多轮交互中人机围绕着一个主题而进行的多次交互。与现有技术相比,本专利技术的方法,能够一次导入生成多个交互内容,提高效率,且信息准确;通过表单的功能设计,将人机交互的内容围绕同一个主题,实现多轮人机智能交互。附图说明图1为本专利技术中基于表单实现多轮人机智能交户方法的结构图;图2为本专利技术中表单的样式图;图3为多轮交互示意图;图4为具体实施方式示例表单的样式图。具体实施方式为了使本发本文档来自技高网
...

【技术保护点】
1.一种基于表单内容实现多轮人机智能交互的方法,包括:表单内容处理模块、多轮智能交互模块、数据存储模块。

【技术特征摘要】
1.一种基于表单内容实现多轮人机智能交互的方法,包括:表单内容处理模块、多轮智能交互模块、数据存储模块。2.根据权利1所述的表单内容处理模块,是一种导入表单快速建立人机交互内容的方法,包括:表单自定义、表单解析、智能信息抽取、信息存储。3.根据权利2所述的表单自定义功能,用户自定义表单解析过程相关的表格文件;表单包括:表单标题、属性内容两部分,是文字形式;其中表单标题指所述表单的内容主题,属性内容是指该主题中包含的各项内容。4.根据权利2所述的表单解析功能,启动该模块;根据行遍历表单,获取配置文件中用户给出的字段列表;第一行存储表单的属性名称,将第一行字段分别保存,获取表格文件中用户给出的字段列表,即每一行是一个表单,其中第一列是表单标题,之后是每列对应属性的内容。5.根据权利2所述的智能信息抽取功能,对表单内容抽取信息;通过分词处理和语义分析表单标题,得到所述内容主题的信息,包含但不限于:人物、机构、场所、时间、地点、目的、事件;属性内容中包含属性名称和该属性对应的内容,对属性名称进行分词处理,形成核心词词序列,成为匹配对话内容的依据;该属性对应的内容成为匹配后机器的话术。6.表单标题和属性的分词方法如下;表单标题和属性的分词方法为:基于Trie数结构(前缀词典)实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG),采用动态规划查找最大概率路径,找出基于词频的最大的切分组合;对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法;通过以上步骤训练了分词模型,可以通过该分词模型,对长文本,短语等进行分词通过上述...

【专利技术属性】
技术研发人员:吴琼
申请(专利权)人:北京奥法科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1