人机交互中基于标准问创建扩展问的方法和装置制造方法及图纸

技术编号:20160505 阅读:36 留言:0更新日期:2019-01-19 00:13
本发明专利技术提供了一种人机交互中基于标准问创建扩展问的方法和装置。所述方法包括:基于标准问所属的数据范围从人工智能语义识别系统的内部数据源或外部数据源采集数据;以所采集数据为对象执行与标准问的问句相似度计算以获得相似问句集;以及对相似问句集执行主语修改以获得标准问的扩展问;基于标准问所属的数据范围从内部数据源或外部数据源采集数据包括:若标准问属于内部数据,则从内部数据源调用所有内部数据,以及若标准问属于外部数据,则通过外部数据源进行搜索爬取;对通过外部数据源爬取到的所采集数据进行整理以过滤无用数据,执行问句相似度计算是以整理后的所采集数据为对象来执行的。

【技术实现步骤摘要】
人机交互中基于标准问创建扩展问的方法和装置本申请是申请日为2015年7月23日,申请号为201510438526.2,专利技术创造名称为“用于基于标准问创建扩展问的方法和装置”的分案申请。
本专利技术涉及知识库的编辑与扩展,尤其涉及人机交互中基于标准问创建扩展问的方法和装置。
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。为了能够理解人类语言,人工智能语义识别系统需要一套知识库。海量异构数据通过知识学习体系整理成知识,并融入到已有的知识体系中来。不同企业会生成各自的“专属知识”;同领域企业的知识中可以总结出“领域语义库”,如图中的“电信领域语义库”;多个行业的知识还可以总结成“通用语义库和知识库”。知识库的编辑与扩展对于人工智能语义识别系统尤其重要。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽本文档来自技高网...

【技术保护点】
1.一种人机交互中基于标准问创建扩展问的方法,其特征在于,标准问和扩展问用于人工智能语义识别系统中,包括:基于所述标准问所属的数据范围从所述人工智能语义识别系统的内部数据源或外部数据源采集数据;以所采集数据为对象执行与所述标准问的问句相似度计算以获得相似问句集;以及对所述相似问句集执行主语修改以获得所述标准问的扩展问;所述基于所述标准问所属的数据范围从内部数据源或外部数据源采集数据包括:若所述标准问属于内部数据,则从所述内部数据源调用所有内部数据,以及若所述标准问属于外部数据,则通过所述外部数据源进行搜索爬取;对通过所述外部数据源爬取到的所采集数据进行整理以过滤无用数据,所述执行问句相似度计算...

【技术特征摘要】
1.一种人机交互中基于标准问创建扩展问的方法,其特征在于,标准问和扩展问用于人工智能语义识别系统中,包括:基于所述标准问所属的数据范围从所述人工智能语义识别系统的内部数据源或外部数据源采集数据;以所采集数据为对象执行与所述标准问的问句相似度计算以获得相似问句集;以及对所述相似问句集执行主语修改以获得所述标准问的扩展问;所述基于所述标准问所属的数据范围从内部数据源或外部数据源采集数据包括:若所述标准问属于内部数据,则从所述内部数据源调用所有内部数据,以及若所述标准问属于外部数据,则通过所述外部数据源进行搜索爬取;对通过所述外部数据源爬取到的所采集数据进行整理以过滤无用数据,所述执行问句相似度计算是以整理后的所采集数据为对象来执行的。2.如权利要求1所述的方法,其特征在于,若所述标准问所属领域的词库在所述人工智能语义识别系统的知识库中已存在,则所属标准问为内部数据,否则为外部数据。3.如权利要求2所述的方法,其特征在于,所述内部数据源为所述人工智能语义识别系统的知识库中已存在的关于所述标准问的所属领域的词库,以及所述外部数据源包括与所述标准问的所属领域相关的第三方数据库。4.如权利要求1所述的方法,其特征在于,所述问句相似度计算是基于文本聚类分析、LDA分析、或序列分析中的任一者来执行的。5.如权利要求1所述的方法,其特征在于,所述相似问句集是与所述标准问的相似度超过预定阈值的问句的集合。...

【专利技术属性】
技术研发人员:蔡宏伟朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1