The embodiment of the invention discloses a semantic concept extension generating method and device for knowledge content. The method comprises: receiving knowledge content; according to the structure type of the characteristic information of knowledge content determines the knowledge content; target extraction rules to select the structure type and knowledge content from the pre stored in the rules of the match; according to the character of the target extraction rules extract the knowledge content the first set of semantic concepts. Compared with the existing technology, this scheme can be extended based on concept semantic concept corresponding to the intellectual content of automatic generation of extended semantic concept, not only to replace manual operation, can save time, improve efficiency, and the solutions to the knowledge content as reference information, semantic concepts generated are more comprehensive.
【技术实现步骤摘要】
面向知识内容的语义概念扩展生成方法与装置
本专利技术实施例涉及信息处理
,尤其涉及一种面向知识内容的语义概念扩展生成方法与装置。
技术介绍
目前,随着人们生活质量的提高,服务行业所提供的服务项目也越来越完善,为了节省人力成本,同时也为了向人们提供更加快捷方便的服务,服务行业的办事机构,例如,银行办事大厅等,通常设置智能问答设备,用户可在智能问答设备中输入想了解的知识内容的语义概念,触发智能问答设备显示相应的知识内容。基于智能问答设备的功能,通常,在投入使用之前,相关工作人员需要根据该服务行业的常见问题及其解答,整理得到每一条语义概念及其相应知识内容的对应关系,并将该对应关系存储到智能问答设备的数据库中,从而使得智能问答设备在接收到用户输入的语义概念时,根据对应关系调取与语义概念相应的知识内容,并向用户显示。然而,由于用户的自主性较强,对应同一条知识内容的调取,不同用户所输入的语义概念可能不同,例如,调取一条支付流程相关的知识内容,用户A输入“怎么支付”,用户B输入“怎么付款”,用户C输入“支付流程是什么”,所以,为了提高智能问答设备的适用性,相关工作人员需要 ...
【技术保护点】
一种面向知识内容的语义概念扩展生成方法,其特征在于,所述方法包括:接收知识内容;根据所述知识内容的特征信息确定所述知识内容的结构类型;从预存储的抽取规则中选择与所述知识内容的结构类型相匹配的目标抽取规则;按照所述目标抽取规则抽取所述知识内容中的字符段,得到第一组语义概念。
【技术特征摘要】
1.一种面向知识内容的语义概念扩展生成方法,其特征在于,所述方法包括:接收知识内容;根据所述知识内容的特征信息确定所述知识内容的结构类型;从预存储的抽取规则中选择与所述知识内容的结构类型相匹配的目标抽取规则;按照所述目标抽取规则抽取所述知识内容中的字符段,得到第一组语义概念。2.如权利要求1所述的面向知识内容的语义概念扩展生成方法,其特征在于,在得到第一组语义概念之后,还包括:判断所述知识内容所包含的字符的数量是否大于或者等于预设阈值;如果所述知识内容所包含的字符的数量大于或者等于所述预设阈值,提取所述知识内容中的关键词或者关键句作为第二组语义概念;如果所述知识内容所包含的字符的数量小于所述预设阈值,从所述知识内容中抽取业务词;从预先接收的参考语义概念中抽取关键词;将所述业务词和所述参考语义概念的关键词组合,得到所述第二组语义概念;其中,所述业务词是所述知识内容中属于预设业务类型的词;提取所述第一组语义概念和所述第二组语义概念中相同的语义概念作为扩展语义概念。3.如权利要求2所述的面向知识内容的语义概念扩展生成方法,其特征在于,所述从所述知识内容中抽取业务词包括:对所述知识内容执行分词操作,得到若干个基础词;去除所述基础词中的停用词,得到待分类词;根据所述待分类词的字符分别遍历预先创建的词库中的字符;当查找到所述待分类词时,为所述待分类词标注相应词库对应的类型标签,得到已分类词;从所述已分类词中确定标注有所述业务类型标签的词,得到所述业务词。4.如权利要求2所述的面向知识内容的语义概念扩展生成方法,其特征在于,所述将所述业务词和所述参考语义概念的关键词组合,包括:接收组合指令;按照所述组合指令中的顺序标识排列所述业务词和所述关键词的顺序。5.一种面向知识内容的语义概念扩展生成方法,其特征在于,所述方法包括:接收知识内容和与所述知识内容相对应的参考语义概念;执行第一生成过程、第二生成过程、第三生成过程和第四生成过程,分别得到第一组语义概念、第二组语义概念、第三组语义概念和第四组语义概念;其中,所述第一生成过程包括:根据所述知识内容的字符类型确定所述知识内容的结构类型;从预存储的抽取规则中选择与所述知识内容的结构类型相匹配的目标抽取规则;按照所述目标抽取规则抽取所述知识内容中的字符段,得到所述第一组语义概念;所述第二生成过程包括:从所述知识内容中抽取业务词;从所述参考语义概念中抽取关键词;将所述业务词和所述参考语义概念的关键词组合,得到所述第二组语义概念;其中,所述业务词是所述知识内容中属于预设业务类型的词;所述第三生成过程包括:提取所述知识内容中的关键词作为所述第三组语义概念;所述第四生成过程包括:提取所述知识内容中的关键句作为所述第四组语义概念;提取所述第一组语义概念、所述第二组语义概念、所述第三组语义概念和所述第四组语义概念中相同的语义概念作为扩展语义概念。6.一种面向知识内容...
【专利技术属性】
技术研发人员:蒋宏飞,陈飞,崔培君,乔思龙,张青,晋耀红,杨凯程,
申请(专利权)人:北京神州泰岳软件股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。