自然语言的生成方法及系统技术方案

技术编号:10702339 阅读:109 留言:0更新日期:2014-12-03 11:07
本发明专利技术公开了一种自然语言的生成方法及系统,涉及计算机科学领域,用于解决当用户采用自然语言来录入数据时,需要用户手段录入自然语言,录入过程较为繁琐,且容易出错的问题。本发明专利技术提供的自然语言的生成方法包括:获取用户输入的第一关键词;判定所述第一关键词所属的类别;根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言。本发明专利技术适用于计算机科学领域,用于生成自然语言。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种自然语言的生成方法及系统,涉及计算机科学领域,用于解决当用户采用自然语言来录入数据时,需要用户手段录入自然语言,录入过程较为繁琐,且容易出错的问题。本专利技术提供的自然语言的生成方法包括:获取用户输入的第一关键词;判定所述第一关键词所属的类别;根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言。本专利技术适用于计算机科学领域,用于生成自然语言。【专利说明】自然语言的生成方法及系统
本专利技术涉及计算机科学领域,尤其涉及一种自然语言的生成方法及系统。
技术介绍
随着计算机技术的发展,计算机已经逐渐成为多个领域中的不可或缺的办公设备。一般的,计算机之间的通信、或者计算机与开发人员之间的通信可以挺过机器语言完成。但是,对于一般用户而言,用户与计算机之间是通过自然语言进行交互的。自然语言处理是计算机科学领域中的一个方向,主要是研究能实现人与计算机之间用自然语言进行有效通信的理论和方法。 在很多领域中,信息都是以自然语言的文本形式记录存储的,并且以自然语言的形式呈现给用户。例如,在医院的病例数据库中,对于一个由于感冒引起发烧的病人,医务工作人员在记录该病人的病例数据时,需要依次输入:病症-发烧,诊断结论-感冒,治疗方案-某药物。 目前,当用户采用自然语言来录入数据时,需要用户手段录入自然语言,录入过程较为繁琐,且容易出错。
技术实现思路
本专利技术的实施例提供一种自然语言的生成方法及系统,能够解决现有技术中当用户采用自然语言来录入数据时,需要用户手段录入自然语言,录入过程较为繁琐,且容易出错的问题。 为达到上述目的,本专利技术的实施例采用如下技术方案: 第一方面,本专利技术实施例提供了一种自然语言的生成方法,所述方法包括: 获取用户输入的第一关键词; 判定所述第一关键词所属的类别; 根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言。 在第一种可能的实现方式中,所述判定所述第一关键词所属的类别,包括: 基于预设规则,根据所述第一关键词的特定标识判定所述第一关键词所属的类别; 或者 基于历史统计结果,根据所述第一关键词在不同类别中出现的概率判定所述第一关键词所属的类别。 结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述方法还包括: 预先设定数据库,所述数据库用于存储各关键词的记录信息和各关键词的类别信息,所述记录信息包括:各关键词的共现词汇、所述共现词汇的类别和共现频率。 结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言之前,还包括: 从所述数据库中读取所述第一关键词的记录信息; 根据所述第一关键词的记录信息计算所述第一关键词和其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度。 结合第一方面或第一方面的第一种可能的实现方式、或第二种可能的实现方式、或第三种可能的实现方式,在第四种可能的实现方式中,所述根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言,包括: 确定与所述第一关键词关联度最高的、以及与所述第一关键词所属类别关联度最高的一个或多个属于不同类别的关键词作为所述上下文关联词; 按照预设语言模板将所述第一关键词和上下文关联词组合为自然语言,其中,所述语言模板用于根据所述第一关键词的词性和上下文关联词的词性对所述第一关键词和上下文关键词进行符合常规语法结构的组合。 结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述方法还包括: 当生成的自然语言为多个时,以下拉框的形式对所述生成的多个自然语言进行显示以供用户确认; 或者 当生成的自然语言不被用户认可时,则提示用户手动输入待录入的自然语言,并对用户输入的自然语言进行分析以更新所述数据库。 结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,所述对用户输入的自然语言进行分析以更新所述数据库,包括: 获取用户输入的自然语言中的所有关键词; 建立词间相似度矩阵,根据所述词间相似度矩阵对所述用户输入的自然语言中的所有关键词进行分析,从而对所述数据库中各关键词的记录信息和各关键词所属的类别信息进行更新,其中,所述词间相似度矩阵用于表征所述数据库中任意两个关键词之间的相似度。 第二方面,本专利技术实施例提供了一种自然语言的生成系统,所述系统包括: 获取模块,用于获取用户输入的第一关键词; 判定模块,用于判定所述获取模块获取的第一关键词所属的类别; 生成模块,用于根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言。 在第一种可能的实现方式中,所述判定模块包括: 第一判定单元,用于基于预设规则,根据所述第一关键词的特定标识判定所述第一关键词所属的类别; 或者 第二判定单元,用于基于历史统计结果,根据所述第一关键词在不同类别中出现的概率判定所述第一关键词所属的类别。 结合第二方面或第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述系统还包括: 数据库,用于存储各关键词的记录信息和各关键词的类别信息,所述记录信息包括:各关键词的共现词汇、所述共现词汇的类别和共现频率。 结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述系统还包括: 关联度计算模块,用于从所述数据库中读取所述第一关键词的记录信息,根据所述第一关键词的记录信息计算所述第一关键词和其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度。 结合第二方面或第二方面的第一种可能的实现方式、或第二种可能的实现方式、或第三种可能的实现方式,在第四种可能的实现方式中,所述生成模块具体用于确定与所述第一关键词关联度最高的、以及与所述第一关键词所属类别关联度最高的一个或多个属于不同类别的关键词作为所述上下文关联词,并按照预设语言模板将所述第一关键词和上下文关联词组合为自然语言,其中,所述语言模板用于根据所述第一关键词的词性和上下文关联词的词性对所述第一关键词和上下文关键词进行符合常规语法结构的组合。 结合第二方面的第四种可能的实现方式,在第五种可能的实现方式中,所述系统还包括显示模块、更新模块,其中: 所述显示模块用于当所述生成模块生成的自然语言为多个时,以下拉框的形式对所述生成的多个自然语言进行显示以供用户确认; 所述更新模块用于当所述生成模块生成的自然语言不被用户认可时,则提示用户手动输入待录入的自然语言,并对用户输入的自然语本文档来自技高网...

【技术保护点】
一种自然语言的生成方法,其特征在于,包括:获取用户输入的第一关键词;判定所述第一关键词所属的类别;根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言。

【技术特征摘要】

【专利技术属性】
技术研发人员:张杰齐泉张轶博
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1