基于NLP和企业信息的智能造词方法技术

技术编号：20588938 阅读：27 留言：0更新日期：2019-03-16 07:10

本公开提供了一种基于NLP和企业信息的智能造词方法，包括以下步骤：A、建立数据库中文本元素之间的关联度统计表，并根据文本元素的使用频率对关联度统计表进行实时更新；B、建立数据库中文本元素的匹配函数，使用匹配函数对文本元素进行匹配造词，匹配优先级与文本元素的关联度成正比；C、对匹配出的词组进行筛选，保留可靠性超出设定阈值的词组；D、对步骤C中保留的词组进行使用状态监控，根据监控反馈对匹配函数进行实时更新。本发明专利技术能够解决现有技术的不足，有效提高了智能造词的效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
基于NLP和企业信息的智能造词方法
本公开涉及人工智能
，尤其是一种基于NLP和企业信息的智能造词方法。
技术介绍
NLP(自然语言处理)是近些年兴起的人机交互方式，广泛应用于语音识别、语言生成、机器翻译等多个领域。在各类商用数据库应用中，为了提高通讯效率，需要事先对常用词汇进行统计和存储。利用NLP技术自动生成词组成为了近些年研发的热点。
技术实现思路
本公开要解决的技术问题是提供一种基于NLP和企业信息的智能造词方法，能够解决现有技术的不足，有效提高了智能造词的效率和准确度。为解决上述技术问题，本公开所采取的技术方案如下。一个方面，一种基于NLP和企业信息的智能造词方法，包括以下步骤：A、建立数据库中文本元素之间的关联度统计表，并根据文本元素的使用频率对关联度统计表进行实时更新；B、建立数据库中文本元素的匹配函数，使用匹配函数对文本元素进行匹配造词，匹配优先级与文本元素的关联度成正比；C、对匹配出的词组进行筛选，保留可靠性超出设定阈值的词组；D、对步骤C中保留的词组进行使用状态监控，根据监控反馈对匹配函数进行实时更新。根据本公开的一个实施方式，步骤A中，关联度统计表包括任意一个文本元素与其它任意一个文本元素的单维关联度，以及任意一个文本元素与其它至少任意两个文本元素的多维关联度。根据本公开的一个实施方式，步骤B中，首先使用单维关联度对匹配函数进行线性变换，然后使用多维关联度对匹配函数进行非线性变换。根据本公开的一个实施方式，步骤C中，使用词组中各文本元素的匹配命中率对词组可靠性进行计算，其中，h为词组中各文本元素的匹配命中率，R为词组可靠性。根据本公...

【技术保护点】
1.一种基于NLP和企业信息的智能造词方法，其特征在于，包括以下步骤：A、建立数据库中文本元素之间的关联度统计表，并根据文本元素的使用频率对关联度统计表进行实时更新；B、建立数据库中文本元素的匹配函数，使用匹配函数对文本元素进行匹配造词，匹配优先级与文本元素的关联度成正比；C、对匹配出的词组进行筛选，保留可靠性超出设定阈值的词组；D、对步骤C中保留的词组进行使用状态监控，根据监控反馈对匹配函数进行实时更新。

【技术特征摘要】
1.一种基于NLP和企业信息的智能造词方法，其特征在于，包括以下步骤：A、建立数据库中文本元素之间的关联度统计表，并根据文本元素的使用频率对关联度统计表进行实时更新；B、建立数据库中文本元素的匹配函数，使用匹配函数对文本元素进行匹配造词，匹配优先级与文本元素的关联度成正比；C、对匹配出的词组进行筛选，保留可靠性超出设定阈值的词组；D、对步骤C中保留的词组进行使用状态监控，根据监控反馈对匹配函数进行实时更新。2.根据权利要求1所述的基于NLP和企业信息的智能造词方法，其特征在于：步骤A中，关联度统计表包括任意一个文本元素与其它任意一个文本元素的单维关联度，以及任意一个文本元素与其它至少任意两个文本元素的多维关联度。3.根据权利要求2所述的基于NLP和企业信息的智能造词方法，其特征在于：步骤B中，首先使用单维关联度对匹配函数进行线性变换，然后使用多维关联度对匹配函数进行非线性变换。4.根据权利要求3所述的基于NLP和企业信息的智能造词方法，其特征在于：步骤C中，使用词组中各文本元素的匹配命中率对词组可靠性进行计算，其中，h为词组中各文本元素的匹配命中率，R为词组可靠性。5.根据权利要求4所述的基于NLP和企业信息的智能造词方法，其特征在于：步骤D中，建立匹配函数的权重集合，根据监控反馈，将命中率与权重集合中的权重值进行线性调整。6.一种基于NLP和企业信息的...

【专利技术属性】
技术研发人员：林正春，姜允志，王静，
申请(专利权)人：广东原昇信息科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人