【技术实现步骤摘要】
作为用于确定文档质量的指标的相关性
本专利技术一般地涉及计算领域,并且更具体地,涉及认知处理。
技术介绍
认知系统实现自然语言处理(NLP)和其他机器学习技术以合成大量数据内容源(例如电子文档),以便生成特定输入问题的假设、建议和/或答案。给定文档的质量可以在认知系统用于进一步处理和理解该给定文档中的一段文本(aspanoftext)的上下文含义的能力中起重要作用。
技术实现思路
本专利技术的实施例公开一种用于基于相关性的文档质量评估的方法、计算机系统、以及计算机程序产品。本专利技术可以包括基于根据到领域知识库的至少一个领域链接而确定的至少一个容器相关性得分,计算文档质量得分。附图说明从以下将结合附图阅读的对本专利技术的说明性实施例的详细描述,本专利技术的这些和其他目的、特征和优点将变得显而易见。附图的各种特征未按比例,因为附图是为了清楚起见,以促进本领域的技术人员结合详细描述来理解本专利技术。这些附图是:图1示出了根据至少一个实施例的网络计算机环境;图2是根据至少 ...
【技术保护点】
1.一种计算机实现的方法,包括:/n基于根据到领域知识库的至少一个领域链接而确定的至少一个容器相关性得分,计算文档质量得分。/n
【技术特征摘要】
20190606 US 16/4341121.一种计算机实现的方法,包括:
基于根据到领域知识库的至少一个领域链接而确定的至少一个容器相关性得分,计算文档质量得分。
2.根据权利要求1所述的方法,其中,基于根据到所述领域知识库的所述至少一个领域链接而确定的所述至少一个容器相关性得分,计算所述文档质量得分进一步包括:
基于所述至少一个容器相关性得分和根据至少一种文档质量启发式法而确定的至少一个容器质量得分,计算所述文档质量得分。
3.根据权利要求1所述的方法,其中,基于根据到所述领域知识库的所述至少一个领域链接而确定的所述至少一个容器相关性得分,计算所述文档质量得分进一步包括:
确定对应于所述至少一个容器相关性得分的至少一个容器质量得分;以及
计算所确定的至少一个容器质量得分和所述至少一个容器相关性得分的加权平均值。
4.根据权利要求1所述的方法,还包括:
基于至少一种文档质量启发式法,确定与文档的至少一个相应的容器相关联的至少一个容器质量得分;以及
基于在所述文档的所述至少一个相应的容器中识别到所述领域知识库的所述至少一个领域链接,确定所述至少一个容器相关性得分。
5.根据权利要求1所述的方法,还包括:
访问来自文档语料库中的文档;
规范化所访问的文档;以及
在所规范化的文档中识别至少一个容器。
6.根据权利要求1所述的方法,其中,到所述领域知识库的所述至少一个领域链接是从包括相关提及类型、罕见提及类型、以及提及类型组合的组中选择的。
7.根据权利要求1所述的方法,还包括:
识别与文档的容器相关联的容器名称;
基于被链接到容器相关性的容器名称的相关性映射,将所识别的容器名称映射到预定容器相关性;以及
基于与所述预定容器相关性相关联的所映射的容器名称,修改所述至少一个容器相关性得分。
8.根据权利要求2所述的方法,其中,所述至少一种文档质量启发式法是从包括有效字符的百分比、有效单词的百分比、完整句子的百分比、不相关标签的数量、句子之间的空格的数量、以及标记之间的空格的数量的组中选择的。
9.根据权利要求2所述的方法,还包括...
【专利技术属性】
技术研发人员:R·迪利玛,A·R·弗里德,B·马斯科特,K·马哈詹,D·孔特雷拉斯,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。