This application discloses a method for operating a data processing system to identify documents in a library comprising multiple documents and multiple concepts from the multiple document examples, and a computer readable medium for storing instructions for enabling the data processing system to execute the method. The method includes: enabling data processing system to identify candidate documents matching search keywords provided by users from the database; enabling data processing system to generate subject graphics that correlate concepts contained in candidate documents; and clustering candidate documents based on subject graphics. For each cluster, the data processing system displays a summary of the candidate documents in the cluster and the cluster name representing the cluster.
【技术实现步骤摘要】
专业性技术文档的文档检索系统
技术介绍
测量系统的改进已经使得产生包括基于软件的控制器的系统,所述控制器可以操作标的测量设备来进行目录不断增加的特定测量。该目录的剪切尺寸使得从不具吸引力的目录中选择测量协议。基于使用关键词检索缩小目录的方案也取得了有限的成功,因为检索需要用户具有特定仪器的操作技能级别。很多用户缺乏有关的操作技能水平。此外,对于相同或类似的函数,在不同测量设备中使用的函数定义可以随设备而异,这取决于购买设备的型号、安装的软件、或许可证类型。通过使用很多现代仪器中包括的机载数据处理系统来尝试减轻这种检索问题已经取得有限的成功。这些搜索引擎通常检索包括每个测量协议的说明性文本的测量协议的数据库。搜索引擎要求用户输入一个或多个关键词并选择满足显示给用户的关键词检索的所有协议。用户然后必须滚动浏览目录并选择候选协议以详细查看说明性文本。此外,用户必须熟悉文档的专用词汇。如果用户选择过宽的关键词,则目录太多。如果用户选择的关键词太窄,则可能会错过所需的协议。
技术实现思路
本专利技术包括用于操作数据处理系统以识别包括多个文档和由所述多个文档示例的多个概念的库中的文档的方法、以及存储用于使数据处理系统执行该方法的指令的计算机可读介质。所述方法包括:使数据处理系统从库中识别与用户提供的检索关键词匹配的候选文档;使数据处理系统产生将候选文档中包含的概念相互关联的主题图形(topicalgraph);和基于主题图形对候选文档进行聚类。对于每个聚类,数据处理系统显示该聚类中的所述候选文档的概要以及表征该聚类的聚类名称。在本专利技术的一个方面中,所述方法使得数据处理系统产 ...
【技术保护点】
1.一种用于操作数据处理系统以识别包括多个文档和由所述多个文档示例的多个概念的库中的文档的方法,所述方法包括:使所述数据处理系统从所述库中识别与用户提供的检索关键词匹配的候选文档;使所述数据处理系统产生将所述候选文档中包含的概念相互关联的主题图形;基于所述主题图形对所述候选文档进行聚类;以及对于每个聚类,显示该聚类中的所述候选文档的概要以及表征该聚类的聚类名称。
【技术特征摘要】
2017.06.30 US 15/640,1221.一种用于操作数据处理系统以识别包括多个文档和由所述多个文档示例的多个概念的库中的文档的方法,所述方法包括:使所述数据处理系统从所述库中识别与用户提供的检索关键词匹配的候选文档;使所述数据处理系统产生将所述候选文档中包含的概念相互关联的主题图形;基于所述主题图形对所述候选文档进行聚类;以及对于每个聚类,显示该聚类中的所述候选文档的概要以及表征该聚类的聚类名称。2.权利要求1所述的方法,其还包括使所述数据处理系统产生概念索引,所述概念索引为所述多个文档中的每个概念指定一个位置以及指定该概念与所述多个文档中的所述概念中的另一概念之间的关系。3.权利要求2所述的方法,其中所述概念索引还包括指定所述文档与所述概念中的所述另一概念之间的所述关系的强度的权重。4.权利要求2所述的方法,其中所述关系包括选自以下的关系:亲代-子代关系,属种概念关系,一个概念是另一概念的一部分或一个属性的关系,一个概念是另一概念的同义词的关系,整体和整体的局部的关系,将所述文档之一中的概念关键词与所述概念之一相关联的概念关键词关系,和问题和解决方案的关系。5.权利要求2所述的方法,其中所述主题图形中的所述概念各自包括描述该概念的概念名称,并且其中所述聚类名称是包括在所...
【专利技术属性】
技术研发人员:浦智则,
申请(专利权)人:是德科技股份有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。