【技术实现步骤摘要】
比较表格自动产生方法及装置
本专利技术是有关于一种数据处理技术,且特别是有关于一种比较表格自动产生方法及装置。
技术介绍
随着网络的发达,使用者可透过网络轻易地存取巨大的信息量。然而,当使用者想要针对一特定的主题进行比较且制作比较表格时,往往需要以人工的方式对网络信息进行检索。举例而言,使用者需要实际观看多篇网络文章并寻找相同的议题以及对应的内容,才能进行比较,然后自行筛选所需数据来制作格。这样以人工进行比较的方式耗时费力,并且效率低落,无法迅速对大量的数据进行快速的整理。因此,如何设计一个新的比较表格自动产生方法及装置,以解决上述缺陷,乃为此一业界亟待解决的问题。
技术实现思路
本专利技术的比较表格自动产生方法及装置可依据欲进行比较的文章主题、比较议题以及与比较议题相关的内容,产生基础文章和收集文章的比较表格,快速建立不同主题间的比较数据。因此,本专利技术的一态样是在提供一种比较表格自动产生方法,通过一服务器实施,且比较表格自动产生方法包含以下步骤:于界面单元接收复数个比较议题的设定、基础文章及其基础文章主题和复数个标记段落,其中每一标记段落是由基础文章中选择文章段落且标记其对应的其中的一比较议题;令服务器计算各标记段落所包含的各复数个基础文章字词间的相关联性,以令服务器产生对应各标记段落的至少一标记主标签以及复数个标记扩增词;令服务器依据标记主标签和标记扩增词,从信息源中撷取收集文章和对应的收集文章主题;令服务器计算收集文章的复数收集文章段落所包含的各复数个收集文章字词间的相关联性,以令服务器产生对应各收集文章的各收集文章段落的至少一收集文章段落主标签以及 ...
【技术保护点】
一种比较表格自动产生方法,通过一服务器实施,其特征在于,该比较表格自动产生方法包含以下步骤:于一界面单元接收复数个比较议题的设定、一基础文章及其基础文章主题和复数个标记段落,其中每一所述标记段落是由该基础文章中选择一文章段落且标记其对应的其中的一所述比较议题;令该服务器计算各所述标记段落所包含的各复数个基础文章字词间的相关联性,以令该服务器产生对应各所述标记段落的至少一标记主标签以及复数个标记扩增词;令该服务器依据所述标记主标签和所述标记扩增词,从一信息源中撷取一收集文章和对应的一收集文章主题;令该服务器计算该收集文章的复数收集文章段落所包含的各复数个收集文章字词间的相关联性,以令该服务器产生对应各所述收集文章的各所述收集文章段落的至少一收集文章段落主标签以及复数个收集文章段落扩增词;令该服务器将各所述收集文章的各所述收集文章段落的该收集文章段落主标签以及所述收集文章段落扩增词,与各所述标记段落的该标记主标签以及所述标记扩增词进行比对以产生一近似度,以令该服务器根据该近似度从各所述收集文章段落中选择对应每一所述比较议题的一选择段落;以及令该服务器建立一比较表格,其中该比较表格是分别以每 ...
【技术特征摘要】
2016.12.02 TW 1051399871.一种比较表格自动产生方法,通过一服务器实施,其特征在于,该比较表格自动产生方法包含以下步骤:于一界面单元接收复数个比较议题的设定、一基础文章及其基础文章主题和复数个标记段落,其中每一所述标记段落是由该基础文章中选择一文章段落且标记其对应的其中的一所述比较议题;令该服务器计算各所述标记段落所包含的各复数个基础文章字词间的相关联性,以令该服务器产生对应各所述标记段落的至少一标记主标签以及复数个标记扩增词;令该服务器依据所述标记主标签和所述标记扩增词,从一信息源中撷取一收集文章和对应的一收集文章主题;令该服务器计算该收集文章的复数收集文章段落所包含的各复数个收集文章字词间的相关联性,以令该服务器产生对应各所述收集文章的各所述收集文章段落的至少一收集文章段落主标签以及复数个收集文章段落扩增词;令该服务器将各所述收集文章的各所述收集文章段落的该收集文章段落主标签以及所述收集文章段落扩增词,与各所述标记段落的该标记主标签以及所述标记扩增词进行比对以产生一近似度,以令该服务器根据该近似度从各所述收集文章段落中选择对应每一所述比较议题的一选择段落;以及令该服务器建立一比较表格,其中该比较表格是分别以每一所述比较议题作为每一行的项目名称,将该基础文章主题作为其中一列的项目名称,并令该服务器依据该基础文章中对应每一所述比较议题的所述标记段落填入该列中对应每一所述比较议题的行的栏位中,以及令该服务器将该收集文章主题作为另一列的项目名称,并令该服务器依据该收集文章中对应每一所述比较议题的该选择段落填入该列中对应每一比较议题的行的栏位中。2.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器对各所述基础文章字词计算一正规化Google距离,以计算各所述基础文章字词间的相关联性。3.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:在一搜寻引擎中,令该服务器对各所述标记扩增词进行搜寻,以令该服务器将一搜寻结果页中包含的复数个结果字词中,重要性大于一重要性门槛值的所述结果字词归纳为所述标记扩增词。4.根据权利要求1所述的比较表格自动产生方法,其特征在于,该标记主标签以及所述标记扩增词是由相关联性大于一关联门槛值的所述基础文章字词撷取出。5.根据权利要求4所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:对相关联性大于该关联门槛值的所述基础文章字词,令该服务器透过一k-core演算法或一pagerank演算法撷取该标记主标签。6.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器根据该收集文章段落主标签与该标记主标签计算一正规化Google距离,以及令该服务器根据所述收集文章段落扩增词与所述标记扩增词计算一余弦近似度;令该服务器根据该正规化Google距离以及该余弦近似度产生该近似度;以及当一近似度大于一近似门槛值时,令该服务器判断该收集文章段落的该比较议题与该基础文章段落的该比较议题相同。7.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器根据一第一权重值以及一第二权重值,对该正规化Google距离以及该余弦近似度进行一权重总和的计算,以产生该近似度。8.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器从该信息源中撷取多个该收集文章并产生对应各个该收集文章中对应每一所述比较议题的该选择段落;以及令该服务器将多个该收集文章的该收集文章主题作为该...
【专利技术属性】
技术研发人员:陈棅易,郭台达,曹嬿恒,杨又权,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾,71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。