比较表格自动产生方法及装置制造方法及图纸

技术编号:18203999 阅读:51 留言:0更新日期:2018-06-13 06:13
一种比较表格自动产生方法及装置。比较表格自动产生方法包含以下步骤:设定比较议题、基础文章及主题和标记段落;计算标记段落的基础文章字词间的相关联性,以产生标记主标签及标记扩增词,以从信息源撷取收集文章和主题;计算收集文章段落的收集文章字词间的相关联性,产生收集文章段落主标签及扩增词,与标记主标签以及标记扩增词进行比对产生近似度,以产生选择段落;建立比较表格,以比较议题、基础文章主题和收集文章主题作为行、列的项目名称,依据比较议题的标记段落及选择段落填入栏位。本发明专利技术的技术可用以快速建立不同主题间的比较数据。

【技术实现步骤摘要】
比较表格自动产生方法及装置
本专利技术是有关于一种数据处理技术,且特别是有关于一种比较表格自动产生方法及装置。
技术介绍
随着网络的发达,使用者可透过网络轻易地存取巨大的信息量。然而,当使用者想要针对一特定的主题进行比较且制作比较表格时,往往需要以人工的方式对网络信息进行检索。举例而言,使用者需要实际观看多篇网络文章并寻找相同的议题以及对应的内容,才能进行比较,然后自行筛选所需数据来制作格。这样以人工进行比较的方式耗时费力,并且效率低落,无法迅速对大量的数据进行快速的整理。因此,如何设计一个新的比较表格自动产生方法及装置,以解决上述缺陷,乃为此一业界亟待解决的问题。
技术实现思路
本专利技术的比较表格自动产生方法及装置可依据欲进行比较的文章主题、比较议题以及与比较议题相关的内容,产生基础文章和收集文章的比较表格,快速建立不同主题间的比较数据。因此,本专利技术的一态样是在提供一种比较表格自动产生方法,通过一服务器实施,且比较表格自动产生方法包含以下步骤:于界面单元接收复数个比较议题的设定、基础文章及其基础文章主题和复数个标记段落,其中每一标记段落是由基础文章中选择文章段落且标记其对应的其中的一比较议题;令服务器计算各标记段落所包含的各复数个基础文章字词间的相关联性,以令服务器产生对应各标记段落的至少一标记主标签以及复数个标记扩增词;令服务器依据标记主标签和标记扩增词,从信息源中撷取收集文章和对应的收集文章主题;令服务器计算收集文章的复数收集文章段落所包含的各复数个收集文章字词间的相关联性,以令服务器产生对应各收集文章的各收集文章段落的至少一收集文章段落主标签以及复数个收集文章段落扩增词;令服务器将各收集文章的各收集文章段落的收集文章段落主标签以及收集文章段落扩增词,与各标记段落的标记主标签以及标记扩增词进行比对以产生近似度,以令服务器根据该近似度从各收集文章段落中选择对应每一比较议题的选择段落;以及令服务器建立比较表格,其中比较表格是分别以每一比较议题作为每一行的项目名称,将基础文章主题作为其中一列的项目名称,并令服务器依据基础文章中对应每一比较议题的标记段落填入此列中对应每一比较议题的行的栏位中,以及令服务器将收集文章主题作为另一列的项目名称,并令服务器依据收集文章中对应每一比较议题的选择段落填入此列中对应每一比较议题的行的栏位中。于本专利技术一实施例中,比较表格自动产生方法还包含:令服务器对各基础文章字词计算正规化Google距离(normalizedGoogledistance;NGD),以计算各基础文章字词间的相关联性。于本专利技术一实施例中,比较表格自动产生方法还包含:在搜寻引擎中,令服务器对各标记扩增词进行搜寻,以令服务器将搜寻结果页中包含的复数个结果字词中,重要性大于重要性门槛值的结果字词归纳为标记扩增词。于本专利技术一实施例中,标记主标签以及标记扩增词是由相关联性大于关联门槛值的基础文章字词撷取出。于本专利技术一实施例中,比较表格自动产生方法还包含:对相关联性大于关联门槛值的基础文章字词,令服务器透过k-core演算法或pagerank演算法撷取标记主标签。于本专利技术一实施例中,比较表格自动产生方法还包含:令服务器根据收集文章段落主标签与标记主标签计算正规化Google距离,以及令服务器根据收集文章段落扩增词与标记扩增词计算余弦近似度;令服务器根据正规化Google距离以及余弦近似度产生近似度;以及当近似度大于近似门槛值时,令服务器判断收集文章段落的比较议题与基础文章段落的比较议题相同。于本专利技术一实施例中,比较表格自动产生方法还包含:令服务器根据第一权重值以及第二权重值,对正规化Google距离以及余弦近似度进行权重总和的计算,以产生近似度。于本专利技术一实施例中,比较表格自动产生方法还包含:令服务器从信息源中撷取多个收集文章并产生对应各个收集文章中对应每一比较议题的选择段落;以及令服务器将多个收集文章的收集文章主题作为比较表格的复数列的项目名称,并令服务器依据各个收集文章中对应每一比较议题的选择段落填入复数列中对应每一比较议题的行的栏位中。本专利技术的另一态样是在提供一种比较表格自动产生装置,包含:储存单元以及处理单元。储存单元配置以储存应用程序。处理单元电性耦接于输入单元以及储存单元,处理单元配置以执行应用程序,依据基础文章及时间区间的复数收集文章以自动产生比较表格。其中处理单元提供一界面以设定复数个比较议题、基础文章及其基础文章主题和复数个标记段落,其中该每一标记段落是由该基础文章中选择一文章段落且标记其对应的其中的一所述比较议题;计算各所述标记段落所包含的各复数个基础文章字词间的相关联性,以产生对应各标记段落的至少一标记主标签以及复数个标记扩增词;依据标记主标签和标记扩增词,从信息源中撷取收集文章和对应的收集文章主题;计算收集文章的复数收集文章段落所包含的各复数个收集文章字词间的相关联性,以产生对应各收集文章的各收集文章段落的至少一收集文章段落主标签以及复数个收集文章段落扩增词;将各收集文章的各收集文章段落的收集文章段落主标签以及收集文章段落扩增词,与各标记段落的标记主标签以及标记扩增词进行比对产生近似度,以根据该近似度从各收集文章段落中选择对应每一比较议题的选择段落;以及建立比较表格,其中比较表格是分别以每一比较议题作为每一行的项目名称,将基础文章主题作为其中一列的项目名称,并依据基础文章中对应每一比较议题的标记段落填入此列中对应每一比较议题的行的栏位中,以及将收集文章主题作为另一列的项目名称,并依据收集文章中对应每一比较议题的选择段落填入此列中对应每一比较议题的行的栏位中。于本专利技术一实施例中,处理单元更对各基础文章字词计算正规化Google距离,以计算各基础文章字词间的相关联性。于本专利技术一实施例中,处理单元更链结至搜寻引擎,对各标记扩增词进行搜寻,以将搜寻结果页中包含的复数个结果字词中,重要性大于重要性门槛值的结果字词归纳为标记扩增词。于本专利技术一实施例中,标记主标签以及标记扩增词是由相关联性大于关联门槛值的基础文章字词撷取出。于本专利技术一实施例中,处理单元更对相关联性大于关联门槛值的基础文章字词,透过k-core演算法或pagerank演算法撷取标记主标签。于本专利技术一实施例中,处理单元更根据收集文章段落主标签与标记主标签计算正规化Google距离,以及根据收集文章段落扩增词与标记扩增词计算余弦近似度;根据正规化Google距离以及余弦近似度产生近似度;以及当近似度大于近似门槛值时,判断收集文章段落的比较议题与基础文章段落的比较议题相同。于本专利技术一实施例中,处理单元更根据第一权重值以及第二权重值,对正规化Google距离以及余弦近似度进行权重总和的计算,以产生近似度。于本专利技术一实施例中,处理单元更从信息源中撷取多个收集文章并产生对应各个收集文章中对应每一比较议题的选择段落;以及将多个收集文章的收集文章主题作为比较表格的复数列的项目名称,并依据各个收集文章中对应每一比较议题的选择段落填入复数列中对应每一比较议题的行的栏位中。应用本专利技术的优点在于,本专利技术的比较表格自动产生装置以及比较表格自动产生方法可以依据基础文章的内容判断欲进行比较的文章主题、比较议题以及与比较议题相关的内容,再自收集文章撷取相关的文章主题以本文档来自技高网...
比较表格自动产生方法及装置

【技术保护点】
一种比较表格自动产生方法,通过一服务器实施,其特征在于,该比较表格自动产生方法包含以下步骤:于一界面单元接收复数个比较议题的设定、一基础文章及其基础文章主题和复数个标记段落,其中每一所述标记段落是由该基础文章中选择一文章段落且标记其对应的其中的一所述比较议题;令该服务器计算各所述标记段落所包含的各复数个基础文章字词间的相关联性,以令该服务器产生对应各所述标记段落的至少一标记主标签以及复数个标记扩增词;令该服务器依据所述标记主标签和所述标记扩增词,从一信息源中撷取一收集文章和对应的一收集文章主题;令该服务器计算该收集文章的复数收集文章段落所包含的各复数个收集文章字词间的相关联性,以令该服务器产生对应各所述收集文章的各所述收集文章段落的至少一收集文章段落主标签以及复数个收集文章段落扩增词;令该服务器将各所述收集文章的各所述收集文章段落的该收集文章段落主标签以及所述收集文章段落扩增词,与各所述标记段落的该标记主标签以及所述标记扩增词进行比对以产生一近似度,以令该服务器根据该近似度从各所述收集文章段落中选择对应每一所述比较议题的一选择段落;以及令该服务器建立一比较表格,其中该比较表格是分别以每一所述比较议题作为每一行的项目名称,将该基础文章主题作为其中一列的项目名称,并令该服务器依据该基础文章中对应每一所述比较议题的所述标记段落填入该列中对应每一所述比较议题的行的栏位中,以及令该服务器将该收集文章主题作为另一列的项目名称,并令该服务器依据该收集文章中对应每一所述比较议题的该选择段落填入该列中对应每一比较议题的行的栏位中。...

【技术特征摘要】
2016.12.02 TW 1051399871.一种比较表格自动产生方法,通过一服务器实施,其特征在于,该比较表格自动产生方法包含以下步骤:于一界面单元接收复数个比较议题的设定、一基础文章及其基础文章主题和复数个标记段落,其中每一所述标记段落是由该基础文章中选择一文章段落且标记其对应的其中的一所述比较议题;令该服务器计算各所述标记段落所包含的各复数个基础文章字词间的相关联性,以令该服务器产生对应各所述标记段落的至少一标记主标签以及复数个标记扩增词;令该服务器依据所述标记主标签和所述标记扩增词,从一信息源中撷取一收集文章和对应的一收集文章主题;令该服务器计算该收集文章的复数收集文章段落所包含的各复数个收集文章字词间的相关联性,以令该服务器产生对应各所述收集文章的各所述收集文章段落的至少一收集文章段落主标签以及复数个收集文章段落扩增词;令该服务器将各所述收集文章的各所述收集文章段落的该收集文章段落主标签以及所述收集文章段落扩增词,与各所述标记段落的该标记主标签以及所述标记扩增词进行比对以产生一近似度,以令该服务器根据该近似度从各所述收集文章段落中选择对应每一所述比较议题的一选择段落;以及令该服务器建立一比较表格,其中该比较表格是分别以每一所述比较议题作为每一行的项目名称,将该基础文章主题作为其中一列的项目名称,并令该服务器依据该基础文章中对应每一所述比较议题的所述标记段落填入该列中对应每一所述比较议题的行的栏位中,以及令该服务器将该收集文章主题作为另一列的项目名称,并令该服务器依据该收集文章中对应每一所述比较议题的该选择段落填入该列中对应每一比较议题的行的栏位中。2.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器对各所述基础文章字词计算一正规化Google距离,以计算各所述基础文章字词间的相关联性。3.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:在一搜寻引擎中,令该服务器对各所述标记扩增词进行搜寻,以令该服务器将一搜寻结果页中包含的复数个结果字词中,重要性大于一重要性门槛值的所述结果字词归纳为所述标记扩增词。4.根据权利要求1所述的比较表格自动产生方法,其特征在于,该标记主标签以及所述标记扩增词是由相关联性大于一关联门槛值的所述基础文章字词撷取出。5.根据权利要求4所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:对相关联性大于该关联门槛值的所述基础文章字词,令该服务器透过一k-core演算法或一pagerank演算法撷取该标记主标签。6.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器根据该收集文章段落主标签与该标记主标签计算一正规化Google距离,以及令该服务器根据所述收集文章段落扩增词与所述标记扩增词计算一余弦近似度;令该服务器根据该正规化Google距离以及该余弦近似度产生该近似度;以及当一近似度大于一近似门槛值时,令该服务器判断该收集文章段落的该比较议题与该基础文章段落的该比较议题相同。7.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器根据一第一权重值以及一第二权重值,对该正规化Google距离以及该余弦近似度进行一权重总和的计算,以产生该近似度。8.根据权利要求1所述的比较表格自动产生方法,其特征在于,该比较表格自动产生方法还包含:令该服务器从该信息源中撷取多个该收集文章并产生对应各个该收集文章中对应每一所述比较议题的该选择段落;以及令该服务器将多个该收集文章的该收集文章主题作为该...

【专利技术属性】
技术研发人员:陈棅易郭台达曹嬿恒杨又权
申请(专利权)人:财团法人资讯工业策进会
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1