面向综合集成研讨环境的主题实时影响力评演方法及系统技术方案

技术编号:24938088 阅读:23 留言:0更新日期:2020-07-17 20:57
本发明专利技术涉及一种面向综合集成研讨环境的主题实时影响力评演方法及系统,所述评演方法包括:根据研讨厅中专家的当前发言内容,生成当前研讨的主题;根据专家发言之间的回复关系,构建发言消息网络;基于发言消息网络,计算发言消息的影响力;根据发言消息的影响力及消息的发布时间,计算所述主题的时效影响力;根据主题影响力的时效性,确定主题的实时演化情况。本发明专利技术可根据当前发言内容生成当前研讨的主题,通过构建发言消息网络,确定当前发言消息的影响力,进而根据消息的发布时间,可准确确定主题的时效影响力及主题的实时演化情况,以反馈给与会人员,辅助与会人员明确研讨主题的变化和走向,提高会议研讨效率。

【技术实现步骤摘要】
面向综合集成研讨环境的主题实时影响力评演方法及系统
本专利技术涉及信息处理
,特别涉及一种面向综合集成研讨环境的主题实时影响力评演方法及系统。
技术介绍
“人机结合、从定性到定量的综合集成研讨厅”是我国著名科学家钱学森等人提出的处理开放的复杂巨系统及相关问题的方法论。该方法在处理国家重大决策问题和复杂科学研究问题等方面存在优势,是复杂性科学研究的前沿方向。综合集成研讨厅体系的构思是把人集成于系统之中,采取人-机结合、以人为主的技术路线,充分发挥人和计算机各自在信息处理方面的优势,将人的局限性、经验性处理能力和计算机快速、精确处理能力相结合,从而逐步获得处理复杂问题的关键信息,解决那些单靠人或计算机都难以解决的问题。综合集成研讨厅体系其实质是指导人们在处理开放的复杂巨系统时,通过人机结合、群体研讨的方式,最大限度集成有关的经验、理论、知识、信息和数据,并通过群体成员之间的互相激发和对上述资源的集体加工处理,实现群体智慧的涌现,获得对复杂系统更好的认识。这就把综合集成法中的个体智慧明确上升为群体智慧,并且显著增强了开放的复杂系统的方法论的可操作性。在综合集成研讨环境中,与会者可以在线地以文字、音频、视频的形式对某问题进行定性研讨,也可以以调查问卷、投票的形式进行定量评估。单一的研讨方式使得研讨效率低下,意见分散,不利于把握研讨主题趋势的变化,因此亟需对发言内容进行有效整理评估。现有的综合集成研讨环境中的发言评价成果主要有以下几种:方法一:对发言观点的权威度计算,根据每条观点被响应的次数来计算各条发言意见的权威度。被响应的次数越高,该条发言的权威度越高,反之,该条发言的权威度越小(崔霞,戴汝为,李耀东,群体智慧在综合集成研讨厅体系中的涌现,系统仿真学报,2003,15(1),146-452.)。方法二:将专家对研讨方案评价意见的多维数据组进行降维,并将降维后的结果在低维数据空间中进行可视化表示,通过这种对专家评价意见在低维可视化空间内的可视化表示,可直观观测到专家群体意见的分类情况(刘春梅,戴汝为,综合集成研讨厅专家群体评估结果的可视化,模式识别与人工智能,2005,18(1),6-11)。方法三:利用专家发言的评价内容计算专家的整体权威度。(李敏花,李耀东,赵明昌,王春恒,戴汝为,基于网络综合集成研讨环境的专家权威度评价方法及系统,专利技术专利,公开号CN101312423A.)。方法四:利用专家之间的交互结构,计算专家权威度的评价(王艾,李耀东,李维杰,基于SemRank的CWME专家权威度计算方法,计算机应用研究,2010,27(7),2441-2444.)。其中,方法一是对发言的权威度计算,得到的是每条专家发言的权威度;方法二是将多个专家的发言进行降维,形成意见的分类;方法三是根据发言内容计算专家的权威度;方法四是根据发言的交互结构计算专家的权威度。当发言数量大,专家对问题的关注点分散时,上述的几种方法无法实时获得专家关注点的变化。此外,在研讨进行过程中,用户主要精力在研讨本身,研讨过程存在较大的时间压力,且参与用户都有较大的工作负担,无暇检索相关发言或者因频繁的检索而影响了研讨的进程,阻碍了研讨过程中知识的产生与知识的提升。
技术实现思路
为了解决现有技术中的上述问题,即为了辅助与会人员明确研讨主题的变化和走向,提高会议研讨效率,本专利技术的目的在于提供一种面向综合集成研讨环境的主题实时影响力评演方法及系统。为解决上述技术问题,本专利技术提供了如下方案:一种面向综合集成研讨环境的主题实时影响力评演方法,所述评演方法包括:根据研讨厅中专家的当前发言内容,生成当前研讨的主题;根据专家发言之间的回复关系,构建发言消息网络;基于发言消息网络,计算发言消息的影响力;根据发言消息的影响力及消息的发布时间,计算所述主题的时效影响力;根据主题影响力的时效性,确定主题的实时演化情况。可选地,所述根据研讨厅中专家的当前发言内容,生成当前研讨的主题,具体包括:对所述当前发言内容进行预处理,得到预处理文本;将预处理文本按照发言时间分为N段,得到N个子文本;采用主题生成模型,对各子文本进行处理,生成对应子文本的主题。可选地,所述对所述当前发言内容进行预处理,得到预处理文本,具体包括:对所述当前发言内容分词、去停用词、去除无用符号,得到预处理文本。可选地,采用主题生成模型,对各子文本进行处理,生成对应子文本的主题,具体包括:通过词条将所述子文本中的发言消息映射到相应主题;采用三层贝叶斯概率模型,计算各主题的词频;根据各主题的词频,确定所述子文本的主题。可选地,所述词频包括:词条wi对主题zj的词条概率P(zj|wi)及主题zj对发言消息dm的消息概率P(zj|dm);根据以下公式,计算各主题的词频:其中,|zj|是发言集合中属于主题Zj的发言数目,dm为发言消息;P(zi=j)为第j个主题属于当前发言的概率,P(wi|zi=j)为词条wi属于主题j的概率;令φ(j)=P(wi|zi=j)表示主题j在词条wi上的多项式分布,θ(i)=P(z)表示发言d在主题上的多项式分布;参数φ和θ表示词条与主题,主题与发言的关联关系;T表示主题数目,CWT和CDT分别表示W×T和D×T维的计数矩阵,表示不包括当前词条wi的分配给主题j的词条计数,表示不包括当前词条wi且主题j分配给发言d中相应词条的计数,表示不包括当前词条w的分配给主题j的词条计数,表示不包括当前词条wi且主题t分配给发言d中相应词条的计数,表示不包括当前词条i的分配给主题j的词条计数,表示不包括当前词条k的分配给主题j的词条计数,W为词条的数目,D为发言的数目。可选地,所述根据各主题的词频,确定所述子文本的主题,具体包括:分别比较词条概率P(zj|wi)与设定阈值THj、消息概率P(zj|dm)与设定阈值THj;选择大于所述设定阈值THj的词条概率P(zj|wi)对应的词条及大于所述设定阈值THj的消息概率P(zj|dm)对应的发言消息;根据选择出的词条及发言消息,确定子文本的主题。可选地,所述基于发言消息网络,计算发言消息的影响力,具体包括:通过社交网络的入度特征分析方法,计算发言的数量要素量:其中,发言消息网络Gn为有向带权图,Gn=(Vn,En,Wn),节点集合Vn表示消息集合;边集合En表示专家之间的回复关系;权重集合Wn表示在时间tn内回复的频率,du、dv表示发言信息,Wn(dv,du)表示在时间tn内发言信息dv与发言信息du的回复频率;通过社交网络的出度特征分析方法,计算发言的范围要素量:其中,I(dv,du)为指示函数,表示发言信息dv与发言信息du是否存在关联;根据本文档来自技高网
...

【技术保护点】
1.一种面向综合集成研讨环境的主题实时影响力评演方法,其特征在于,所述评演方法包括:/n根据研讨厅中专家的当前发言内容,生成当前研讨的主题;/n根据专家发言之间的回复关系,构建发言消息网络;/n基于发言消息网络,计算发言消息的影响力;/n根据发言消息的影响力及消息的发布时间,计算所述主题的时效影响力;/n根据主题影响力的时效性,确定主题的实时演化情况。/n

【技术特征摘要】
1.一种面向综合集成研讨环境的主题实时影响力评演方法,其特征在于,所述评演方法包括:
根据研讨厅中专家的当前发言内容,生成当前研讨的主题;
根据专家发言之间的回复关系,构建发言消息网络;
基于发言消息网络,计算发言消息的影响力;
根据发言消息的影响力及消息的发布时间,计算所述主题的时效影响力;
根据主题影响力的时效性,确定主题的实时演化情况。


2.根据权利要求1所述的面向综合集成研讨环境的主题实时影响力评演方法,其特征在于,所述根据研讨厅中专家的当前发言内容,生成当前研讨的主题,具体包括:
对所述当前发言内容进行预处理,得到预处理文本;
将预处理文本按照发言时间分为N段,得到N个子文本;
采用主题生成模型,对各子文本进行处理,生成对应子文本的主题。


3.根据权利要求2所述的面向综合集成研讨环境的主题实时影响力评演方法,其特征在于,所述对所述当前发言内容进行预处理,得到预处理文本,具体包括:
对所述当前发言内容分词、去停用词、去除无用符号,得到预处理文本。


4.根据权利要求2或3所述的面向综合集成研讨环境的主题实时影响力评演方法,其特征在于,采用主题生成模型,对各子文本进行处理,生成对应子文本的主题,具体包括:
通过词条将所述子文本中的发言消息映射到相应主题;
采用三层贝叶斯概率模型,计算各主题的词频;
根据各主题的词频,确定所述子文本的主题。


5.根据权利要求4所述的面向综合集成研讨环境的主题实时影响力评演方法,其特征在于,所述词频包括:词条wi对主题zj的词条概率P(zj|wi)及主题zj对发言消息dm的消息概率P(zj|dm);
根据以下公式,计算各主题的词频:
























其中,|zj|是发言集合中属于主题zj的发言数目,dm为发言消息;P(zi=j)为第j个主题属于当前发言的概率,P(wi|zi=j)为词条wi属于主题j的概率;
令φ(j)=P(wi|zi=j)表示主题j在词条wi上的多项式分布,θ(i)=P(z)表示发言d在主题上的多项式分布;参数φ和θ表示词条与主题,主题与发言的关联关系;T表示主题数目,CWT和CDT分别表示W×T和D×T维的计数矩阵,表示不包括当前词条wi的分配给主题j的词条计数,表示不包括当前词条wi且主题j分配给发言d中相应词条的计数,表示不包括当前词条w的分配给主题j的词条计数,表示不包括当前词条wi且主题t分配给发言d中相应词条的计数,表示不包括当前词条i的分配给主题j的词条计数,表示不包括当前词条k的分配给主题j的词条计数,W为词条的数目,D为发言的数目。


6.根据权利要求5所述的面向综合集成研讨环境的主题实时影响力评演方法,其特征在于,所述根据各主题的词频,确定所述子文本的主题,具体包括:
分别比较词条概率P(zj|wi)与设定阈值THj、消息概率P(zj|dm)与设定阈值THj;
选择大于所述设定阈值THj的词条概率P(zj|wi)对应的词条及大...

【专利技术属性】
技术研发人员:郑楠王丹力戴汝为
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1