本发明专利技术公开了一种投票预测方法,包括以下步骤:利用议员的背景信息初始化立法者的表示向量,并利用议员之间的关系网络信息对表示进行更新;使用议案的标题和描述作为输入,利用LSTM模型进行编码,得到议案的表示向量;将议员和议题投射到同一个向量空间中,得到议员和议题在同一空间里的表示;对原始输入文本进行语义依存分析,得到语义依存关系图;然后把关系图中的每个词节点转换为相应的词向量表示,每条依存边转换为相应的one
【技术实现步骤摘要】
一种投票预测方法
[0001]本专利技术属于数据处理领域,尤其涉及一种投票预测方法。
技术介绍
[0002]投票预测的目的是利用议员投票的历史记录来估计他们对新兴问题的可能态度。由于议员的偏好和文化背景对他们的立场和诉求有很大影响,从投票数据中学习议员的表示已成为预测其投票倾向的有效工具。因此,如何提高投票预测准确性成为亟待解决的技术问题。
技术实现思路
[0003]本专利技术的目的在于克服现有技术存在的以上问题,提供一种投票预测方法。
[0004]为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:一种投票预测方法,包括以下步骤:步骤一:利用议员的背景信息初始化立法者的表示向量,并利用议员之间的关系网络信息对表示进行更新;步骤二:使用议案的标题和描述作为输入,利用LSTM模型进行编码,得到议案的表示向量;步骤三:将议员和议题投射到同一个向量空间中,得到议员和议题在同一空间里的表示;步骤四:对原始输入文本进行语义依存分析,得到语义依存关系图;步骤五:然后把关系图中的每个词节点转换为相应的词向量表示,每条依存边转换为相应的one
‑
hot编码,并输入SGN block卷积层;步骤六:将SGN block卷积层的输出作为全连接层的输入;步骤七:最后通过softmax进行归一化处理。
[0005]进一步地,所述步骤一中具体将每个议员看成一个节点,并将发起人和联合发起人之间的连接作为边,构建一个议员的加权关系网络,利用一段时间的发起人和联合发起人数据得到邻接矩阵,最后利用图卷积神经网络对议员的初始化向量表示进行更新。
[0006]进一步地,所述步骤三具体包括:通过议员表示和议题表示之间的距离确定议员对于议题的偏爱程度,并引入triplet loss。
[0007]进一步地,所述triplet loss具体包括:在每个训练迭代时,采样出一批三元组,每个三元组里包含了议题,以及一对议员,其中一个议员标记为,另一个议员标记为,投票结果服从:。
[0008]进一步地,所述步骤五中SGN block卷积层具体包括边的更新方法和节点的更新方法;边的更新方法包括:将该边两端节点的词向量进行两层卷积,再加上该边的one
‑
hot编码;
节点的更新方法包括:节点相邻节点的词向量及相邻边的one
‑
hot编码进行两层卷积,再加上该节点的词向量。
[0009]本专利技术的有益效果是:本专利技术能够有效利用议员的历史数据,对议员间的关系网络进行合理搭建,基于卷积神经网络的议员表示学习、长短时记忆网络(LSTM)的议题表示学习、Triple Loss的联合表示学习,大大提高了投票结果的预测准确性。
附图说明
[0010]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术的模型示意图;图2是本专利技术的语义图网络示意图;图3是本专利技术中向量表示阶段示意图;图4是本专利技术中GN block内部结构图。
具体实施方式
[0011]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0012]本方案利用采集的议会相关信息构建训练数据集。变量包括历史议案投票的结果,其中包含对议题数量、议员数量和投票记录的详细统计,如下表所示:
变量详细信息议员数据议员编号、性别、年龄、职务等议案数据标题、简介、议题发起人/联合发起人、唱票结果等投票记录数据所有议员对于某一议题的投票结果,其包括三种立场“yeas”(yes)、“nays
”ꢀꢀꢀ
(no)、“not vote”模型如图1所示,整体上,模型分为四个部分。分别为基于卷积神经网络的议员表示学习,基于长短时记忆网络(LSTM)的议题表示学习,基于Triple Loss的联合表示学习以及基于投票结果分布的投票结果预测;议员数据的集合表示为:;议案数据的集合表示为:;投票结构的集合表示为:;对于给定议题,本方案预测的不同议员对于该议题的投票结果即可表示为:;一种投票预测方法,包括以下步骤:步骤一:利用议员的背景信息初始化立法者的表示向量,并利用议员之间的关系网络信息对表示进行更新;具体将每个议员看成一个节点,并将发起人和联合发起人之间的连接作为边,构建一个议员的加权关系网络,利用一段时间的发起人和联合发起人数据得到邻接矩阵,最
block内部,不考虑图的全局属性u,将图中边的更新方法设计为将该边两端节点的词向量进行两层卷积,再加上该边的one
‑
hot编码得来;节点的更新方法设计为该节点相邻节点的词向量及相邻边的 one
‑
hot 编码进行两层卷积,再加上该节点的词向量得到;根据LSTM模型中提及的议题初始表示输入语义GCN中,可以得到议题新的表示,将这个表示输入两层的MLP,即可对议案的正、中立、负票三种立场的比例进行预测。
[0019]步骤六:将SGN block卷积层的输出作为全连接层的输入;步骤七:最后通过softmax进行归一化处理。
[0020]在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0021]以上显示和描述了本专利技术的基本原理、主要特征和本专利技术的优点。本行业的技术人员应该了解,本专利技术不受上述实施例的限制,上述实施例和说明书中描述的只是说明本专利技术的原理,在不脱离本专利技术精神和范围的前提下,本专利技术还会有各种变化和改进,这些变化和改进都落入要求保护的本专利技术范围内。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种投票预测方法,其特征在于:包括以下步骤:步骤一:利用议员的背景信息初始化立法者的表示向量,并利用议员之间的关系网络信息对表示进行更新;步骤二:使用议案的标题和描述作为输入,利用LSTM模型进行编码,得到议案的表示向量;步骤三:将议员和议题投射到同一个向量空间中,得到议员和议题在同一空间里的表示;步骤四:对原始输入文本进行语义依存分析,得到语义依存关系图;步骤五:然后把关系图中的每个词节点转换为相应的词向量表示,每条依存边转换为相应的one
‑
hot编码,并输入SGN block卷积层;步骤六:将SGN block卷积层的输出作为全连接层的输入;步骤七:最后通过softmax进行归一化处理。2.根据权利要求1所述的一种投票预测方法,其特征在于:所述步骤一中具体将每个议员看成一个节点,并将发起人和联合发起人之间的连接作为边,构建一个议员的加权关系网络,利用一段时间的发起人和联合发起人数据得到邻...
【专利技术属性】
技术研发人员:杨钰雯,
申请(专利权)人:北京清博智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。