构建社会单位画像的方法及系统技术方案

技术编号:20567094 阅读:32 留言:0更新日期:2019-03-14 09:40
本发明专利技术公开了一种构建社会单位画像的方法及系统,该构建社会单位画像的方法包括:步骤S1:获取与社会单位相关的文本;步骤S2:在该文本中提取关键词;步骤S3:根据该关键词建立该社会单位的画像。本发明专利技术提供的构建社会单位画像的方法,有利于实现投标单位对招标单位进行快速有效的了解。

【技术实现步骤摘要】
构建社会单位画像的方法及系统
本专利技术涉及数据处理
,特别是一种构建社会单位画像的方法及系统。
技术介绍
招标是为某项工程建设或大宗商品的买卖,邀请愿意承包或交易的厂商出价以从中选择承包者或交易者的行为。程序一般为:招标单位刊登广告或有选择地邀请有关厂商,并发给招标文件,或附上图纸和样品;投标单位按要求递交投标文件;然后在公证人的主持下当众开标、评标,以全面符合条件者为中标人,最后双方签订承包或交易合同。然而,在招标过程中,投标单位往往难以对招标单位进行快速有效的了解,从而很难做出正确的判断,因此,如何帮助投标单位实现对招标单位进行快速有效的了解是目前亟待解决的问题。
技术实现思路
有鉴于此,本专利技术的目的之一在于提供一种构建社会单位画像的方法及系统,有利于实现投标单位对招标单位进行快速有效的了解。为达到上述目的,本专利技术的技术方案提供了一种构建社会单位画像的方法,包括:步骤S1:获取与社会单位相关的文本;步骤S2:在所述文本中提取关键词;步骤S3:根据所述关键词建立所述社会单位的画像。进一步地,所述步骤S3包括:将所述关键词作为所述社会单位的画像标签。进一步地,所述社会单位为招标单位,所述文本包括以下的至少一种:所述社会单位的简介、所述社会单位招标产品的描述文本、与所述社会单位相关的新闻。进一步地,所述方法还包括:获取所述社会单位的单位信息,所述单位信息包括所述社会单位的单位性质信息、所述社会单位的控制关系信息、所述社会单位的资产负债信息、所述社会单位的资信状况信息、所述社会单位的经营行为信息、所述社会单位的历史招标信息中的至少一种;和/或对所述社会单位的社会关系进行分析;其中,所述步骤S3中还根据所述社会单位的单位信息和/或所述分析的结果建立所述社会单位的画像。进一步地,所述对所述社会单位的社会关系进行分析包括:获取所述社会单位以及不同社会群体之间的关系,所述不同社会群体包括企业群体、政府机构群体以及社会组织群体;确定所述社会单位所属的社会群体,并根据所述社会单位所属的社会群体获取与所述社会单位相似的社会单位。为实现上述目的,本专利技术的技术方案提供了一种构建社会单位画像的系统,包括:第一获取模块,用于获取与社会单位相关的文本;提取模块,用于在所述文本中提取关键词;画像构建模块,用于根据所述关键词建立所述社会单位的画像。进一步地,所述画像构建模块被配置为将所述关键词作为所述社会单位的画像标签。进一步地,所述社会单位为招标单位,所述文本包括以下的至少一种:所述社会单位的简介、所述社会单位招标产品的描述文本、与所述社会单位相关的新闻。进一步地,所述系统还包括第二获取模块和/或分析模块;所述第二获取模块用于获取所述社会单位的单位信息,所述单位信息包括所述社会单位的单位性质信息、所述社会单位的控制关系信息、所述社会单位的资产负债信息、所述社会单位的资信状况信息、所述社会单位的经营行为信息、所述社会单位的历史招标信息中的至少一种;所述分析模块用于对所述社会单位的社会关系进行分析;其中,所述画像构建模块被配置为还根据所述社会单位的单位信息和/或所述分析的结果建立所述社会单位的画像。进一步地,所述分析模块包括:采集单元,用于获取所述社会单位以及不同社会群体之间的关系,所述不同社会群体包括企业群体、政府机构群体以及社会组织群体;处理单元,用于确定所述社会单位所属的社会群体,并根据所述社会单位所属的社会群体获取与所述社会单位相似的社会单位。本专利技术提供的构建社会单位画像的方法,有利于实现投标单位对招标单位进行快速有效的了解。附图说明通过以下参照附图对本专利技术实施例的描述,本专利技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1是本专利技术实施例提供的一种构建社会单位画像的方法的流程图;图2是本专利技术实施例提供的另一种构建社会单位画像的方法的流程图;图3是本专利技术实施例提供的一种构建社会单位画像的系统的示意图。具体实施方式以下基于实施例对本专利技术进行描述,但是本专利技术并不仅仅限于这些实施例。在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分,为了避免混淆本专利技术的实质,公知的方法、过程、流程、元件并没有详细叙述。此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。参见图1,图1是本专利技术实施例提供的一种构建社会单位画像的方法的流程图,该方法包括:步骤S1:获取与社会单位相关的文本;步骤S2:在所述文本中提取关键词;步骤S3:根据所述关键词建立所述社会单位的画像;例如,可以将提取的关键词作为该社会单位的画像标签,得到该招标单位的画像标签体系,再通过该画像标签体系建立该社会单位的画像。例如,本专利技术实施例中的社会单位可以企业、政府机构、社会组织等社会单位,通过获取与该社会单位相关的文本,并从中提取关键词,再通过提取的关键词对该社会单位建立画像,通过该画像有助于其他社会单位对其进行快速有效的了解;例如,本实施例中的社会单位可以为招标单位,与其相关的文本可以包括以下的至少一种:所述社会单位的简介、所述社会单位招标产品的描述文本、与所述社会单位相关的新闻;通过上述与招标单位相关的描述以及其发布的招标产品的描述等信息,得到若干个关键词,再利用该若干个关键词建立招标单位的画像标签体系,得到的画像能够简单有效的体现出招标单位的相关信息;本专利技术实施例提供的构建社会单位画像的方法,通过获取与招标单位相关的文本,并从中提取关键词,然后通过该关键词对招标单位建立画像,投标单位通过该画像能够快速有效的对招标单位进行了解,有助于其在投标过程中做出正确的决定。其中,在本专利技术实施例的步骤S2中,可以采用TextRank方式在文本中提取关键词,具体方法如下:(1)文本分割:对待处理的文本P按照完整的句子S进行分割,即P=[S1,S2,...,Sn];(2)句子分词:对于每个属于文本P的句子Si,进行分词,并对分词结果数据进行清洗,只保留可描述招标单位的词语t(作为候选关键词),即Si=[ti1,ti2,...,tij,...,tim];(3)由(2)中所得的候选关键词构建候选关键词图G=(V,E),其中,V为节点集,E为边集合,采用共现关系(co-occurrence)构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现,其中,K表示窗口大小,即最多共现K个单词;设词图中任意两点Vi,Vj之间的权重为wij,对于一个给定的点Vi,In(Vi)是指向该点的点集合,Out(Vi)是Vi指向的点集合,则点Vi的得分WS(Vi)定义如下:其中,d为阻尼系数,取值范围为0到1,代表从图中某一特定点指向其他任意点的概率,例如,取值可以为0.85;(4)由(3)中的点Vi的得分WS(Vi),迭代传播各节点的权重,直至收敛;(5)倒序排列各节点的权重wij,从而得到最重要本文档来自技高网...

【技术保护点】
1.一种构建社会单位画像的方法,其特征在于,包括:步骤S1:获取与社会单位相关的文本;步骤S2:在所述文本中提取关键词;步骤S3:根据所述关键词建立所述社会单位的画像。

【技术特征摘要】
1.一种构建社会单位画像的方法,其特征在于,包括:步骤S1:获取与社会单位相关的文本;步骤S2:在所述文本中提取关键词;步骤S3:根据所述关键词建立所述社会单位的画像。2.根据权利要求1所述的方法,其特征在于,所述步骤S3包括:将所述关键词作为所述社会单位的画像标签。3.根据权利要求1所述的方法,其特征在于,所述社会单位为招标单位,所述文本包括以下的至少一种:所述社会单位的简介、所述社会单位招标产品的描述文本、与所述社会单位相关的新闻。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取所述社会单位的单位信息,所述单位信息包括所述社会单位的单位性质信息、所述社会单位的控制关系信息、所述社会单位的资产负债信息、所述社会单位的资信状况信息、所述社会单位的经营行为信息、所述社会单位的历史招标信息中的至少一种;和/或对所述社会单位的社会关系进行分析;其中,所述步骤S3中还根据所述社会单位的单位信息和/或所述分析的结果建立所述社会单位的画像。5.根据权利要求4所述的方法,其特征在于,所述对所述社会单位的社会关系进行分析包括:获取所述社会单位以及不同社会群体之间的关系,所述不同社会群体包括企业群体、政府机构群体以及社会组织群体;确定所述社会单位所属的社会群体,并根据所述社会单位所属的社会群体获取与所述社会单位相似的社会单位。6.一种构建社会单位画像的系统,其特征在于,包括...

【专利技术属性】
技术研发人员:聂镭王竹欣张峰聂颖郑权
申请(专利权)人:龙马智芯珠海横琴科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1