【技术实现步骤摘要】
基于招商工作流程和阅读偏好的信息推送系统及方法
本专利技术属于信息系统领域,特别是涉及到一种基于招商工作流程和阅读偏好的信息推送系统及方法。
技术介绍
在招商引资过程中,无论投资方还是载体都需要获取大量对方的精准信息,目前通用的方法是借助于互联网搜索引擎、企业资信网站、新闻信息等信息查询手段获取相关信息。这一过程中,传统的招商信息查询和推送方式存在下列问题:1、信息分散:由于互联网中信息分散,想要形成完整的企业画像或者载体画像,需要花大量人力和时间进行信息收集工作。2、信息可读性较低:由于目前信息推送采用广播方式,没有针对性,这样一方面造成信息推送成本增加,另一方面对企业造成一定的骚扰。3、信息利用率较低:投资主体需要经过不断的筛选与匹配才能在众多招商引资信息中找到满足自身需要、符合自身投资意向的信息,客观上造成信息利用率的低下。4、信息时效性较差:政府招商引资的政策方针和企业的意向在不断变化,而实际中推送的信息往往存在一定的滞后性,导致政府与企业的合作存在一定问题。5.缺乏客观阅读反馈分析:招商广播式信息推送后,推送内容对于企业用户是否真的需要,往往无法获得客观 ...
【技术保护点】
1.一种基于招商工作流程和阅读偏好的信息推送方法,其特征在于,包括:S1:通过数学模型,建立企业画像、载体画像和招商信息三个专用分词库;S2:企业、载体、信息量化处理;基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息、载体信息、需要推送的信息进行标签化处理;S3:设置信息推送类别;S4:信息生成;S5:标签筛选和比对;依据推送信息标签与企业标签、载体标签进行筛选和比对,挑选出具有针对性的信息推送给特定企业用户和招商人员;S6:计算用户阅读偏好,并对每日每用户接收的信息量进行控制;S7:信息推送。
【技术特征摘要】
1.一种基于招商工作流程和阅读偏好的信息推送方法,其特征在于,包括:S1:通过数学模型,建立企业画像、载体画像和招商信息三个专用分词库;S2:企业、载体、信息量化处理;基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息、载体信息、需要推送的信息进行标签化处理;S3:设置信息推送类别;S4:信息生成;S5:标签筛选和比对;依据推送信息标签与企业标签、载体标签进行筛选和比对,挑选出具有针对性的信息推送给特定企业用户和招商人员;S6:计算用户阅读偏好,并对每日每用户接收的信息量进行控制;S7:信息推送。2.根据权利要求1所述的方法,其特征在于,步骤S1所述分词库数学模型的建立方法包括:S101:汉语言中所有的字组成一个观测集合,B,M,E,S组成一个状态集合,其中B表示词首字,E表示词尾字,M表示词中字,S表示单字成词;S102:通过人工的数据清洗与标注工作,获得大量学习样本,即为训练集;训练集中均为有上下语义逻辑的已经分词完成的多个样本;S103:在Viterbi算法中设计函数计算初始概率,状态转移概率,观测概率,同时统计出状态序列,观测序列,完成算法模型的搭建;其中观测序列即为待分词的语句;状态序列即为该语句中每个字所对应的状态,使用所述状态集合中的状态表示;初始概率,状态转移概率,观测概率均为语料库中状态与观测之间的对应关系所计算出的概率。3.根据权利要求1所述的方法,其特征在于,步骤S1通过数学模型建立分词库的方法包括:S201:根据数学模型,利用Viterbi算法预测每一条新进语句中的每个字在该句下所对应的状态;S202:算法完毕以后,设计函数,针对每个字所对应的状态,可以将字组合成词,逢状态E即添加回车字符,最终可得到完成的分词文本。4.根据权利要求1所述的方法,其特征在于,步骤S2需要以历史数据库中的企业介绍为学习样本,将中文分词转化为可以运算的数学形式,即分词向量化,实现方法包括:S301:使用Word2Vec算法,通过该分词的前后N个词来推断该词出现的概率;S302:利用最大似然估计法确定参数。5.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。