本发明专利技术公开一种基于招商工作流程和阅读偏好的信息推送方法,在信息推送过程中,采用智能要素提取算法和文本相似度算法,将企业画像、载体画像和要推送的信息等文字信息进行量化处理,采用Doc2Vec算法将企业画像信息、载体信息以及要推送的信息进行相似度比较,从而完成关于招商引资信息的精准推送;通过对阅读偏好的收集和计算,提高信息的利用率。本发明专利技术的特点是推送过程与招商工作流程密切结合,使推送信息精准符合招商场景的需求。
【技术实现步骤摘要】
基于招商工作流程和阅读偏好的信息推送系统及方法
本专利技术属于信息系统领域,特别是涉及到一种基于招商工作流程和阅读偏好的信息推送系统及方法。
技术介绍
在招商引资过程中,无论投资方还是载体都需要获取大量对方的精准信息,目前通用的方法是借助于互联网搜索引擎、企业资信网站、新闻信息等信息查询手段获取相关信息。这一过程中,传统的招商信息查询和推送方式存在下列问题:1、信息分散:由于互联网中信息分散,想要形成完整的企业画像或者载体画像,需要花大量人力和时间进行信息收集工作。2、信息可读性较低:由于目前信息推送采用广播方式,没有针对性,这样一方面造成信息推送成本增加,另一方面对企业造成一定的骚扰。3、信息利用率较低:投资主体需要经过不断的筛选与匹配才能在众多招商引资信息中找到满足自身需要、符合自身投资意向的信息,客观上造成信息利用率的低下。4、信息时效性较差:政府招商引资的政策方针和企业的意向在不断变化,而实际中推送的信息往往存在一定的滞后性,导致政府与企业的合作存在一定问题。5.缺乏客观阅读反馈分析:招商广播式信息推送后,推送内容对于企业用户是否真的需要,往往无法获得客观反馈。6.缺乏对企业发展需求分析:信息推送的有效性的前提是符合企业发展需求,传统招商信息推送模式缺乏对企业发展需求的精准定位。
技术实现思路
有鉴于此,本专利技术提出一种基于招商工作流程和阅读偏好的信息推送系统及方法,将企业画像、载体画像和推送信息进行量化处理,方便实现机器智能理解和对比,给企业推送精准招商信息、给载体推送企业投资信息,推送过程与招商工作流程密切结合,使推送信息精准符合招商场景的需求。为达到上述目的,本专利技术的技术方案是这样实现的:一种基于招商工作流程和阅读偏好的信息推送方法,包括:S1:通过数学模型,建立企业画像、载体画像和招商信息三个专用分词库;S2:企业、载体、信息量化处理;基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息、载体信息、需要推送的信息进行标签化处理;S3:设置信息推送类别;S4:信息生成;S5:标签筛选和比对;依据推送信息标签与企业标签、载体标签进行筛选和比对,挑选出具有针对性的信息推送给特定企业用户和载体招商人员。S6:计算用户阅读偏好,并对每日每用户接收的信息量进行控制。S7:信息推送。进一步的,步骤S1所述分词库数学模型的建立方法包括:S101:汉语言中所有的字组成一个观测集合,B,M,E,S组成一个状态集合,其中B表示词首字,E表示词尾字,M表示词中字,S表示单字成词;S102:通过人工的数据清洗与标注工作,获得大量学习样本,即为训练集;训练集中均为有上下语义逻辑的已经分词完成的多个样本;S103:在Viterbi算法中设计函数计算初始概率,状态转移概率,观测概率,同时统计出状态序列,观测序列,完成算法模型的搭建;其中观测序列即为待分词的语句;状态序列即为该语句中每个字所对应的状态,使用所述状态集合中的状态表示;初始概率,状态转移概率,观测概率均为语料库中状态与观测之间的对应关系所计算出的概率;进一步的,步骤S1通过数学模型建立分词库的方法包括:S201:根据数学模型,利用Viterbi算法预测每一条新进语句中的每个字在该句下所对应的状态;S202:算法完毕以后,设计函数,针对每个字所对应的状态,可以将字组合成词,逢状态E即添加回车字符,最终可得到完成的分词文本。进一步的,步骤S2需要将中文分词转化为数学形式,即分词向量化,实现方法包括:S301:使用Word2Vec算法,通过该分词的前后N个词来推断该词出现的概率;S302:利用最大似然估计法确定参数。进一步的,步骤S3所述信息推送类别包括法定推送信息、特别约定信息和偏好推送信息三个类别;法定推送信息:法定事项和相关重要法律、政策、实施细则等变化信息推送;特别约定信息:当事人特别约定的事项以及时间节点;偏好推送信息:符合个人偏好的企业信息、载体信息、服务信息、产业信息等资讯类信息。进一步的,步骤S4所述信息包括:(1)招商项目双方在查询、沟通、撮合、磋商、考察、谈判、落地服务、投诉协调等招商工作流程的各个阶段产生的约定事项及时间节点;(2)根据招商工作流程和关键节点,以及合作对接和项目落地的流程和时间节点,不同时间节点推送不同的内容;(3)向招商人员推送企业信息:依据招商规划自动匹配企业画像,根据企业画像检索企业信息库,将检索结果向招商人员推送;(4)向企业推送载体招商信息:依据招商规划自动匹配企业画像,根据企业画像检索企业信息库,向符合企业画像的企业推送载体招商信息;(5)向系统用户推送阅读偏好信息;根据用户阅读偏好,系统向用户推送相同标签的信息;(6)法定事项和法律、政策法规、实施细则等发布、修订及解读。本专利技术的另一方面,还提供了一种基于招商工作流程和阅读偏好的信息推送系统,采用四层架构模式,包括系统软件层、运行环境层、基础架构、应用服务;所述应用服务设有:场景获取:获取招商工作流程节点、法定事项的变化、用户阅读偏好信息,作为信息发送场景条件;数据统计:统计用户阅读数据,包括同标签信息的点击率、阅读时长、分享操作、评价和评论信息;发送服务:通过手机通知、微信、短信、邮件,给用户推送不同场景所需要的信息;信息库:需要推送的信息数据库;企业库:企业信息、项目信息数据库;载体库:包括地区、区、功能区、园区等各种招商载体的信息数据库;标签数据库:为企业、项目、载体建立的标签数据库;包括基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息进行标签化的数据;分词库:通过数学模型所建立的企业画像、载体画像和招商信息三个专用分词库。进一步的,所述应用服务还设有:用户服务:用户可以通过电脑、智能手机和平板电脑访问本系统;视图资源:采用MVC模型中的用户界面;服务代理:为了更高级别的用户访问,允许采用代理服务的方式访问本系统;直接访问:一般用户采用直接访问的方式使用本系统;API接口:对于集团用户等安全要求比较高的用户采用API方式使用本系统。进一步的,所述基础架构包括:身份认证:采用通用的用户+密码的登录模式进行身份验证;JDBC:JAVA应用服务与数据库直接的接口和标准;巡检脚本:是Linux操作系统中用于定时执行任务的Shell脚本,负责数据整理、抓取、清除,以及应用程序所必须的其他定时任务;生成报告:借用已经成熟的报告显示与生成工具,为此系统数据显示生成可视化报告;文档管理:为了提高WEB服务和应用服务的并发执行能力,分担负载,专门设立文档管理服务器,负责图片、文件、GIS、流媒体等的上传、下载、迁移、复制等任务;会话管理:保持用户的整个会话活动的互动与计算机系统跟踪过程;包括对session、cookie、token等交互信息的管理;事务管理:对数据访问、业务逻辑执行的管理;日志管理:包括系统日志、数据库日志和应用程序日志;记录系统中硬件、系统软件、应用软件、数据库和系统问题的信息,同时还可以监视系统中发生的事件;权限管理:包括系统安全规则、数据访问规则、应用服务访问规则等的管理;异常处理:通过短信平台、邮件、执行脚本等方式对系统、网络、应用、数据的异常情况进行处理。相对于现有技术,本专利技术具有以下优势:本专利技术通过采用人工智能语义理本文档来自技高网...
【技术保护点】
1.一种基于招商工作流程和阅读偏好的信息推送方法,其特征在于,包括:S1:通过数学模型,建立企业画像、载体画像和招商信息三个专用分词库;S2:企业、载体、信息量化处理;基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息、载体信息、需要推送的信息进行标签化处理;S3:设置信息推送类别;S4:信息生成;S5:标签筛选和比对;依据推送信息标签与企业标签、载体标签进行筛选和比对,挑选出具有针对性的信息推送给特定企业用户和招商人员;S6:计算用户阅读偏好,并对每日每用户接收的信息量进行控制;S7:信息推送。
【技术特征摘要】
1.一种基于招商工作流程和阅读偏好的信息推送方法,其特征在于,包括:S1:通过数学模型,建立企业画像、载体画像和招商信息三个专用分词库;S2:企业、载体、信息量化处理;基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息、载体信息、需要推送的信息进行标签化处理;S3:设置信息推送类别;S4:信息生成;S5:标签筛选和比对;依据推送信息标签与企业标签、载体标签进行筛选和比对,挑选出具有针对性的信息推送给特定企业用户和招商人员;S6:计算用户阅读偏好,并对每日每用户接收的信息量进行控制;S7:信息推送。2.根据权利要求1所述的方法,其特征在于,步骤S1所述分词库数学模型的建立方法包括:S101:汉语言中所有的字组成一个观测集合,B,M,E,S组成一个状态集合,其中B表示词首字,E表示词尾字,M表示词中字,S表示单字成词;S102:通过人工的数据清洗与标注工作,获得大量学习样本,即为训练集;训练集中均为有上下语义逻辑的已经分词完成的多个样本;S103:在Viterbi算法中设计函数计算初始概率,状态转移概率,观测概率,同时统计出状态序列,观测序列,完成算法模型的搭建;其中观测序列即为待分词的语句;状态序列即为该语句中每个字所对应的状态,使用所述状态集合中的状态表示;初始概率,状态转移概率,观测概率均为语料库中状态与观测之间的对应关系所计算出的概率。3.根据权利要求1所述的方法,其特征在于,步骤S1通过数学模型建立分词库的方法包括:S201:根据数学模型,利用Viterbi算法预测每一条新进语句中的每个字在该句下所对应的状态;S202:算法完毕以后,设计函数,针对每个字所对应的状态,可以将字组合成词,逢状态E即添加回车字符,最终可得到完成的分词文本。4.根据权利要求1所述的方法,其特征在于,步骤S2需要以历史数据库中的企业介绍为学习样本,将中文分词转化为可以运算的数学形式,即分词向量化,实现方法包括:S301:使用Word2Vec算法,通过该分词的前后N个词来推断该词出现的概率;S302:利用最大似然估计法确定参数。5.根...
【专利技术属性】
技术研发人员:张连祥,
申请(专利权)人:张连祥,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。