当前位置: 首页 > 专利查询>暨南大学专利>正文

一种针对地理网点的智能任务分配和人员调度方法、系统技术方案

技术编号:22565928 阅读:15 留言:0更新日期:2019-11-16 12:23
本发明专利技术公开了一种针对具有一定地理位置特征的网点的智能拜访任务分配和人员调度方法、系统,包括以下步骤:从企业信息系统决策模块的基础数据和实时数据中,对物理商业网点和业务员分别提取特征,对业务员拜访网点的历史数据建模;用二分图表示业务员和网点之间的连接从而形成拜访计划网络图;根据业务员所处环境信息,规划最优拜访路线;使用强化学习方法,根据业务员执行某一动作后产生的预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度神经网络模型,反复更新学习参数,确定最优任务匹配策略;实际拜访过程中,采用强化学习方法进行计算,将任务执行策略优化方法以及拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。

An intelligent task allocation and personnel scheduling method and system for geographic network

The invention discloses an intelligent visit task assignment and personnel scheduling method and system for a node with certain geographic location features, which comprises the following steps: extracting features from the basic data and real-time data of the decision-making module of the enterprise information system, modeling the historical data of the physical business node and the operator visit node, representing the operator with a binary diagram The network graph of visit plan is formed by the connection with the outlets; the optimal visit route is planned according to the environmental information of the salesman; the income obtained from the allocation strategy is evaluated by the reinforcement learning method according to the preset reward or punishment after the salesman performs an action, and fed back to the in-depth neural network model, the learning parameters are updated repeatedly, and the optimal task matching is determined Strategy: in the actual visit process, reinforcement learning method is used to calculate, and the task execution strategy optimization method and visit route optimization method are iterated continuously at the same time to get the overall optimal visit mode.

【技术实现步骤摘要】
一种针对地理网点的智能任务分配和人员调度方法、系统
本专利技术涉及企业信息系统研究领域,特别涉及一种针对地理网点的智能任务分配和人员调度方法、系统。
技术介绍
信息系统是企业经营的大脑。伴随着企业规模扩大、企业信息化建设进程的逐渐深入,管理深度、数据和信息量不断增大。因此全凭人工管理系统信息和企业决策,企业生产远远达不到高效率。尤其是企业日常经营中存在很多简单且高频的经验型决策问题,信息系统中也存在大量经验型决策模块,这类问题往往耗费大量人力且不需过多脑力,增加了企业的人力成本。典型如面向线下商业网点的拜访计划,经常存在任务分配和人员调度的决策问题,由于现实情况中存在不确定性和复杂性,初始分配方案缺乏科学依据,同时对环境及交通情况不敏感,可能变得不合理,这时企业一般的解决方案是采取人工重新规划,再传入企业信息系统中,并通知业务员任务发生变动,这一系列操作,不仅影响业务员的工作效率,还给客户留下不好的印象。随着人工智能技术的不断发展,深度学习和强化学习等方法更使人工智能得到新突破,将人工智能技术运用于企业信息系统,代替人进行经验性决策,提高企业的决策柔性化。基于以上背景,研究一种可实现企业信息系统智能化响应,可实时进行任务分配和人员调度的方法具有重要的实用价值。
技术实现思路
本专利技术的主要目的在于克服现有方法的缺点与不足,提供一种针对地理网点的智能任务分配和人员调度方法、系统,其可利用企业所积累的用户大数据,尤其是在需要人工进行经验型业务决策的模块中,提炼出业务逻辑规则,对这部分模块的输入与输出数据进行建模,训练深度神经网络,从而利用神经网络代替人工决策,克服人工决策的决策成本高、效率低等问题。本专利技术的目的通过以下的技术方案实现:一种针对地理网点的智能任务分配和人员调度方法,包括步骤:(1)从企业信息系统决策模块的基础数据和实时数据中,提取特征,特征包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征等。(2)使用二分图将业务员和拜访的具有地理位置特征的商业网点(以下简称网点)之间的关系形成拜访计划网络,对历史记录和业务员拜访网点的实时数据建模,得到深度强化学习模型;(3)根据执行某一动作后产生的预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度强化学习模型,反复迭代更新学习参数,最终确定最优任务执行策略;(4)根据业务员所处环境信息,规划最优拜访路线;(5)实际拜访过程中,采用强化学习方法进行计算,将步骤(3)的任务执行策略优化方法以及步骤(4)的拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。优选的,获取决策模块的基础数据后,先对其进行数据预处理,预处理包括:检查原始数据中是否存在脏数据,脏数据一般是指不符合要求,以及不能直接进行相应分析的数据;填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来清理数据;通过平滑聚集、规范化等方式将数据转换成适用于神经网络训练的形式。优选的,步骤(1)中,决策模块的基础数据是指业务数据库的历史数据,包括待拜访网点信息、业务员信息等,实时数据是指拜访任务信息、实时交通状况、业务员地理位置等。优选的,步骤(1)中,所述待拜访网点的特征包括:拜访网点类型以及网点基本信息,所述拜访网点类型包括已有网点、潜在网点、疑似假网点等。所述网点基本信息包括地理位置、经营品类、供货方式、产品库存等。所述业务员的特征包括:业务能力、历史拜访记录、熟悉的网点和范围等。所述拜访任务的特征包括:拜访顺序及路线,预期的订单目标,网点和业务员之间的交互情况,即该网点是否被业务员拜访、拜访任务的难度、业务员正在拜访或空闲操作。对网点拜访整个过程而言,业务员拜访一个网点需经历三个流程,即前往待拜访的网点、拜访网点和离开网点。所述业务员周边环境特征包括:业务员的时间和空间状态,即当前所处地理位置、交通状况、拜访时间等。优选的,步骤(1)中,提取待拜访网点的特征时,对各个网点设定先后顺序。优选的,步骤(2)中,深度强化学习模型的输入是状态集S和动作集A,业务员的特征和业务员周边环境特征表示状态集S,待拜访网点的特征和拜访任务的特征表示动作集A。优选的,步骤(2)中,在建立的深度强化学习模型的过程中,用二分图来表示业务员和拜访网点之间的匹配关系,在该二分图中,将业务员和网点作为节点,业务员与网点的初始是全连接状态,在与环境的交互过程中,随着连接边上的权重不断更迭,同时,根据地理位置关系对网点集合建立偏序关系,获得最优匹配策略。更进一步的,步骤(2)中,在进行拜访网点和业务员匹配的过程中,应考虑一些实际情况,例如已有网点拜访优于潜在网点拜访,(Ti,Tj)表示网点i必须在网点j前拜访,一个拜访任务的开启必须在上一个拜访计划完成后,即到达网点j开始拜访的时间fr(j)小于离开网点i的时间fL(i)。优选的,步骤(3)中,假设拜访动作a,在完成该拜访动作后会自动使业务员发生状态的转移,即从st转换到st+1,同时完成该拜访动作后会带来奖励,定义奖励r为拜访网点的总执行时间和拜访网点的预期目标完成情况;将该信息反馈给深度强化学习模型;根据反馈信息计算用于表示在某状态下的预期累积收益的期望的动作价值函数Q(s,a),该价值函数表示业务员和网点之间连接边的权重,即学习参数,不断更迭价值函数,求解最优匹配,进而确定最优任务执行策略。优选的,步骤(4)中,确定最优任务执行策略后,进行拜访路线规划,即根据实时路况、距离远近等周围环境因素,规划最优网点拜访顺序和路径。优选的,步骤(5)中,实际拜访过程中,实时评估业务员的位置和拜访计划完成情况,分析是否有无法完成日常规定拜访网点的风险,及时改派;日常已有网点优先拜访,再根据业务员实施拜访情况和业务员的位置,分配待开发的新店。针对地理网点的智能任务分配和人员调度系统,包括:特征提取模块,从企业信息系统决策模块的基础数据和实时数据中提取特征,包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征;深度强化学习模型构建模块,用于对业务员和拜访网点之间的关系,形成拜访计划的二分网络,同时根据地理位置关系对网点集合建立偏序关系,对历史记录和业务员拜访网点的实时数据建模,得到深度神经网络模型;任务匹配策略优化模块,用于根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度强化学习模型,更新学习参数,确定最优任务执行策略拜访路线优化模块,用于根据业务员所处环境信息,规划最优拜访路线;拜访方式确定模块,用于实际拜访过程中,将任务匹配策略优化模块中的任务执行策略优化方法以及任务匹配策略优化模块中的的拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。本专利技术与现有技术相比,具有如下优点和有益效果:(1)本专利技术针对原有人工决策业务员任务分配问题,对企业信息系统的原需要人工决策的模块中的输入和输出本文档来自技高网...

【技术保护点】
1.一种针对地理网点的智能任务分配和人员调度方法,其特征在于,步骤为:/n(1)从企业信息系统决策模块的基础数据和实时数据中提取特征,特征包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征;/n(2)对业务员和拜访网点之间的关系,形成拜访计划的二分网络,同时根据地理位置关系对网点集合建立偏序关系,对历史记录和业务员拜访网点的实时数据建模,得到深度神经网络模型;/n(3)根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度强化学习模型,更新学习参数,确定最优任务执行策略;/n(4)根据业务员所处环境信息,规划最优拜访路线;/n(5)实际拜访过程中,将步骤(3)的任务执行策略优化方法以及步骤(4)的拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。/n

【技术特征摘要】
1.一种针对地理网点的智能任务分配和人员调度方法,其特征在于,步骤为:
(1)从企业信息系统决策模块的基础数据和实时数据中提取特征,特征包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征;
(2)对业务员和拜访网点之间的关系,形成拜访计划的二分网络,同时根据地理位置关系对网点集合建立偏序关系,对历史记录和业务员拜访网点的实时数据建模,得到深度神经网络模型;
(3)根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度强化学习模型,更新学习参数,确定最优任务执行策略;
(4)根据业务员所处环境信息,规划最优拜访路线;
(5)实际拜访过程中,将步骤(3)的任务执行策略优化方法以及步骤(4)的拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。


2.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(1)中,所述待拜访网点的特征包括:拜访网点类型以及网点基本信息,所述拜访网点类型包括已有网点、潜在待开发网点、疑似假网点,所述网点信息包括经营者基础信息、地理位置、经营品类、供货方式、产品库存;所述业务员的特征包括:基础信息、业务能力、历史拜访记录、熟悉的网点和范围、熟悉的产品类目;所述拜访任务的特征包括:网点和业务员之间的交互情况,即该网点是否被业务员拜访、拜访任务的难度、拜访的预期目标;所述业务员的周边环境包括:业务员的时间和空间状态,即所处地理位置、交通状况、拜访时间。


3.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(2)中,神经网络模型的输入是状态集S和动作集A,业务员的特征和业务员周边环境表示状态集S,待拜访网点的特征和拜访任务的特征表示动作集A。


4.根据权利要求1所述的任务分配和人员调度方法,其特征在于,步骤(2)中,在建立的深度神经网络模型的过程中,用二分图来表示业务员和拜访网点之间的匹配关系,在该二分图中,将业务员和网点作为节点,业务员与网点的初始是全连接状态,在与环境的交互过程中,随着连接边上的权重不断更迭,同时,根据地理位置关系对网点...

【专利技术属性】
技术研发人员:汤胤廖冬雪黄书强
申请(专利权)人:暨南大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1