我们的方法不是直接询问司机
我们使用的数据包括计划路线顺序和司机实际执行顺序的信息,例如总时间和总距离。还包括所访问客户的具体信息,例如位置、下车量以及计划顺序与实际顺序。这些数据提供了以前从未使用过的宝贵信息,可用于深入了解司机的行为及其可能产生的经济影响。
这种方法有几个优点。首先,陈述的偏好并不总是与揭示的偏好相匹配。此外,通过创建分析方法,我们可以创建更具可扩展性的解决方案。通过我们的方法,我们建立了可以在任何具有所需数据的最后一英里交付操作中复制的模型。
模型和见解
我们的框架有两个模型。一个模型预测二元变量偏差,重点在于了解导致偏差的原因。如果驾驶员 象牙海岸电子邮件列表 遵循某条路线,则偏差为 0,否则为 1。第二个模型预测直线距离偏差,重点在于预测偏离路线对距离的影响。使用回归分析和两种分类方法(神经网络和随机森林)对每个模型进行了研究。
我们发现,在墨西哥,近一半的研究路线存在偏差,在美国,五分之四的路线都存在偏差。在这种环境下,遵循计划的顺序不太可能得到强制或监管,顺序更有可能基于驾驶员的决定。
不过,我们能够预见到这些问题。利用描述路线的环境变量,可以预测司机偏离计划的决定,准确率在墨西哥为 71%,在美国为 84%。
这项研究还提供了有关司机行为的一些有用见解。例如,当拜访更多的客户时,司机更有可能偏离路线并增加路线距离。这一观察结果表明,改进送货计划的努力应该集中在这些路线上。此外,客户的地理位置(反映在所涉及的邮政编码中)对于预测偏差非常有用。